画像内容の対話型説明に成功、エクサウィザーズの新AIモデル「exaBase Visual QA」

2023年9月21日2023年9月22日

　エクサウィザーズは、画像の内容を基にその状況を対話型で説明する生成AIモデル「exaBase Visual QA」を開発したことを発表した。この新しいモデルは、一般的な生成AIモデルと比較して、画像内の危険性や状況を高精度に解釈し、説明文を生成する能力を持つ。

　エクサウィザーズは、AIの活用を通じて、サービスやプロダクトの提供を行い、生産性の向上や社会課題の解決を目指している。今回の「exaBase Visual QA」は、特に複雑な画像の危険性や内容を的確に文字情報として出力するのが難しいとされる問題に対応するためのものだ。

　このモデルは、人が画像を見た際にどこに注目するのかを学習し、その結果、人が直感的に認識可能な画像内の状況を高精度で解釈することができるようになった。例えば、特定の画像に「潜在的な危険性はありますか」との質問を投げかけると、「作業員がバランスを崩したり足場が崩れたりすると落下につながる。作業員は金属棒を接続するために電動工具を使用しており、工具が滑ると負傷する可能性がある。適切な安全予防措置を講じるべきである」といった説明文を生成する。