【東芝】たった1枚の画像を登録するだけで手間なく即座に新しい物体を世界最高精度で検出する画像認識AI「Few-shot物体検出AI」を開発
株式会社 東芝
たった1枚の画像を登録するだけで手間なく即座に
新しい物体を世界最高精度で検出する画像認識AI「Few-shot物体検出AI」を開発
~導入・運用しやすいAIで、多数の部品や設備を扱う工場やプラントのデータ化とDX推進に貢献~
概要
当社は、製造現場や流通現場で取り扱う製品や部品の変更が発生しても、新規物体の画像を1枚登録するだけで即座に世界最高精度で検出する画像認識AI「Few-shot物体検出AI」を開発しました。本AIは、新製品や改良品等で扱う製品や部品が定期的に変更になる工場や、常に新規商品への対応が求められる物流現場など頻繁に新しい物体が登場する現場での活用が期待されます。
現場からセンシングしたデータを価値ある情報に変換し、現場にフィードバックすることで、現場における生産性・品質・作業効率の向上につなげる取り組みは世界規模で進められています。特に、画像から人や物体を検出する画像認識AIは、生産性の改善や自動化・省力化のための解析に基盤的に使われる重要な技術です。しかし、画像認識AIを用いて現場ニーズに応じた物体を新たに検出するためには、都度、大量の画像を準備し学習させる必要があり、その手間が課題でした。
今般当社が開発した「Few-shot物体検出AI」は、画像に映る学習対象以外の任意の物体の形状を自動的に学習する当社独自の仕組みを導入し事前に学習しておくことで、現場での再学習が不要で、画像を1枚登録するだけで新規物体を検出することができます。当社技術は公開データセット(*1)を用いた検出精度の評価において、世界トップ精度を実現しています(*2)。
本技術により、再学習のための手間や時間が障壁となりAI導入が見送られてきた、多数の部品や設備を扱う工場やプラントにおいても、導入・運用しやすい「Few-shot物体検出AI」により現場のデータ化・デジタル化に貢献し、DXによる生産性・品質・作業効率の向上を推進します。
当社は本技術の詳細を、2022年5月25日に開催されるコンピュータビジョンの国際会議ICIAP2021(21st International Conference on Image Analysis and Processing)で発表します。
開発の背景
AIビジネスは今後も拡大していくことが見込まれており、国内市場は2025年には2020年度比約2倍の1兆9,357億円になる予測です(*3)。中でも、画像認識AIは、人の行動や周辺環境の認識に必要不可欠な技術として、製造現場における品質・生産性向上、社会インフラの現場における保守点検作業の効率化、物流・流通現場における業務効率化など、多種多様な分野で実利用が進んでいます。
当社グループでも、インフラ事業における豊富な知見と実績を生かしたインフラサービスを支える技術として活用が進んでいますが、実際の現場では、AI導入時には存在しなかった新しい物体が登場する場面が多くあります。例えば、長期間運用中に新規の部品や製品を扱う場合や、別の製品や部品を扱う新設工場に適応する場合、AIが未学習の物体を新たに追加し解析対象とすることが求められます。
新規物体の検出には、通常、AIの再学習を行います(以下、再学習型)が、現場で、大量の画像・映像と正解情報を用意する必要があることに加え、学習の時間が長くかかるため、頻繁に新規物体が登場するような現場での活用は困難でした。一方で、再学習が不要な方式(以下、登録型)を採用すると、実用化レベルの検出精度が実現できない課題がありました。
本技術の特長
そこで当社は、未学習の物体の画像をたった1枚用意し登録するだけで、AIの再学習を行うことなく即座に新規物体の検出を可能にする「Few-shot物体検出AI」を開発しました。
通常AIは対象となる「正解」が付与された物体以外は「背景」として扱い、画像から対象物体が映る領域を物体候補として抽出する深層モデルを学習します。今般当社は、付与された「正解」以外の背景として扱っていた物体を含めて自動的に学習する新たな方式を開発しました(図1)。更に開発した方式で事前に学習した深層モデルを用いることで、従来であれば背景と認識していた部分から自動で抽出される物体候補と、登録した新規物体とを比較し、画像から新規物体を検出する「Few-shot物体検出AI」を確立しました(図2)。本AIを用いることで、新たに検出したい対象の画像1枚を登録するだけで、即座に検出することが可能になります(図3)。
また、今回開発したAIと同様に、深層モデルの再学習を必要としない登録型の従来方式(*4)の検出精度21.2%と比較して、当社方式では検出精度が46.0%へと大幅に向上し、再学習不要な登録型において世界最高精度を達成しました(*2)。
図1 従来の再学習型との学習の違い
図2 「Few-shot物体検出AI」による物体検出
図3 従来の登録型との認識精度の違いの例
今後の展望
「Few-shot物体検出AI」の開発により、これまで導入が見送られていた現場においても、画像認識AIの導入や運用が容易になります。DXの推進に貢献し、多種多様な現場での生産性・品質・作業効率の向上が期待できます。
当社は今後、本技術を早期の社会実装に向けて2023年度中の製品化を目指し、当社グループの製品およびサービスへ広く活用してまいります。
*1 公開データセット The PASCAL Visual Object Classes Challenge
http://host.robots.ox.ac.uk/pascal/VOC/voc2007/index.html
*2 当社調べ 2022年2月時点
*3 AIビジネスの国内市場
オートメーション新聞 https://www.automation-news.jp/2021/07/57280/
*4 Qi Fan, et al. , Few-Shot Object Detection with Attention-RPN and Multi-Relation Detector, Conference on Computer Vision and Pattern Recognition, 2020.