【東芝】教師なしで複雑な画像の特徴を学習してグループ化する画像分類AIを開発

株式会社　東芝
2021年04月28日
13：56

世界トップレベルの分類精度で製造現場の外観検査等において類似した画像を自動分類し、不良検知の分析時間短縮に貢献

概要
　当社は、製造現場における外観検査による不良検知向けに、教師なし（分類基準のラベルづけ作業なし）で高精度に画像をグループ化する画像分類AIを開発しました。独自の深層学習技術により、様々な背景の中で撮影された一般画像の公開データ(*1)において、分類精度を従来技術(*2)の71.0％から95.4％に向上し、世界トップレベルの分類精度を達成しました。本技術を用いることで、製造現場で撮影される外観画像において、例えば、検査対象以外の物が背景に映りこんでいるような複雑な画像でも、製品の不良や欠陥を教師なしで高精度に分類することが可能です。当社は、本技術の詳細を5月3日から7日にかけてオンラインで開催される国際会議ICLR2021 (International Conference on Learning Representation)で発表します(*3)。

開発の背景
　近年、AIにより製品の外観画像を分類することで、不良や欠陥の発生状況を早期に把握し、生産性を向上する取り組みが広がっています。AIで外観画像を分類する手法として、事前に分類基準を人手でラベル付けする教師あり学習と、分類基準の設定や教示用のデータを必要としない教師なし学習があります。製造現場における外観検査では、分類基準を学習するための人手による作業が不要で、導入・運用コストが低い教師なし学習による分析が期待されています。
一方で、従来の教師なし学習では、AIが不良や欠陥の特徴を十分に学習できず、分類精度が低下する場合があります。特に外観検査における画像では、付着したダストやキズといった着目したい不良や欠陥に対して、それ以外の背景領域が大部分を占めます。そのため、背景に含まれる特徴も学習してしまい、本来着目したい不良や欠陥の分類精度が低下する問題がありました。

本技術の特徴
　そこで当社は、教師なしで、画像の背景にとらわれることなく画像の特徴を学習し、高精度に画像を分類するAI技術を開発しました。独自の深層学習方法により、画像に含まれる多くの特徴から分類に有効な特徴を抽出することで、不要な特徴の影響を受けない高精度な分類を実現しました（図１）。本技術は、まず、人手による分類基準のラベルではなく、1枚の画像を1つの分類基準とする疑似的な教師あり学習を行うことで、多くの画像に表れる背景のような部分ではなく、一部の画像に表れる不良や欠陥に着目して特徴を抽出します。さらに、抽出する特徴が重複しないような独自の学習基準を設定することにより、画像に含まれる多くの特徴から類似した不良や欠陥をグループ化するのに有効な特徴量（特徴を数値化したもの）の作成を実現しています。
本AIを使用し、世界共通の一般画像の公開データの分類を行ったところ、分類精度が従来の71.0％から95.4％に改善し、世界トップレベルの性能を達成しました。図2のように、背景が全く異なる画像を同一グループに分類できます。
当社は、今後、本AIを製造現場における様々な検査工程・製品に適用し、性能実証を行ってまいります。また、当社グループの製造現場で培った実績をもとに、東芝デジタルソリューションズ株式会社の製造業向けソリューション「Meisterシリーズ」への展開を進めて参ります。

図1　特徴量抽出による分類（*3）

図2　IDFDによる分類結果(*3)の例：様々な背景の猫の画像を同一グルーブに分類

*1　ImageNet-10：AIの性能検証で使用される代表的なデータセット。
犬、猫など10種類の対象を含む一般画像。
DENG, Jia, et al. Imagenet: A large-scale hierarchical image database. In: 2009 IEEE conference on computer vision and pattern recognition. IEEE, 2009. p. 248-255.

*2　Wu, Jianlong, et al. "Deep comprehensive correlation mining for image clustering." Proceedings of the IEEE/CVF International Conference on Computer Vision. 2019.

*3　Yaling, Tao et al., “Clustering-friendly Representation Learning via Instance Discrimination and Feature Decorrelation”, https://openreview.net/pdf?id=e12NDM7wkEY

*4　公開データCIFAR-10の結果。CIFAR-10はAIの性能検証で使用される代表的なデータセット。
犬、猫など10種類の対象を含む一般画像。
Krizhevsky, Alex, and Geoffrey Hinton. "Learning multiple layers of features from tiny images." (2009): 7.