2025.12.01 AIP

画像認識AIを用いたラベル位置検査システムの開発

株式会社アプリズムでは、エッジデバイスで動くリアルタイムでの物体検出に取り組んでおります。(エッジ生成AI)。

今回エッジデバイス上で生成AIを用いた物体検出を実現させることができましたので、その取り組みと成果についてご報告致します。

■背景
お酒や飲料の製造ラインで発生する「ラベルのずれ」の検査は、自動化が難しい課題であり、生産効率・品質の安定性に大きく影響します。株式会社アプリズムでは、AIを活用したラベルのずれ検査システムの開発にむけて、実証実験を行いました。

■利用モデル
モデルはCLIPとDINOv2の2つを使用しました。それぞれの特徴は以下の通りです。

■実験手法
実験手法として、まず正解となる位置にシールを貼ったマグカップの画像を、角度を変えるなどして数枚用意しました。これらの参照画像から、それぞれのモデルを用いて特徴量を求めます。そして、Raspberry Pi※に接続されたカメラに撮影した映像(今回は同じマグカップでシールの位置を変えた画像)からも特徴量を求め、これら2つ比較しました。参照画像と一致する画像を「正解」、シールの位置を変えた画像を「不正解」とし、各画像の類似度を評価することで、ずれの検出精度を確認しました。
※低価格で小型のシングルボードコンピュータ

実験では、CLIP, DINOv2のそれぞれに対して、正解の画像を1枚、不正解の画像を3枚用意しました。結果は以下のとおりです。

正解画像の撮影時(CLIP)     

不正解画像の撮影時(CLIP)

正解画像の撮影時(DINOv2)

不正解画像の撮影時(DINOv2)

〇CLIP(2021年にOpenAIが発表したマルチモーダルの基盤モデル)

〇DINOv2(2023年4月にMetaより公開された、自己教師あり学習によるコンピュータビジョン(CV)モデル)

CLIPでは、正解画像と不正解画像の類似度の差は小さいものの、正解ラベルの検出に成功しました。また、推論はほぼタイムラグなしで行われているという特徴も確認できました。一方、DINOv2では約5秒のタイムラグがあるものの、正解画像と不正解画像の類似度の差が明確であり、こちらも正解ラベルの検出に成功しました。

■まとめ
2つのモデルを試した結果、速度と類似度においてそれぞれ長所と短所が見られましたが、ラベルずれの検出の機能が十分にあることを確認でました。このラベルずれ検知は「人の作業を効率化し、製品の品質を安定させる」という目的に向けた第一歩です。アプリズムでは、AI開発を通じて、さまざまなシーンでのソリューションを提供してまいります。

■終わりに
アプリズムでは「最先端技術で未来を創造する」経営理念に共感し、共に新しい技術プロダクトの開発に取り組んでいく技術者を募集しています。ご興味がある方はぜひお問い合わせください。

URL:https://www.apprhythm.co.jp/

【本件に関する問い合わせ先】
株式会社アプリズム AIプロダクト本部
〒542-0081 大阪府大阪市中央区南船場2丁目9-8
シマノ・住友生命ビル1階(総合受付)・2階
Tel:06-4708-8959 Email:aisol@apprhythm.co.jp

◆ご紹介◆

#アプリズム #AI #生成AI #RAG #LLM
#ローカルLLM #ローカル生成AI #エッジ生成AI
#AIエージェント #機械学習 #深層学習
#喫煙検知 #属性推定 #国籍推定
#B-RIO #OD調査 #ルート最適化
#aiba #馬の異常検知
#AI駆動開発
#Splunk
#フィジカルAI
#マルチモーダル生成AI