2025.07.30 Work

RAGスマートスピーカー及びGUIチャットBOTの実力を検証

株式会社アプリズムは、
バスガイドの代わりに「AIが観光案内をする」そんな未来を現実に近づけるために、RAG(Retrieval-Augmented Generation)技術を搭載したスマートスピーカーとGUIチャットBOTを開発しており、その実用性を検証しました。

※RAGとは
「検索(Retrieval)」と「生成(Generation)」を組み合わせた手法で、あらかじめ用意された文書情報を検索して、生成AIの回答に組み込むことで、精度と一貫性を向上させる技術です。

図1:システム構成図(スマートスピーカー+GUIチャットBOT)

開発されたシステムの構成図を図1に示します。本システムは、音声入出力を備えたスマートスピーカーと、ブラウザベースで対話可能なGUIチャットBOTを組み合わせたRAG対応システムとなっています。ユーザーは音声またはテキストを通じて質問を行い、アップロードされたPDFファイルに基づく情報を取得できます。

このシステムにおいて、
―日本語での基本応答性能
―RAGによる文書ベースの回答精度
―応答時間の評価(リアルタイム性)
についての調査を行いました。結果については以下のとおりです。

〇日本語での音声応答
英語固有名詞がアルファベット読みになるなど少々難点はあるものの、日常会話は正常に応答できることが確認できました。

〇RAGによる文書ベースの回答精度
現在のところ、アップロードできる文章は英語に限定されているため、RAGによる質疑応答は英語のみになります。文章に関する質問に対して、文章内に明示された情報がある場合、ほぼ正確に応答しますが、文脈から推測が必要なものは誤答もあることが確認されました。

〇応答時間
システムの応答時間はスマートスピーカーでおよそ20~30秒、GUIチャットBOTでおよそ40~60秒ほどでした。

このように、スマートスピーカーとGUIチャットBOTを活用し、日本語での音声応答や文書ベースの質疑応答がローカル環境でも実現可能であることを確認しました。特に、RAG技術によってより専門性の高い知識を参照できる機能は、既存のAI応答を大きく進歩させることができます。日本語RAGへの対応や応答スピードといった課題は残るものの、限られたリソース環境下でここまでの応答が可能である点は大きな成果です。

株式会社アプリズムでは、今後の改良を通じて、現場で即応感な次世代AIアシスタントの実装を目指してまいります。

#アプリズム #AI #生成AI #RAG #LLM
#ローカルLLM #ローカル生成AI #エッジ生成AI
#AIエージェント #機械学習 #深層学習
#OD調査 #喫煙検知 #属性推定 #国籍推定
#B-RIO #aiba