〔2025/3/6〕ヘッドウォータース、「GPT-4o Realtime API」を活用したAIエージェント「Agentic Voice RAG」サービス開始
AIソリューション事業を手掛けるヘッドウォータースは、音声対話ソリューションのサービスラインナップに、「GPT-4o Realtime API」を活用したAgentic Voice RAGを追加したことを発表した。
これにより、生成AIとリアルタイムに音声対話するソリューションに企業独自のナレッジを追加するAgentic RAGシステムの構築サービスと、AIエージェントが自律的にタスクを実行するAgentic Workflowを強化する。
ヘッドウォータースでは、以前よりMicrosoft Azureを活用した音声認識や自然言語認識、クラウドコンピューティングとヘッドウォータースの技術力を活かしたAIシステムを企業向けに提供してきた。
また2015年よりコミュニケーションロボットを活用した「音声対話機能」、2018年からはスマートスピーカーによる「音声UI」に取り組み、「音声によるQ&A」、「音声認識×IoT」、「音声UI×システム開発」に関する多くのナレッジとコンポーネントを蓄積している。
加えて、ヘッドウォータースが提供するRAGは90%を超える精度を実現しており、各企業の生成AIを活用したサービスに複数導入されている。
今回、GPT-4o Realtime APIを活用し、生成AIとの音声対話を日常の対話と同じスピードで回答する「リアルタイムスピーチ」にAgentic RAGを統合することで、「生成AIリアルタイム音声対話×企業独自ナレッジを付与した根拠のある応答」のAIエージェントを提供することが可能となった。
これによりヘッドウォータースが提供する音声対話コンタクトセンターソリューション、デジタルヒューマンソリューション、対話型ロボティクスソリューション、車載エッジAIソリューションを進化させ、人との対話のような自然な生成AI体験だけでなく、AIエージェントにタスクを自動実行させるソリューションを実現していく。
ヘッドウォータースは、リアルタイム音声対話AIをあらゆるプラットフォームに適用可能であると考えている。今後は、人と同じ自然な会話速度の利便性とUXを追求し、合わせてXRスマートグラスや未来型UXアプリ、エッジ端末やモバイルデバイス、Microsoft Teams上で稼働するソリューションの展開を行い、一般消費者が当たり前のように生成AIを使うことができる社会の実現に貢献していく。