〔2025/5/17〕エーアイスクエア、生成要約サービス「QuickSummary2.0」に音声ファイルアップロード機能を追加
エーアイスクエア(本社:東京都港区、堀友彦社長)は、生成要約サービス「QuickSummary2.0」の新機能として、音声ファイルのアップロードによる音声文字起こし機能を追加したことを発表した。
生成要約サービス「QuickSummary2.0」は、2023年6月のリリース以降、多くのコンタクトセンターに本番導入され、後処理時間の削減やFAQの整備、VOCの分析などに活用されている。
これまでは、利用中のPBXや通話録音システムと接続し、音声ファイルや音声データを連携することで文字起こしから要約までを一気通貫で提供してきたが、システム連携を前提とせず、ライトに音声認識・要約を行いたいという声も多くあった。
要望を受け、この度、音声ファイルをアップロードすることでエーアイスクエアが提供する音声認識サービス「AI2ASR」で音声の文字起こしを行い、要約まで実施できる機能を提供することにした。
音声ファイルのアップロード機能について 「QuickSummary2.0」の画面から音声ファイルをアップロードし、文字起こしを行うことができる。対応可能なファイル形式はwav、mp3、opus、oggで、ファイルサイズは250MBまで。また、ステレオ形式の音声をアップロードすることで、顧客とオペレータの発言を識別した状態で文字起こしされる。
音声認識サービス「AI2ASR」は、90%を超える高い認識精度と低コストを両立した音声認識ソリューション。OpenAIが提供する「Whisper」をコンタクトセンター向けにカスタマイズOpenAI社の提供する音声認識モデル「Whisper」をコールセンターでの利用に合わせてカスタマイズして提供している。Whisperは68万時間分の大量の教師データを学習しているため、高い精度でテキスト化が可能。専門用語辞書を用いた独自の誤変換補正機能辞書登録を行うことで自社開発のAIが文脈を判断してWhisperのテキスト化の結果を補正する。Whisper単独ではカバーできない、専門用語への対応も行うことができる。