〔2023/1/20〕NTTテクノクロス、音声合成ソリューションに話者の声質を損なわずに多言語の合成音声を実現するクロスリンガル音声合成技術を搭載
NTTテクノクロス(本社:東京都港区、桑名栄二社長)は、音声合成ソリューション「FutureVoice Crayon」に話者の声質を損なわずに多言語の合成音声を実現するクロスリンガル音声合成技術を搭載し、提供を開始した。なお、同技術の商用提供は国内初となる。
人の音声を機械的に生成する音声合成技術は、コールセンターをはじめ公共交通機関やスマートスピーカーなどに幅広く活用されている。それらを背景に、合成音声の多言語展開のニーズが高まっている中、多言語の合成音声を生成するには、言語ごとの音声収録だけでなく、その前提として多言語を話せる話者を選出する必要があるなどの課題があり、実際の展開は難しいものであった。
この度、NTT人間情報研究所が開発したクロスリンガル音声合成技術を「FutureVoice Crayon」に搭載することにより、話者の声質を損なわずに一言語の音声から多言語の合成音声を生成できるようになった。
NTT人間情報研究所が長年蓄積した膨大な音声データとDNN音声合成のノウハウを活用し、一言語の音声から日本語、英語、標準中国語、韓国語の合成音声の生成を実現した(2023年1月時点)。これにより、キャラクターなどの特定の声質を損なうことなく、吹き替えを多言語で展開することができるなど、さまざまなシーンでの活用が図れる。