製造業でのAI実装に特化した東大発ベンチャー【Airion株式会社】は、【トヨタ自動車株式会社未来創生センター】が開発するパートナーロボット”トミーくん”に搭載する音声合成AIを開発いたしました。
■”トミーくん”とは?
“トミーくん”とは、トヨタ自動車の中にある研究部署『未来創生センター』が開発するコミュニケーションロボットです。トミーくんは、身振り手振り等の動きによるジェスチャー、目の部分のディスプレイを用いた表情の変化、音声による会話などで人間とコミュニケーションすることができます。
今回、Airionではこの”トミーくん”に実装するための音声合成AI開発に取り組みました。具体的には、トミーくんに話しかけられた声を認識し、自然言語処理AIが応答内容を考え、その内容を音声合成AIにより富川悠太キャスター(トヨタ自動車株式会社所属)の声で応答するシステムを開発しました。
■Airionが開発した内容
今回の音声合成AIの用途が「富川アナウンサーの声を模した会話」であることを考慮し、以下3点にフォーカスして開発を行いました。
①専門用語への対応
トミーくんは今後、「トヨタ会館」来場者への案内などトヨタ自動車に関する会話をすることが想定されます。その際には一般的ではない専門用語、例えば「トヨタ自動車」「未来創生センター」「トミーくん」などの固有名詞を正確に発話する必要があります。
上記を解決するため、システム外部から新たに専門用語やその読み方・アクセントを登録できる機能を搭載し、専門用語を含む内容の説明もできる仕様を実現しました。
②イントネーションの正確性向上
近年のAI技術の進歩により、特定の人物の声質で音声合成を行うことは手軽に出来るようになりつつありますが、イントネーションを正しくコントロールする点ではまだまだ発展途上です。特に専門用語などを含む場合には、単語のイントネーションを正しく指定しAIに忠実に再現させる必要があります。
今回は富川キャスターにも協力いただき、学習コーパス、収録環境、発話スタイルなどを試行錯誤することで、品質の高い学習データを作りイントネーションの正確性向上を試みました。
③会話応答の高速化
自然な音声対話において非常に重要な要素の一つが「応答速度」です。トミーくんが声を掛けられてから応答を始めるまでに1秒以上かかると、会話としてかなり遅い印象を与えてしまいます。
上記を緩和するため、今回は推論速度に優れた音声合成モデルの選定を実施し、人間が話しかけてから応答するまでにかかる時間の短縮を図りました。
■今後の展望
Airionでは、音声合成以外にも製造業における様々なAIソリューションを開発しております。
製品開発、設計、調達、製造などあらゆる部門でのAI実装を行なっておりますので、「AIを活用して新製品を開発したい」「AIで既存業務を効率化したい」などがございましたらHPよりお気軽にご相談ください。
なお、トミーくんについては今後、トヨタ会館(愛知県豊田市)にて展示されることが予定されております。
■会社概要
Airion株式会社
会社名:Airion株式会社
本社:東京都文京区本郷3-28-10 柏屋ビル2
設立:2021年4月
代表:河村 拓実, 大熊 拓海