今年5月に発表されたSkype Translator は、異なる言語間の音声会話やテキストチャットをほぼリアルタイムに通訳/翻訳するSkype の機能。今回のプレビューでは音声通訳が英語とスペイン語に、テキスト翻訳が40以上の言語に対応します。
Skype Translator は:
- 自動会話認識
- 会話修正
- 翻訳
- 文書の音声化
- 利用と学習
というステップで通訳/翻訳するとともに機械学習によって進化してゆきます。
各ステップの内容を簡単に説明すると、まず1ではニューラルネットワークに保存された数百万の音声サンプルを元に、発話者の言葉を解析して候補をテキスト化します。
2では発話者の言葉から「んー」「あー」といった不要な部分を取り除き、候補の中から最も似た発音のテキストを選択。3では2で選んだテキストを相手の言語に翻訳し、4で音声化して再生します。
また5ではユーザの会話やテキストチャットからの機械学習、ユーザからのフィードバック、人力での修正によって精度を向上します。
変換精度については、アメリカとメキシコの小学校が舞台の公式動画を観る限りでは、単純な会話であればかなり正確に変換できるようです。
一方で変換速度について、マイクロソフトはSkype Translator 発表時に「リアルタイム」としていましたが、動画ではそれなりの間があいています。これについてSkype はブログで「人間の通訳を介した程度」の時間がかかることを認め、人によっては慣れるまでに時間が必要だろうと述べています。
進化の余地は多々ありますが、Skype は今回のプレビューを「世界の人々とのコミュニケーションを変える旅の始まりに過ぎない」とし、今後は「可能な限り多くの言語とプラットフォームに対応すること」を目標に開発を続けるとしています。
なお日本では、日本語を軸とした機械翻訳技術の開発とサービス提供の「株式会社みらい翻訳」がドコモなど3社によって設立されます。同社は東京オリンピック/パラリンピックが開催される2020年までに「言語バリアフリー」の実現を目指すとしています。