2020年東京オリンピック・パラリンピック大会まであと1年少々(しょうしょう)となりました。ボランティアで通訳(つうやく)や誘導(ゆうどう)の活動をしようと名乗り出て(なのりでて)いる人もたくさんいますが、やはりそれだけでは足りません。そこで期待されているのが、自動で通訳してくれる「音声翻訳(おんせいほんやく)アプリ」。今回はこの音声翻訳アプリについてまとめてみました。
日本語と英語で、よんでみよう!
もっとくわしく!
今回の会話に登場した情報通信研究機構(NICT)は、情報通信分野を専門とする唯一の公的研究機関です。2018年11月の発表によると、NICTが開発した多言語翻訳エンジンで翻訳できる言語は31言語。スペイン語、フランス語、タイ語、インドネシア語、ベトナム語、ミャンマー語の旅行会話の翻訳精度が英語、中国語、韓国語と同等レベルにまで達しています。
英語、中国語、韓国語については、旅行会話以外にも合計約8万語の用語に対応しています。特に重視されたのは、全国の駅名(英・中・韓)、医療関連の表現(英)、地震用語(英・中・韓)、サッカー用語(英・中)などです。
総務省による「グローバルコミュニケーション計画」の実現に向けて、企業と協力しながら精度向上のための研究開発と社会実証を進める役割をしています。
音声翻訳の仕組みを簡単に言えば、音声を認識→元の言語で文章に起こす→機械翻訳で目的の言語の文章にする→それを音声で読み上げる、という流れになっています。
単語だけ、短い文だけなら皆さんのスマートフォンでも実はもうできるのですが、現在の研究では、連続した会話を翻訳する技術が進んでいます。音声認識と機械翻訳を同時に実行して、まるで同時通訳のように音声翻訳できるようになってきているのです。
音声認識や音声合成の技術は、以前からカーナビなどで実用化されていて、日本が得意とする分野です。音声翻訳アプリに応用するため、例えば騒がしい環境でも人の音声を判別したり、端末の前にいる人たちがそれぞれどの言語を話すのか認識して、日本語から外国語へ、外国語から日本語へ自動で切り替えたりする技術が開発されています。
NICTは、民間企業にも音声翻訳アプリ・サービスを試作できる環境を開放していることが特徴です。最近、ユニークなTVコマーシャルでもおなじみの「ポケトーク」という音声翻訳機がありますが、そこに搭載されている一部言語の翻訳にも、NICTのエンジンが使われています。
NICTの翻訳エンジンには、ディープラーニングをはじめとするAI技術が導入されています。データが集積されればされるほど、翻訳精度が上がる仕組みで、「育てながら利用する」ことが特色になっています。
音声翻訳アプリが「夢の通訳機」に近付くためには、満足の行く翻訳結果が得られるまで根気よく使って育てる、というみんなの努力が必要ということですね。