音声AI分野で世界をリードするiFLYTEK(アイフライテック)から、2023年10月、音声翻訳機「Smart Translator」が発売された。本機は、同社が誇る世界最高峰※の音声翻訳エンジンを搭載しているうえ、高度なノイズ除去技術によって騒音の多い場所でもストレスを感じることなく使用できる高性能なモデルだ。今回は、そんな本機を、複数の言語を操るマルチリンガルとともに徹底検証した。 ※ 国際的な機械翻訳コンテストIWSLT 2022年 2言語で第1位
Check1技術力各種の機械翻訳コンテストで優勝!
高いAI技術を誇るiFLYTEK
1999年に大学の研究室のスタートアップとして創業以来、「人工知能でよりよい世界を創造する」というビジョンのもと、音声認識や、音声合成、自然言語理解、機械推論、適応学習などを研究し、これらの分野で世界屈指の技術力を誇る、iFLYTEK。そのすぐれた技術をベースに、企業向けのAIソリューションや消費者向けのAI製品を世界展開し、トップランナーとして業界を牽引する存在となっている。

AI分野で世界有数の技術力を持つiFLYTEK。その時価総額は2.5兆円規模(2023年11月時点)に及ぶ巨大企業だ。日本市場では2020年に翻訳機の販売を、2021年にオートモーティブ事業の展開をスタートしている
なかでも、音声AI分野では、2016〜2023年の間、音声認識技術を競う国際コンテスト「CHiME」(隔年開催)において4回連続で世界1位を受賞。さらに、音声合成技術の国際コンテストでは14年連続1位を獲得したほか、話し言葉翻訳の国際コンペティション「IWSLT」では2021年に同時通訳ベンチマークタスクで優勝するなど、世界をリード。今年開催された「ブダペスト2023世界陸上競技選手権大会」においては、アスリートやボランティアのコミュニケーションをサポートする公式イベントサプライヤーを務めるなど、同社の機械翻訳の技術は国際的に高い評価を受けている。
そんなiFLYTEKが誇る音声翻訳や音声認識などの技術を結集して作られたのが、今回紹介する「Smart Translator」だ。ワールドクラスとも言えるその実力を、次章以降でチェックしていこう。
2006〜2019年 | 音声合成技術の国際コンテンストで14年連続1位を獲得 |
---|---|
2016〜2023年 | 音声認識技術を競う国際コンテスト「CHiME」で4回連続No.1を獲得 |
2018年 | OCR国際コンテンスト「ICPR」で文字検出/文字認識/end-to-end検出認識の3項目で1位(優勝) |
2021年 | 話者分離技術の国際コンペティション「DIHARD3」で世界1位の性能評価を獲得 |
2021年 | 話し言葉翻訳の国際コンペティション「IWSLT」の同時通訳ベンチマークタスクで1位(優勝) |
2022年 | 世界最高峰のAIチャレンジ「Open Graph Benchmark(OGB) ナレッジグラフ」で1位を獲得 |
Check2翻訳力世界最高峰※の音声翻訳エンジンが
いつでもどこでも使える

自分の音声や相手の音声を認識し、日本語を外国語へ、あるいは外国語を日本語へと翻訳してくれる音声翻訳機「Smart Translator」。海外旅行や海外出張などで役立つだけでなく、インバウンドの訪日旅行者とのコミュニケーションツールとしても活躍が期待される
iFLYTEKの音声翻訳機「Smart Translator」の最大のトピックは、同社が誇るAI音声技術が注ぎ込まれた、世界最高峰※の音声翻訳エンジンを搭載していることにある。そこで、翻訳精度を確認するため、今回は、日本語はもちろん、英語やロシア語など複数の言語を操るマルチリンガルの外国人留学生に協力いただき、海外旅行でよく使うフレーズなどの翻訳精度を確かめてみた。
結果から言うと、英語はもちろん、ロシア語も「とてもうまく翻訳できています!」と外国人留学生も太鼓判。細かな言い回しなどのニュアンスもかなり上手に表現できているとのことで、これがあれば、海外旅行に出かける場合でも、インバウンドの訪日旅行者に話しかけられた場合でも安心だ。
「どのフレーズもうまく翻訳できています」との高評価。長め会話もうまく認識し、高精度に翻訳できている点にも注目してほしい
音声翻訳機が使用されるシーンは、騒がしい人混みや店頭になることも多いもの。音声翻訳機にとって、騒音の多い環境は過酷な環境であり、翻訳精度だけでなく、音声認識の精度の高さも求められてくる。
その点、「Smart Translator」なら安心。音声認識の国際コンテストで4回連続、世界1位を受賞するという、確かな実績を持つノイズ除去技術を搭載しているうえ、マイクには高性能な4つのマイクアレイを採用。周囲が騒々しくても話者が発した音声をしっかりと拾って、高精度に発話を認識する。にぎやかな街に出てテストしてみたが、翻訳に問題はなし。奇しくも頭上ではヘリコプターが飛んでいたが、それも何のその。「Smart Translator」は室内で使用しているときと変わらない精度で音声を認識し、翻訳してくれた。
本体上部に高性能な4つのマイクアレイを搭載し、騒音の多い場所でもマイクを向けるとしっかりと音声を集音。ソフトウェアの面でも音声認識の国際コンテストで4回連続、世界1位を受賞するiFLYTEKの技術が生きている
「Smart Translator」は、英語や中国語などの主要言語をはじめ、世界60言語に対応(オンライン時)。また、オフライン翻訳機能も備えており、言語パックを事前にダウンロードしておくことで、日本語については英語と中国語の翻訳が行える。もちろん、オフライン時の翻訳精度はオンライン時と変わりがないという
音声翻訳だけじゃない、
「Smart Translator」の便利な機能
「Smart Translator」は、音声翻訳だけでなく、撮影した写真上の単語や文章を翻訳するカメラ翻訳機能も備えている。写真内のすべての外国語を翻訳してレイアウトを崩さずに表示する「全画面翻訳」と、指でなぞった部分を翻訳する「なぞり翻訳」の2モードが用意されており、レストランのメニューを一覧で見たい場合は「全画面翻訳」で、雑誌のいち部分だけを確認したい場合は「なぞり翻訳」で、などシーンによって使い分けられる。
Check3使い勝手しゃべる、翻訳するの動作が自然な
「タッチフリー翻訳」
外国人に突然話しかけられたときや、海外旅行先で困ったときなど、とっさの場面で頼りにしたい翻訳機。精度ばかりではなく、簡単・手軽に使えることも重要だ。
「Smart Translator」はその点にも抜かりがない。内蔵されたジャイロセンサーや加速センサーなどが、口元にマイクを向ける動作を検知して、音声翻訳が可能になる「タッチフリー翻訳」に対応。マイクを口元に近づけて発話すれば、音声を認識。伝えたい相手に画面を向けると、音声翻訳を始めるとともに、翻訳した文章を画面にテキスト表示してくれる。一連の自然な動作の中で使えるので、“もう一度”ということもなく、円滑なコミュニケーションが行えた。
「タッチフリー翻訳」を使用したイメージ動画。口元にマイクを向け、手首を返す自然な動作で翻訳機能が使える。これなら、とっさの場面でも使いやすい。スマートフォンの翻訳アプリも便利だが、ロックを解除して、アプリを起動して……では、とっさの場面であたふたしてしまうが、本機ならそんなことはない
携帯しやすく、操作しやすいボディ
「Smart Translator」は、本体サイズが56.5(幅)×10.4(奥行)×140.6(高さ)mm、重さが129.5gと、一般的なスマートフォンよりもひと回りコンパクトで軽量。ポケットにスッと収まり、使いたいときにサッと取り出せるサイズ感だ。それでいて正面には5.05インチの大画面ディスプレイを備えているので、翻訳結果のテキストやアイコンが大きく表示されてわかりやすい。その使用感覚はスマートフォンさながらだ。
まとめ自分専用の通訳が隣にいてくれるような、
安心感の高い音声翻訳機
日本語と外国語を交互に翻訳し、言葉の通じない外国人とのスムーズなコミュニケーションを可能にした音声翻訳機。まだまだ発展途上であり、「実用性に乏しいのでは?」と思っている人も少なくないはずだ。
実はそんなことはない。今回レビューしたiFLYTEKの「Smart Translator」は、同社が誇る世界最高峰※の音声翻訳エンジンを搭載するため、精度の高い翻訳によって円滑なコミュニケーションを取れる。実際に本機をチェックしたマルチリンガルの外国人留学生も「うまく翻訳できています」と太鼓判を押してくれた。そのうえ、自然な動作で使えるので、スマートフォンの音声翻訳アプリとは使い勝手の差が雲泥である。
本機があれば、海外旅行も、インバウンドの訪日旅行者も怖くない。言語の壁が取り払われ、世界がグッと近くに感じられるはずだ。