読者です 読者をやめる 読者になる 読者になる

Google翻訳は使い物になるか?

 先日、Google翻訳がマシンラーニング(機械学習)によって飛躍的に翻訳レベルが向上しているとの記事を目にした。

ちなみに上記文章をGoogle翻訳で英語に翻訳してみると、

f:id:Jumbokun:20170215153117p:plain

英訳文:

"The other day, I saw an article saying that translating level is dramatically improved by machine learning (machine learning) in Google Translate."

おお、この程度の文章なら完璧に翻訳出来てる!これはニューラルネットワークを活用した新しい機械学習を導入した成果らしい。

 では、日経新聞の記事をいくつか翻訳させてみた。結果はやはり得意/不得意な文章がある。

例題1:

韓国統一省の報道官は15日、北朝鮮金正恩キム・ジョンウン)委員長の異母兄、金正男キム・ジョンナム)氏とみられる男性がマレーシアで殺害されたとの情報に関し、「殺されたのは金正男であると確実視される」と発表した。韓国の情報機関は同日、正恩氏が5年前から正男氏の殺害を指示していたとの見方を示した。」

f:id:Jumbokun:20170215154754p:plain

英訳文:

"The spokesperson of the Ministry of Unification of the Korea Ministry of Unification said on Monday that on Monday she was killed in Malaysia, a mother named Kim Jung-nam, a mother of a North Korean chairman, Kim Jung-eun, He will be assured that Kim is Masao. " The Korean intelligence agency said on Monday that Mr. Masato ordered Masao's murder from five years ago."

 これはグダグダな翻訳になった。韓国名を漢字で表記しているので、そこで誤訳してしまったと思われる。かなり難しい英訳だが、ここまで使い物にならないと翻訳文を修正して使うより自分で翻訳した方が早い。

例題2:

東芝の株価は15日朝の取引開始直後から大幅に続落した。午前中には一時、200円を割り込み、前日比13%安い199円20銭と昨年4月以来、約10カ月ぶりの安値水準となった。東芝米原子力建設会社の買収に関連して不適切な行為があった可能性があることから調査のため四半期報告書の提出期限を1カ月間延長すると14日に発表。経営再建に向けた道筋が不透明さを増していることから売りが優勢になっている。15日は前日比9%安の209円70銭で取引を終えた。」

f:id:Jumbokun:20170215155616p:plain

英訳文:

"Toshiba's stock price fell sharply from immediately after the start of trading on the 15th morning. In the morning, it temporarily cut off 200 yen, it was 199 yen 20 yen, 13% cheaper than the previous day, the lowest level in about 10 months since April last year. Toshiba announced on 14th that it will extend the deadline for submitting the quarterly report for one month to investigate because there is a possibility that inappropriate acts were involved in connection with the acquisition of a nuclear energy construction company. Selling has become dominant as the path towards management reconstruction has become increasingly uncertain. On the 15th, trading was closed at 209.70 yen, down 9 percent from the previous day."

 これは完璧な翻訳になった。機械学習によって、長文の翻訳の方が正確に訳せるようになってきているようだ。

では、逆に上記の英文を日本語に再度翻訳させてみた。

f:id:Jumbokun:20170215160637p:plain

日本語訳文:

東芝の株価は、15日朝の取引開始直後から急落した。 午前中は一時的に200円切ったが、昨年4月以来の約10ヶ月で最低水準であった前日より13%安い199円20円だった。 東芝は、14日、原子力建設会社の買収に関連して不適切な行為が起きた可能性があるため、四半期報告書の提出期限を1カ月延長すると発表した。 経営再建への道がますます不透明になるにつれて、販売が支配的となった。 15日の取引は前日比9%減の209.70円で取引を終えた。」

 ほぼ訳せているが、原文「売りが優勢になっている」が「販売が支配的となった」と誤訳されている。ここは修正が必要になるだろう。

 結論として、特定の分野の翻訳であれば、長文を一気に翻訳して後で修正を入れる作業で使えるレベルには達したと言えるのではないか。ただし、まだどの分野が得意かは試して確認する必要はあるが。

        Google翻訳の新しい使い方

 Google翻訳は、PCのWeb版とスマホのアプリが提供されている。

1. Web版はGoogleサイトから「Google翻訳」をクリックすれば立ち上がる。

f:id:Jumbokun:20170215162531p:plain

 

2. スマホには「Google翻訳」アプリをインストールして使う。

f:id:Jumbokun:20170215163304j:plain

このアプリを立ち上げると:

f:id:Jumbokun:20170215163835j:plain

1. まず上段にどの言語からどの言語に翻訳するかを選択する。

   上の画面では日本語から英語になっているが、英語から日本語にもできるし、

日本語からベトナム語にもできる。

2. 次に原文の入力方法が選択できる。

1)テキストを打ち込んで入力

2)カメラのアイコンをクリックして、カメラに映った文字をリアルタイムで翻訳

3)マイクのアイコンをクリックして、音声で入力できる

4)手書きアイコンをクリックして、手書き入力 

  面白いのは、2)のカメラに映った文字をリアルタイムで翻訳する機能。

ただし、文字認識の正確度がイマイチで実用化にはちょっとという感じ。

 実用化になりそうなのが、3)マイクのアイコンをクリックして、音声で入力。


Google翻訳(日→英)


Google翻訳(日→ベトナム語)


Google翻訳(日→スペイン語)

ベトナム語スペイン語は自分では検証できないので、誰か合っているか教えてください。

これは会話をしている時に使うことが想定されるので、短文をきちんと翻訳できれば実用になるんじゃないか。

ちなみにGoogle翻訳は以下の言語に対応している。

f:id:Jumbokun:20170216163653p:plain

結論:実用に耐えうる分野を見つければ生産性を一気に上げることができそう。

特に音声認識と文字認識のレベルが急激に向上して、ほぼリアルタイムで翻訳が可能になってきた。

特に音声入力翻訳は、ぜひ海外に行った時試してみてください。

 

では、では。