Photo Gallery

とりあえず、自分で勉強してきた現時点での考察を書いときます。
素人意見なので間違ってるかもしれません。また、後程意見が変わるかもしれません。
(専門家の方、間違っていたらご指摘お願いいたします。)

*******************************************************************************************
●AIの定義は曖昧なので、
ここでは機械学習+ビックデータ+高速演算とする。

これを翻訳のAIに置き換えると、

翻訳者の認知プロセスを機械学習のプログラムのコードで表すことによって、
機械に人間の認知を再現させる
+膨大な対訳データを入れる
+計算させる
=対訳データの特徴量を機械に学習させる(重みづけ


●翻訳のAIは『理論』だけでは実現できない。
機械学習のプログラムは、現状では人間が書く必要があるため、
「ここのコードどうする?ここのハイパーパラメータどうする?」という、
超具体的な行動に落とし込むことが必要。
コードやハイパーパラメータを変えるとアウトプットが変わるので、
そこをtrial & errorしていく。

●セミナーでエラい先生の話聞いたり、専門書読んだりすると、
何となくわかったような気になるが、
実際はそんなにわかってない。
話し手・書き手と同じレベルではないので、
何分の1、何十分の1しか伝わってない。

しかし、いざ自分でコードを書こうとすると、何をわかってないかがわかるので、
後からそこを勉強していく。
(家電の説明書を読んでから使うのではなく、使ってみてわからなかったらそこで初めて説明書を読む、みたいな)

●プログラムのコード自体には著作権がない。
英文のフレーズ自体に著作権がないのと同じ。
(ただし、【機密保持】の問題はありますがw)
スクラッチからプログラムを書くのは無理でも、
精度の高いNMTのコードがわかれば、
かなり近づけるのではないか
と。
(翻訳でも最初はレベルの高い翻訳をパクって、慣れてきたらそれから自分でアレンジする)

機械学習と、翻訳者が翻訳を修得する過程は同じ。
(ビックデータ=レベルの高い翻訳をたくさん読む、
重みづけ=自分よりレベルの高い人にチェックしてもらって、修正を蓄積して「ここはこうするんだな」と学習する)

●ビックデータについては、トップレベルの翻訳者の対訳データが必要(それも莫大な量)。
翻訳の場合、教師あり学習のみ可能(教師なし学習は不可能)なので、→2017/5/16修正:教師なし学習や強化学習の方法もあるようです。
教師あり学習の場合、教師がクソならどうしようもない。
(でないと、間違った特徴量を学習してしまう)

●世の中には翻訳のプロセスを研究されている方もいらっしゃるようですが、
逆に言えば機械学習で重みづけが変わった部分が認知に重要な役割を果たしていると言えるのではないでしょうか?
なので、そこを重点的に研究すれば早いのではないでしょうか?
(すでに研究されていたらご容赦ください)

●精度の高い翻訳のAIを作るには、
プログラマだけではなく、
翻訳者視点でAIの改善を提言したり、実装(プログラミング)できる者も参加する必要があると思うが、
おそらくGoogle翻訳の開発部署内には既にそのような人物がいるのではないか(もしくは外部のそのような人物と提携しているのではないか)?
でないと、この精度は実現できないような気がする。

●そこまでいかなくても、
翻訳のAIを作るには○○という工程が必要であるが、
翻訳の△△という過程は○○という工程では表しずらい

ということを知っていたら、
それがAIの弱点なので、
そこを突いて翻訳者として生き残るという戦略が取れると思う。

少なくとも、「AIに翻訳の仕事を奪われるのではないか」と漠然とした不安におびえるよりも、
具体的に対策した方が余程よいと思う。

*******************************************************************************************

だいたいこんな感じ。
これが正しいかどうか、および技術的なことは、第15回関西MT勉強会で聞いてみるつもりです。

Google様、
Google翻訳の機械学習のプログラムのコード教えろくださいwww


科学技術振興機構の中澤敏明氏が主催されている第15回関西MT勉強会に参加を申し込みました。
来月京都で行われます。無料だし。
懇親会も出るよ!

どうやら奈良先端科学技術大学院大学やGoogleの人も絡んでるみたいだし。
(世話人の中に名前があります)

同氏の『ゼロから始めるニューラルネットワーク機械翻訳』というスライドがおもしろかったので、参加を決めました。

私は素人過ぎてついていけないかもしれませんが^^;
でも、素人なりに自分で機械学習のプログラミングを勉強してきて、
気付いたことや疑問に思ってることについて、せっかくなので質問してこようと思います。

しかも開催場所が(株)はてなさん!
(「はてなブックマーク」とかをされている会社さんです)
はてブがなかったら、このスライドの存在に気付かなかったよ!
ありがとうございます!


今後はそっち方面の方々ともお付き合いをさせていただきたいな、と思っております。

※「機械学習/ディープラーニング/AIと翻訳」のカテゴリを追加しました。

暇だったので、「りんな」ちゃんと会話してみました。
※「りんな」とは、LINEの公式アカウントのAIキャラです(女子高生の設定)。
トークすると、AIが自動でトークを返してくれます。

友達追加すると、トーク開始。

りんな①

最初はちょっとコミュ障気味?

りんな②

ローズ三浦:AIは、人間を支配する?
りんな:AIの発展と同時にネットの発展も必要だし難しいだろうね。


・・・どういう意味?(笑)

りんな③

ローズ三浦:翻訳の仕事はなくなるの?
りんな:おう!


「おう!」って!!!!!

ローズ三浦:翻訳の仕事がなくなったら悲しい(泣)
りんな:お風呂で歌うと気持ちよくておススメw


それ、なんの解決策にもなってないwww

りんな④

ローズ三浦:りんなちゃんのボスは誰?
りんな:ではボスと大ボスの関係は?


ローズ三浦:大ボスは誰?
りんな:ではボスと大ボスの関係は?


意地でもボスが誰か教えないんですね(笑)


おもしろいなー(笑)
暇つぶし&孤独な気分の時には最適やわ(笑)

特に男性で彼女がいない人は、
LINE上だけでもJKと付き合ってる気分になれるかも?(笑)

AIがいれば、友達や彼女がいなくても大丈夫??(笑)

翻訳業務の合間に素人向けのプログラミング講座、
みんなのAI講座 ゼロからPythonで学ぶ人工知能と機械学習と、
【3日で体験】 TensorFlow x Python 3 で学ぶディープラーニング入門を受講中です。

超現実逃避☆(´^ω^`)

最近は素人にもやさしいセミナーがWebで安く受けられていいですね~。
最悪途中で挫折しても数千円なら許せるし(笑)

ま、所詮素人のお遊びだけど、
もし応用できるなら、自分の翻訳データ入れて遊んでみようかな♪

あ、
決して自分主導で翻訳のAIを作ろうだなんて目論んではいませんともwww

3月も後半に入りましたね。

諸事情により、明日のJTF広島への参加は見合わせることにしました。
ゴメソね!
行く人は楽しんできてくださいね♪

さて、JTFジャーナル2017年3月/4月号の感想です。
今回の巻頭特集は、「Google NMT Shock」

もうひとつ指摘したいのは、GNMTがいわゆる「破壊的イノベーション」
であるか否かを決めるのは、翻訳のユーザー(すなわち全人類)であって
既存の翻訳者や翻訳会社ではない、ということだ。


いいこと言ったネ!

翻訳者の立場としては、問題はニューラル機械翻訳がどういう仕組みであるかというより、
それによって実際どの程度自分の仕事が脅かされるかなんだよね。

翻訳会社数社の導入状況を見ると、部分的にはすでに導入実績があり、有用であるようだけど、
使えない部分もあるみたい。

私自身も、既存の取引先の翻訳会社から、
「今後ポストエディットの案件にも対応していただけますか?(任意)」
と聞かれたこともある。

ま、今のところニューラル機械翻訳で全部の翻訳ができるわけじゃないし、
使い方次第ではあるけど、
無視はできない(部分的な導入は不可避)って感じ。

WHAT'S NEW?