第15回関西MT勉強会の感想

 29, 2017 14:27
皆さま、こんにちは。
ローズ三浦です。

お久しぶりですね。
ブログ更新してなくてゴメソね!

というのも、5月初にいただいた案件が、本来4日程度で終わる量だったのにもかかわらず、
納期まで約20日間も余裕があっため、ダラダラやっていた
→しかし途中でセミナー&割り込み案件があり、
結局納期当日に納品になってしまったっていうw

ま、自分が悪いんですけどねwww

さて、ちょっと時間は経ちましたが、5/14の関西MT勉強会について、
主催者側から掲載許可をいただきましたので、うpしときます。
(ちなみに納期がギリギリながらも、27日の「iPS夜話」にも行きましたwそっちの方はまた後で書きます。)

**********************************************************************************************
5/14(日)にMT勉強会が(株)はてなさんで開催されました。

参加者は50名弱。
大半が学生(7割以上?)。
翻訳者は数名、翻訳会社は数社参加されてました。
女性は少なかったです(私を入れて3~4人?)
私は普段翻訳者の集まりでは最年少か、それに近いのですが、
久しぶりに平均年齢以上となりましたw

☆Sentencepiece:ニューラル言語処理向けトークナイザ by 工藤 拓氏(Google)☆
工藤 拓氏はGoogleの日本法人でGoogle翻訳に携わっていらっしゃる方です。
SentencePieceとよばれるトークナイザを開発・公開されています。
SentencePieceとは、
・教師なし
・言語非依存
・End-to-End

で処理を可能にし、
理想的な分散表現の分布から語彙を導出するものだそうです。
数学的な話は全くわからずw

☆GANを用いたニューラル機械翻訳について by 白井 圭祐氏(京大)☆
GANとは敵対性生成モデルで、GeneratorにはRNNを使用し、DiscriminaterにはCNNを使う。Generatorには強化学習(Policy Gradient Method)を用いており、
今のところうまくいっているそうです。

☆Open Problems of Neural MT Systems by 小田 悠介氏(NAIST)☆
NMTの問題として、
・Over generation(単語を重複で出力)
・Under generation(出力していない単語がある)
・Erroneous selection(例:「男」とすべきところを「女」と選択)
・Misunderstanding

などがある。

NMTは、研究者側にもなぜそうなるのか、理由がわかっていない部分(偶然できてしまった?)があるようです。

勉強会の最後は、
「今回は翻訳者の方もいらっしゃったので、
今までとは違うタイプの議論ができたと思います」

という言葉で結ばれました。

【感想】
内容は非常にアカデミック。研究は翻訳の実務とは違う観点で行われている。
翻訳者が気になる部分(「see」と「watch」の使い分け、「距離が“かかる”」という日本語の言い回しが変など)はあまり気にされていない様子。
どうやら翻訳者とは手段と目的がのように感じた。

翻訳のAIの研究者翻訳のAIのシステムを作ること自体が目的。ギミック重視。データフェチ。
翻訳者:翻訳という目的の一手段としてAIを使う

実務でAIを使えるようにするには、AIの技術を取り入れつつも、翻訳者視点で実装し直すことが必要かな、と思いました。

<その他>
・PCを持ち込んでる人が多かったが、プログラム書く人達だから、打ち込むスピードが異常に速いw(もちろんタッチタイピング)。
私はアナログで手書きでメモっていたが、発表者の話が超難解&話すスピードが速いので、とても追いつけないw
・「貪欲的に(greedy)」という言葉が興味深かった。(この勉強会では、「貪欲的に」は「貪欲法(アルゴリズムの一種)を使って」という意味らしいです。)

懇親会では、発表者やエンジニアの方から貴重な情報や勉強のアドバイスをいただきました。
まだ勉強し始めたばかりですが、私の勉強の方向はだいたい合っているようだし、
次に何を勉強すべきかもわかりました。


素晴らしい勉強会でした!

勉強会を主催してくださった中澤氏とお世話をしてくださった須藤氏に、改めてお礼申し上げます。
中澤氏はMT業界の「エバンジェリスト」ですね!

**********************************************************************************************
今、納品終わってちょうど時間が空いたから、
NMTの勉強しようかな。

9月のMT Summitまでに、
ちょっとは話についていけるようになりたいし。

関連記事

COMMENT 0

WHAT'S NEW?