Photo Gallery

皆さま、こんにちは。
ローズ三浦です。

お久しぶりですね。
ブログ更新してなくてゴメソね!

というのも、5月初にいただいた案件が、本来4日程度で終わる量だったのにもかかわらず、
納期まで約20日間も余裕があっため、ダラダラやっていた
→しかし途中でセミナー&割り込み案件があり、
結局納期当日に納品になってしまったっていうw

ま、自分が悪いんですけどねwww

さて、ちょっと時間は経ちましたが、5/14の関西MT勉強会について、
主催者側から掲載許可をいただきましたので、うpしときます。
(ちなみに納期がギリギリながらも、27日の「iPS夜話」にも行きましたwそっちの方はまた後で書きます。)

**********************************************************************************************
5/14(日)にMT勉強会が(株)はてなさんで開催されました。

参加者は50名弱。
大半が学生(7割以上?)。
翻訳者は数名、翻訳会社は数社参加されてました。
女性は少なかったです(私を入れて3~4人?)
私は普段翻訳者の集まりでは最年少か、それに近いのですが、
久しぶりに平均年齢以上となりましたw

☆Sentencepiece:ニューラル言語処理向けトークナイザ by 工藤 拓氏(Google)☆
工藤 拓氏はGoogleの日本法人でGoogle翻訳に携わっていらっしゃる方です。
SentencePieceとよばれるトークナイザを開発・公開されています。
SentencePieceとは、
・教師なし
・言語非依存
・End-to-End

で処理を可能にし、
理想的な分散表現の分布から語彙を導出するものだそうです。
数学的な話は全くわからずw

☆GANを用いたニューラル機械翻訳について by 白井 圭祐氏(京大)☆
GANとは敵対性生成モデルで、GeneratorにはRNNを使用し、DiscriminaterにはCNNを使う。Generatorには強化学習(Policy Gradient Method)を用いており、
今のところうまくいっているそうです。

☆Open Problems of Neural MT Systems by 小田 悠介氏(NAIST)☆
NMTの問題として、
・Over generation(単語を重複で出力)
・Under generation(出力していない単語がある)
・Erroneous selection(例:「男」とすべきところを「女」と選択)
・Misunderstanding

などがある。

NMTは、研究者側にもなぜそうなるのか、理由がわかっていない部分(偶然できてしまった?)があるようです。

勉強会の最後は、
「今回は翻訳者の方もいらっしゃったので、
今までとは違うタイプの議論ができたと思います」

という言葉で結ばれました。

【感想】
内容は非常にアカデミック。研究は翻訳の実務とは違う観点で行われている。
翻訳者が気になる部分(「see」と「watch」の使い分け、「距離が“かかる”」という日本語の言い回しが変など)はあまり気にされていない様子。
どうやら翻訳者とは手段と目的がのように感じた。

翻訳のAIの研究者翻訳のAIのシステムを作ること自体が目的。ギミック重視。データフェチ。
翻訳者:翻訳という目的の一手段としてAIを使う

実務でAIを使えるようにするには、AIの技術を取り入れつつも、翻訳者視点で実装し直すことが必要かな、と思いました。

<その他>
・PCを持ち込んでる人が多かったが、プログラム書く人達だから、打ち込むスピードが異常に速いw(もちろんタッチタイピング)。
私はアナログで手書きでメモっていたが、発表者の話が超難解&話すスピードが速いので、とても追いつけないw
・「貪欲的に(greedy)」という言葉が興味深かった。(この勉強会では、「貪欲的に」は「貪欲法(アルゴリズムの一種)を使って」という意味らしいです。)

懇親会では、発表者やエンジニアの方から貴重な情報や勉強のアドバイスをいただきました。
まだ勉強し始めたばかりですが、私の勉強の方向はだいたい合っているようだし、
次に何を勉強すべきかもわかりました。


素晴らしい勉強会でした!

勉強会を主催してくださった中澤氏とお世話をしてくださった須藤氏に、改めてお礼申し上げます。
中澤氏はMT業界の「エバンジェリスト」ですね!

**********************************************************************************************
今、納品終わってちょうど時間が空いたから、
NMTの勉強しようかな。

9月のMT Summitまでに、
ちょっとは話についていけるようになりたいし。

昨日は東京出張わず。
1日中予定ツメツメ+普段使わない頭の部分と気を使ったので、どっと疲れました。。

セミナーの講師は齊藤貴昭氏。
やっとお会いデキタ!(・∀・)

内容は去年の翻訳祭で1回やったものにもかかわらず、
会場は大盛況(真ん中の席まで埋まってました)。

参加者はどちらかというと品証寄り(チェッカー、翻訳の品質管理担当者)の人が多かったです。
(もちろん翻訳者もいましたが。)
意外な人物にもお会いできて驚きました。
MT Summit XVIでよろしくお願いしますね!

齊藤氏は、元々電機メーカーの品質管理業務をされており、
その品証のフローを翻訳に応用した感じです。

同氏がおっしゃるように、「注意する」「気をつける」は対策ではないので、
いかにミスに気付くか、客観的な方法で対策するかについて述べられていました。

同氏のやり方は、
チェックのフローを細分化し、
単一のチェック(複数のチェックを同時にすると間違うため)や、ツールを使ってチェックするというものでした。

特に「翻訳品質保証マトリックス」の表が有益!
これもらえただけでも行ってヨカッタ!

セミナー終了後は、午後からの企業訪問の時間が迫っていたので、ロクに挨拶もできずに会場を後にしました。
(昼食の時間もなく、移動しながらおにぎり🍙を齧りました・・・)

午後からはクライアント回り。
新幹線の時間待ちに飲んだハイボール🍺がうまかったです。

今回の号は、
「収入と働き方」
「機械翻訳 最前線」
「翻訳者評価登録制度」
等、
盛りだくさんです♪♪

お金についても書きたいことは山々だけど、
今回は機械翻訳についてだけ言及するよ。

翻訳会社では、積極派、前向き派、慎重・様子見とさまざまな意見がありますが、
全体としては今後対応・導入が進みそうですね。
(機械翻訳完全否定派は少数。)

関西大学教授・山田優氏は、
ルールベース・統計的・ニューラル、それぞれの機械翻訳の方法について説明され、
今後人間翻訳者に求められることについても述べられています。

機械翻訳の具体的な導入状況については、十印さんと川村インターナショナルさんがインタビューに答えられており、
その2社ではPE(ポストエディター)を積極的に募集中のようです。

ページ端に「Information」として、MT Summit XVIの情報が掲載されています。

このイベント、JTFジャーナル2017年5月/6月号の翻訳業界カレンダーにも掲載されてましたよね。

公式サイトは英語のみ?
見てみたら、
Supporters & Sponsors、翻訳会社だらけやんwww
Committee membersに翻訳業界側の人間が何人かいるし。

ていうか、このイベントMT勉強会の方のメルマガでも流れてきたんですよねw

MT勉強会は、完全に研究者側の会なので、
MT Summit XVIは研究と実務の合流地点となるかも。
(というか、そうなることを祈る。)

9/18~9/22、名古屋大学で行われます。
筆者は今のところ参加予定です。

P.S. 明日、ローズ三浦が東京に参上します!
午前中のテリー齊藤氏のセミナーに参加される方、
午後から訪問させていただく企業様、
どうぞよろしくお願いいたします♪♪

JTFジャーナル2017年5月/6月号読みました。※今回から閲覧には無料登録が必要になったみたいです。
それの6ページ目に翻訳業界カレンダー(翻訳関連のセミナー・イベントのまとめ)があるのですが、

半分くらい機械翻訳関連じゃねーかよ。


機械翻訳も気にナルのは気にナルけど、
最新(か最新に近い)情報は、この前のMT勉強会で入手できたので、しばらくはいいかな。

機械翻訳関連に限らず、今後、セミナーは、
よほど行きたい本当に必要な場合にだけ行くことにします。
(行くかどうか迷う程度のものには行かない。
「絶対行きたい!」「本当に必要」であれば、そもそも迷わないと思うので)

お金と時間は有限なので、
どっちでもいいセミナーに行くお金と時間があるなら、アレに投資します。


☆現時点でのセミナー参加予定(変更の可能性あり)☆
・5/22:JTF『誰も教えてくれない翻訳チェック ~翻訳者にとっての翻訳チェックを考える~』
・5/27:ナレッジキャピタル「超学校」:『生きものすべては細胞から』←追加!
・5/31:千里セミナー『エピゲノム情報に基づくがんの制御』
・7/5:千里セミナー『アルツハイマー病の謎を解く:認知症研究2025年問題』←追加!
・7/7:千里セミナー『生命を司り、操る~ノンコーディングRNAの底知れぬちから~』←追加!

こんにちは、みなさん。

この前のMT勉強会の感想については、主催者側に掲載してよいか現在確認中ですので、しばらくお待ちくださいませ。
(最悪掲載できないかもしれません)

※ここで1つ、重要な修正です。
以前、「翻訳の場合、教師あり学習のみ可能(教師なし学習は不可能)」と書きましたが、
この前の勉強会によれば、教師なし学習や強化学習の方法もあるようです。
ゴメソね!m(_ _)m

もうそろそろ、翻訳の実務は他の人に任せてマージンを取り、
自分は他のことに従事した方が、
総合的な費用対効果が高いような気がしてきたなー。

今日は雨ですね。

さて、今回は海外の翻訳会社に試された?お話です。

この前、海外の翻訳会社のトライアルを受け、
そのフィードバックが返ってきたのですが、
最初のメールでは合格とも不合格とも言われず、
「フィードバックについてどう思う?同意する?しない?」
とだけ聞かれました。

合否がわかっていない状態で今までそのようなことを言われたことがなかったので、意図をはかりかねました。
(昔、別の会社のトライアルに落ちた時に、「これは最終決定じゃないので、意見があれば言ってください」と言われたことはありますが)

フィードバックを見てみると、
大きなミスが2つ(用語の正しい訳を知らなかった)、
あとはマイナーな修正かな。

私は大きなミス2つについて特記し、それを認め、
全体的に直したもの(他のマイナーな修正も反映+そのままでは文章のつなぎが不自然になったので、つなぎも修正)
を送りました。

すると、「フィードバックと対応を鑑みて、残念ですが今回は不合格
と言われました。

こちらの対応が特にマズかったとも思えないので、
おそらく評価終わった時点でほぼ落とす気だったんじゃないかと思う。

なんか、ムダに試された感じするわ~( ̄~ ̄)
ま、でもこれで正しい用語の訳を2つ覚えられたと思えばw(←ポジティブ)


ローズ三浦は、トライアルに落ちてしまった!
しかし、正しい用語の訳を2つ覚えた!


IT and translation are going to be integrated and seamless.
Should I survive as a translator with extremely high skills, or become the administrator of the AI for translation?

Rosy or Thorny

Will The Life of Rose Miura Be Rosy or Thorny?

特記しとくようなトラブルがありましたので、ここにご報告いたします。

担当者から翻訳の依頼を受け、
「エラーが出てこっちでは作業用ファイル作れなかったから、そっちで作って納品してね」
と言われました。
(※そこはmemoQのファイル形式で納品がデフォの会社。私が持ってるのはTradosのみ。
いつもmemoQでも読み込めるファイル形式にして納品しています。)

さて、こちらでTradosに文書を読み込もうとすると、TradosのバージョンがWordのバージョンに対応しておらず、エラー発生。
Wordを前のバージョンに変換すると、読み込めました。

しかし、そこに待ち受けていたのは、
cfタグの大群。
1単語どころか、1文字ごとに付いています。

以下、私の対応:
①cfタグを取ろうとしたが、取れない
②Trados 2017のトライアル版をダウンロードして文書を読み込んでみる
③文書の読み込み自体は問題なくいったが、ファイルのエクスポートがmemoQでも読み込めるファイル形式でできない
④さんざん格闘したがうまくいかない
⑤結局memoQのトライアル版をダウンロードして作業

結果、本来1日でやる量を2日かかった+ムダな労力とムダなストレスがかかった。
最初からmemoQのトライアル版ダウンロードすればよかったんじゃねぇかよ。

ちなみにmenoQは初めて試しましたが、
お?おお?
Tradosよりかなり使いやすいではないか!

memoQはできる子☆

ちなみにmemoQのオプションには「このボタンを押さないでください」というボタンがあります。
え?もちろん押しましたとも☆ (´^ω^`)
みんなは絶対押しちゃダメだぞ!!(笑)


【今回の教訓】
①:安請け合いしない。今回の場合は、最初の時点で「文書にエラーがあるので、受けられない」と断るべきだった。
②:違うソフトで作業したり、バージョンを変換するよりも、
同じソフトで正規に対応しているバージョンが一番エラーが少ない。


あのcfタグの大群は、しばらく夢に出てきそうです。
みんなは私の二の舞にならないように気を付けてね☆

最近、医療でもIT寄りの仕事が多いです。
不思議~。
機械学習のプログラミングを勉強し始めた矢先に、ちょうどMT勉強会も開催されるし。

引き寄せの法則??

とはいえ、いいことばかりではありません。。
昨日、早い者勝ち形式(翻訳者に一斉にメールが送信され、一番早くAcceptした翻訳者が受注できる)の翻訳会社で、
約30マソの案件を失注していまいました。。

しかし、いつまでも「あの時もうちょっと早くボタンを押してれば30マソ・・・」と言っていると、
負の無限ループに入ってしまうので、
どこかで切り替えて前向きに行動しないと事態は好転しないよね。

引き寄せの法則もそういうことでしょ?
発注者側からすると、不平・不満ばかり言ってる人に仕事あげたくないですよねw

A社がダメなら、B社から受けたらいいじゃない。
パンがなければご飯を食べればいいじゃない!
(※『お菓子』とは言ってないです。念のため)

おもしろいものを見つけました。

HOOKED - Chat Storiesというスマホのアプリなのですが、
これはゲームではなく、
チャット形式の小説なのです。
(LINEの画面みたいな感じ)

筆者は実際にこのアプリをダウンロードして、一番最初の『彼女はどこ?』の話だけ読みました(※この話はホラー)。
物語は、ティファニーの「地下室から赤ん坊の声が聞こえる・・・」というメッセージで始まり、
ママとのチャットのやりとりで話が進んでいきます。

↓以下、ネタバレ↓(ドラッグして文字を反転させてください)


不倫イクナイ。
奥さんこわい。
不倫の子供作るのイクナイ。


創業者のPrerna Gupta氏は、「いかにしてティーンエージャー1000万人にスマホで小説を読んでもらったか」という記事を書かれています。
https://medium.com/@prernagupta/how-we-got-10-million-teens-to-read-fiction-on-their-phones-19a2a475084c

昔ケータイ小説が流行った時にも、「ケータイ小説は文学じゃない!」みたいな議論が起こりましたが、
賛否両論あるものの、
若い人に「活字のおもしろさを知ってもらう」「活字を読むという習慣をつける」という意味では、
一役買っている部分もあると思います。
で、そこからさらに深く興味を持ってくれる人も出てくると思います。
本の場合は、買う「必要性」はないので、
まず、興味を持ってもらわないと話始まらないんじゃないでしょうか?

根本的な部分(本質)は変えないけれども、
アプローチ(見せ方・伝え方)次世代が興味持ってくれるようなものに変化させていく、というのも、
ビジネスの一手かもしれません。

WHAT'S NEW?