Photo Gallery

突然ですが、クイズです。
?に入る単語は何でしょう?
              
          You ? goodbye and I say hello.
                                    (※出展:『ゼロから作るDeep Learning ❷ ―自然言語処理編』)

人間の感覚では、なんとなくsayかなってわかりますよね。

これを両隣の単語をコンテキストとして、「?」にどのような単語が出現するのかをコンピュータで推測するのが、
推論ベースと呼ばれる手法です。

あ、ちなみに前回実装した単語のベクトル化は、カウントベースの手法です^^

違い:
カウントベースコーパス全体の統計データを利用する。語彙数が多い場合は計算量が膨大になる(例:語彙数が100万の場合、100万×100万の行列計算を行うことになる)ため、現実的ではない。
推論ベースニューラルネットワークが一度に少量の学習サンプルを参照しながら、重みを繰り返し更新する。

word2vecは、推論ベースの単語のベクトル化の手法です(続く)。


『メディカル翻訳・通訳 完全ガイドブック』の感想です。

と言っても、前回と似たような内容なので、MTに関する部分だけに言及しますね。

ちなみに私の寄稿はP80~『文系出身・メディカル翻訳者のスキル習得方法』なので、
興味のある方は読んでね♡(⋈◍>◡<◍)。✧♡

まず、P16~「AIの時代がやってくる メディカル翻訳におけるMTの可能性」(by(株)アスカコーポレーション)

「特にメディカル分野で課題となるのはデータの蓄積です」
「NMTの精度を上げるには100万センテンス単位という大量のコーパスを確保することが必要だと言われている。」

ていうか、もっと対訳データが少なくてすむように、
NMTエンジンのアルゴリズム変えられないのかなー。

「SMTは言わば旧世代の技術であり、NMTに比べて訳文の流暢さに劣るが、それでもあえて使っているのはなぜか。それは、用語集を厳密に適用させることができるという利点があるから。」

これ、同じこと他のメディカル分野の翻訳会社さんからも聞いたわ。

「ポストエディットであれ翻訳であれ、品質を確保するためには、翻訳について詳しく、メディカルの知識も豊富な翻訳者の方に、今後もメインで活躍していただきたいと考えています」

これはその通りだと思う。ポストエディットの品質を確保できるのは、いちから翻訳できる人だけだから。

P53:「Column メディカル翻訳とCATツール&MT」
表2●機械翻訳(MT)を実際の案件で使用するか?

最も多いのは「使ったことはない」(17社)、次いで「使ったことはあるが、実際の案件に使えるレベルではなかった」(10社)
下訳として使用しているところも数社あるみたいだけど、あとはこれから(打診中・検討中)って感じですね。

P69:「COLUMN メディカル分野の翻訳と機械翻訳(AI)」
「優秀なAIを搭載していても機械翻訳は単体では完成品を生み出すことはできず翻訳をよく知る技術者の貢献があってはじめて、本当の意味で使い物になるものであろうと考えています。」
ちなみにこのコラムは森口先生の誌上レッスンの最後に付いていたんだけど、森口先生のご意見なのかな?

おっ!!!

単語のベクトル化・1

単語のベクトル化・2


3日間詰まってたからめっちゃ嬉しい・・・。゚(゚´Д`゚)゚。

これで『単語をベクトルに変換する』ってのがどういうことか、
体感的にちょっと理解できたわ(←数学的理論は全く理解できてないけど)。

9月も末になり、涼しくなりましたね。
半袖だと寒いくらいです💦

実りの季節。

さて、英日の翻訳単価についてですが、
何円から「安い」と思うかは、人によって異なると思いますが、
筆者的にはえっ、そんなことないかな~?という感じです。

あ、日本の翻訳会社が提示してくる単価は、確かに安いと思いますよ。
だが、海外ならどうでしょう?

もちろん、海外と言ってもピンキリですし、リスクもありますが、
単価が倍違うとすればどうですか?

物の値段は需要と供給(と物価)によって決まるので、
その『差』によって儲けるんです。

現在の状況:
A社:トライアル提出済み。現在結果待ち(※定期案件になる可能性あり)
B社:トライアルを受けることになった。現在入稿待ち
C社:問い合わせが来たところ(返事はまだしていない)


いずれも新規のお客様です。
順番的に、C社の問い合わせに返事するのは、とりあえずA社のトライアルの返答が来てからかな~。

結論:A社、早くトライアルの返事ください。

案件が「確定」しなければ、登録翻訳者・チェッカーもアサインできないし。
しかも、会社によっては支払いサイトが長いところもあり、
クライアント→私への入金より、私→登録翻訳者・チェッカーの支払いの方が先に来るため、
資金繰りがおかしくなる。

そんなややこしくなるんだったら、無理に新規獲得せずに既存のお客さんだけでいっかって思いそうになるけど、
それだと翻訳会社としては成長しないよね。

“高度なオモチャ”に過ぎない。

だが、改良次第では役に立つかも。


Google社の翻訳チームがリサーチ サイエンティストを募集しているようです。

これ見ると、Google 翻訳はTensorflow、C++、Python使ってるんだな、ってわかるよね。

実薬対照試験

NTTデータの長尾真(情報工学者)氏・新井紀子(数学者)氏インタビューです。

AI技術の発展にはこれから何が必要になるのか、
長尾真氏は情報工学者の立場から(←日本の機械翻訳の第一人者)、
新井紀子氏は数学者の立場から、
西洋哲学なども交えながら対談されています。

(抜粋)新井 例えば「Alexは男性にも女性にも使われる名前で、女性の名Alexandraの愛称でもあるが、男性の名Alexanderの愛称でもある。Alexandraの愛称は○○である」という短文をテストで出しました。

〇〇に当てはまるものはどれか?(みなさんも考えてみてください♪)
①Alex
②Alexander
③男性
④女性


(抜粋)新井 この○○に当てはまるのは「Alex」と決まっているのに、「女性」と答えた回答者が半分ほどいたという結果になりました。つまり、構文解析ができないという人が半分もいる。


やべー、「女性」かと思った(汗)←翻訳者!


(抜粋)長尾 私はもう実験とか、コンピュータをいじってプログラムするということはできなくなっているので、情報科学の分野の人にどのように貢献できるかを考えています。

えっ、じゃあElikaのプロトタイプできたら誰に持っていったらいいの?
やっぱ、京大の黒橋教授かな?←向こうが相手にしてくれたらだがwww

そもそも黒橋教授って長尾先生の弟子やし。
(日本の機械翻訳業界では、長尾派閥は超強いです)

大阪は雨☔の日が続いてます。

雨続き。


さて、JTFジャーナル2018年9月/10月号(No.297)のIJET-29 大阪特集に寄稿しました。←ローズ三浦は、IJET-29 大阪の広報・スポンサー担当です。

寄稿にご協力いただいた他の報告者・写真撮影をしてくださった皆さま、誠にありがとうございました。
おかげさまで、素敵な報告文になりました♡

何人かで寄稿したのですが、
ローズ三浦は、「あいさつ文」「機械翻訳による実務案件の納期短縮と原価低減はこれからどう進むか?」「翻訳者の脳科学」を担当しました。

「機械翻訳による実務案件の納期短縮と原価低減はこれからどう進むか?」は、JTF側から多少編集がありました。
あ、「翻訳者に支払うPE単価をいきなり下げるのはやめたほうがよい。」というのは、
あくまで河野先生のご意見ですからね^^

「翻訳者の脳科学」の方は、ほとんど修正が入っていません。
自分的には、今までの人生で一二を争う出来(←自称)。

「翻訳者の脳科学」の最後の一文は、翻訳業界全体に対して声を大にして言いたいですね。

ちょっと気付いたことを書いておきますね。
というか、かなりエグいから、「俺は一生労働者としてがんばるんだ!」って人は知らない方が幸せかも??

1、労働者側は、100働いても100貰えることはない

この動画によれば、労働分配率は50%。
つまり、単純計算すれば、労働者側からすれば自分が利益を100出しても50しかもらえないってことです。
しかも、その50ていう数字も別に決まってない。
経営者側が自由に設定できるので、
アコギな社長なら10とか1にも設定可能www
(これは労働者側に知らせる義務はない。)

2、経営者側は自分たちに都合のいいルールを作れる
法律に違反することでなければ、経営者側は自由にルール(仕組み)を作れる。
労働者側は、経営者側の作ったルール(仕組み)でゲームをプレイしないといけない
ルールを守らないと会社から追い出されるし、
ルールを守って頑張って働いたとしても、会社を儲けさせるだけである。

100働いて100以上貰いたいなら、経営側になるしかないが、
それにはリスクが伴う。

例えば、売上がなかったら人件費がマイナスになる可能性もあるし、
労働者が出した利益の残りの50%はどこにいっているかというと、
全部社長の懐に入るわけじゃない(設備費用や、新規事業への投資(失敗することもある!)などもかかる。)
最悪、多額の借金を負う可能性もある。
あと、労働者が問題起こしても、最終的には会社の責任になる。

その点、労働者側なら、少なくとも働いたら確実にお金をもらえるし、マイナスになることはない。
何かやらかしても、重度の過失や故意ではない限り最悪クビで済むし。

どちらかいいかは、あなた次第です。

9/29に、おなじみの「医薬翻訳・通訳完全ガイドブック」(※数年ごとに更新版が出る)の最新版、
メディカル翻訳・通訳 完全ガイドブックが発売されます。

それに体験談(2P)を寄稿しました!

医薬翻訳を始めたきっかけや、業界への入り方、レベルアップ方法、おすすめの参考資料など・・・
ブログに書いていない裏話・裏技(?)も書いてますので、
みんな買ってね!(⋈◍>◡<◍)。✧♡

こんばんは。
大阪は雨☔が続いています。
急激に気温が下がって、朝夕は半袖だと寒いくらいです💦
本を読むのには最適ですね。

本。


さて、翻訳祭に申し込みました。
交流パーティーは残念ながら「売切」となっていましたので、不参加です。
26日の午後のみ参加します。
聴講予定のセッションは、
「深層学習による自然言語処理の進展」「あなたがつくる医学翻訳の未来:Prescription for Survival続編」です。

「深層学習による自然言語処理の進展」は、
自然言語処理で有名な京大の黒橋教授がスピーカーですね。
質問できるチャンスがあればいいな!

「あなたがつくる医学翻訳の未来:Prescription for Survival続編」は、
医薬専門の翻訳会社3社によるパネルディスカッション。
今、当方は個人翻訳者→翻訳会社へ移行中なので、
今後は他の翻訳者ではなく、他の翻訳会社が競合となるため、
各社の動向が気になるところ。

翻訳祭に行かれる方は、会場でお会いしましょう!

根治できない病気

某翻訳会社との取引交渉の返事を放置していたら、
「契約条件で気になる部分があるなら、出来る限り対応するよ」
と、向こうから譲歩してきました。

これはこっちが『下請け』の立場だから、普通はないことなのですが(普通は一方的に契約条件を示してきて、『嫌ならやらなくていいよw』というスタイル)、
医薬分野はできる人が少ないから、できると思ったら翻訳会社側も多少は考慮してくれるんですよね。
他に頼める人があんまりいないからw

ていうか、このパワーバランス、いつまで続くかな?

例えば、めっちゃ医療分野に強いNMTエンジンを所有する翻訳会社が現れたら、
そこに頭下げてPEの仕事もらいに行かなあかんくなるってことも十分ありうるwww
おはようございます。
朝夕はだいぶ涼しくなりましたね。

彼岸花。


翻訳会社としての体制を整えるのが大変だなと思っております。

例えば、私が個人翻訳者としてもらってるIDでうちの登録翻訳者がログインすると不正ログインになってしまうので、
改めて会社用IDをもらわないといけなかったり、
登録翻訳者の人数と処理能力を考慮して受注量を調整する必要があったり(例:私1人なら駒数1だが、副業の人は駒数0.2、フルタイムだが未経験者は駒数0.5で計算とか)。

なんというか、持っている駒数で最大の利益を出すという感じである。
(そのためには、必ずしも自分が前線で戦う必要はない。

某翻訳会社に「翻訳会社」として(※少なくとも2人以上で見るという条件)トライアルに合格し、
登録させていただいたのですが、
さらにクライアントからのトライアルもあるそうです。
(クライアントは何社かにトライアルやらせて、一番いいところに依頼するそうです。)

何回タダでやらすんだwww

てか、どうせクライアントからのトライアルも受けないといけないんだったら、
間にその翻訳会社が入る意味がない。
(当方には翻訳者もチェッカーもいるので、単独で翻訳会社としての機能を果たせるため。)

お心あたりのある会社様は、直接お仕事ください♡(ゝω・)
(当方は個人事業主ですが、すでに世界的医療機器メーカーと直接取引しておりますので、怪しくないですよ☆)

WHAT'S NEW?