翻訳インターンを修了した機械翻訳研究者側の学生(前回とは別の学生)から、
感想をいただきました。
==================
受講感想ですが、月1回の文量としては学業に支障のない範囲で取り組める量で色々学べたので良かったです。特に一定のフォーマットを持った文章を翻訳するという経験は
学校教育の中でもあまりない経験でしたので為になりました。また、数値周りの表現(今回ですと「1日yy回xxx mg 投与群」の部分など)は日常英会話等では学ぶ機会が
少ない一方、英語論文を執筆する際には必要になるため、勉強の必要性を感じました。
機械翻訳にどのように活かせそうかですが、現状の機械翻訳は文書から文単位で抜き出して学習データとしているものが主流なので、このインターンのように全体のフォーマットを
考慮しつつ翻訳する場合に弱いというのがわかりました。既存の文書単位で翻訳する研究を更に発展させるか、あるいは翻訳メモリのような定形表現の翻訳に使える手法を
ニューラルネットワークに組み込む必要があると思います。あるいは、手法は既存のものを用いて精度を向上させたいとなると、翻訳させたいドメインの文書をとにかく大量に
用意する必要性が高いでしょう。一般的な大規模コーパスからは分野に固有の定形表現や固有名詞は学習できないと思うからです。
==================
こういう機械翻訳研究者側の知見を得られることは、非常に有益ですね。
(あと学生だから若いし頭が柔らかいから、
機械翻訳の精度を向上させる斬新な発想ややり方を思い付いてくれるかも、という期待もあります。)
別件ですが、3/19のNLP2021ワークショップ「文章の評価と品質推定〜人間・機械の「作文」の巧拙をどう見極めるか?〜」では、
グループディスカッションもあるみたいなので、楽しみです。
私はNLP2021のシルバースポンサーですし、このワークショップのグループディスカッションにも参加予定です。
機械翻訳研究者側と建設的な議論ができることを期待しています。
感想をいただきました。
==================
受講感想ですが、月1回の文量としては学業に支障のない範囲で取り組める量で色々学べたので良かったです。特に一定のフォーマットを持った文章を翻訳するという経験は
学校教育の中でもあまりない経験でしたので為になりました。また、数値周りの表現(今回ですと「1日yy回xxx mg 投与群」の部分など)は日常英会話等では学ぶ機会が
少ない一方、英語論文を執筆する際には必要になるため、勉強の必要性を感じました。
機械翻訳にどのように活かせそうかですが、現状の機械翻訳は文書から文単位で抜き出して学習データとしているものが主流なので、このインターンのように全体のフォーマットを
考慮しつつ翻訳する場合に弱いというのがわかりました。既存の文書単位で翻訳する研究を更に発展させるか、あるいは翻訳メモリのような定形表現の翻訳に使える手法を
ニューラルネットワークに組み込む必要があると思います。あるいは、手法は既存のものを用いて精度を向上させたいとなると、翻訳させたいドメインの文書をとにかく大量に
用意する必要性が高いでしょう。一般的な大規模コーパスからは分野に固有の定形表現や固有名詞は学習できないと思うからです。
==================
こういう機械翻訳研究者側の知見を得られることは、非常に有益ですね。
(あと学生だから若いし頭が柔らかいから、
機械翻訳の精度を向上させる斬新な発想ややり方を思い付いてくれるかも、という期待もあります。)
別件ですが、3/19のNLP2021ワークショップ「文章の評価と品質推定〜人間・機械の「作文」の巧拙をどう見極めるか?〜」では、
グループディスカッションもあるみたいなので、楽しみです。
私はNLP2021のシルバースポンサーですし、このワークショップのグループディスカッションにも参加予定です。
機械翻訳研究者側と建設的な議論ができることを期待しています。
- 関連記事
-
-
【訃報】長尾真先生ご逝去 2021/05/27
-
JTFジャーナル記事「[Transformed]第2回:翻訳メモリの近未来」の感想 2021/04/29
-
【翻訳インターン感想】機械翻訳研究者側の学生② 2021/03/01
-
「第4回 自動翻訳シンポジウム ~自動翻訳と翻訳バンク~」に申し込みました! 2021/02/06
-
次なるAIのブレークスルーは言語分野で起きる 2020/11/29
-