Photo Gallery

人工知能学会が無料で出してくれている「AI研究初学者と異分野研究者のためのAI研究の俯瞰図」です。
https://www.ai-gakkai.or.jp/resource/aimap/

特に日本科学未来館 「みんなでつくるAIマップ」は、
利用者がどういう気持ちになるかというのを起点にした相関図なので、
身近に感じる。

感情を取り扱うAIは、データの提供だけじゃなく「利用者の気持ちに寄り添う」って部分も大事かも。

大学発技術で街の課題解決、三菱地所と落合陽一氏らが挑む実証実験の中身
https://newswitch.jp/p/28794

これ、日本人同士で健常者同士でも有用じゃない?

Preferred Networks社、京都薬科大との共同研究で、新型コロナウイルス感染症(COVID-19)治療薬のリード化合物を発見
https://www.preferred.jp/ja/news/pr20210906/

AIと私が専門分野とする医療のつながりが強くなってきたな、と思う今日この頃です。
(少し前ですが、タンパク質の構造予測を実行するAlphaFoldもそう)

人工知能AIによる日本語の記事や文章の自動テキスト生成が無料でできるサイトがありましたので、
ご紹介します。
https://playai.nu/
(良好な結果を得るには、120文字以上入力する必要があるそうです。)
AIが文章を書いたら?

試しにやってみました。
【機械翻訳エンジンが出力する訳文の質の良し悪しは、機械翻訳研究者側には判断できないため、上位翻訳者による評価が必要である。ローズ三浦は、ベテラン翻訳者の対訳データを収集して機械翻訳エンジンに学習させ、評価と改善を繰り返した。技術的には各方面の協力によって最強の機械翻訳エンジンを完成させたが、思いもよらない副作用があった。 それは、】←ここまでを人間が入力

以下、●以下の①~③はAIが作成した文章です:
●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

そんなはずはないと思っていた。人間が短時間でこれほど高性能なシステムを作ることはできないと思っていました。

自分は間違っていると思っていた。

インタビューの最後に、人間並みの精度の機械翻訳システムを作った人の話を聞いたのだ。

三浦ローズは、人間の翻訳者がインタビューを受ける会議室を見渡した。驚いたのは、その翻訳者が自分と同じ髪型、同じ容姿をしていたことだ。これは偶然ではない。

しかし、インタビューが終わると彼女は何も言わなかった。

インタビューがうまくいかなかったので、結果を確認する必要があった。彼女は2人の人間を現地に送り込み、情報を探した。ある個人が作った機械翻訳システムについての記事を見つけたのである。

その記事は、過去に機械翻訳システムが作られた後に書かれたものだった。その記事は、過去に機械翻訳システムが作られた後に書かれたもので、以前の翻訳者と同じ視力を持った人が書いたものだった。



翻訳された文章の質が大幅に向上しました。機械翻訳エンジンの出力が格段に向上しました。

機械翻訳エンジンの性能が向上したことで、翻訳文の品質も向上しています。機械翻訳エンジンは、翻訳者のチームが常に機械翻訳エンジンの品質を向上させているため、翻訳品質もさらに向上しています。しかし、機械翻訳エンジンの翻訳品質は、英語から日本語への機械翻訳エンジンにはまだ程遠いものです。

それで、その結果、現在では2種類の機械翻訳エンジンが存在することになりました。1つは翻訳者の能力だけのシステム、もう1つは翻訳者と機械翻訳の両方の能力で機械翻訳の結果を出すことができるシステムです



機械翻訳エンジンは、三浦が出力した「より速い」翻訳結果を利用して作られた。

さすがに元々の三浦の機械翻訳エンジンほどの性能はなく、本来の成果を出せないかもしれない。

“三浦と同じくらいの翻訳品質を作り出せれば、私たちの機械翻訳エンジンは世界最高の翻訳エンジンになると思いたいです”

この機械翻訳エンジンは、中国語でしか使えなかった。

三浦が出した翻訳品質は、他の人が使える翻訳品質ではない。

言い換えれば、他の人が使える翻訳品質は、三浦が作った翻訳品質ではない。

“最高の翻訳品質 “を実現する機械翻訳エンジンを作ってみよう。もし、機械翻訳エンジンが三浦のような品質を実現できるのであれば、私たちの翻訳エンジンは完璧な翻訳をすることができるということになります


●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

ヤバくないですか??

特に②の「それで、その結果、現在では2種類の機械翻訳エンジンが存在することになりました。1つは翻訳者の能力だけのシステム、もう1つは翻訳者と機械翻訳の両方の能力で機械翻訳の結果を出すことができるシステムです」
って……

怖いじゃん。

文章生成のシステムにGPT-3とか使ってるのかな?

ヒマな時にAIと交互でリレー小説書けそう。

【訃報】長尾真先生ご逝去

昨日、AAMTより、
長尾真先生がご逝去されたとのご連絡をいただきました。

私は長尾先生と関わっていたわけではなく、機械翻訳研究者でもないのですが、
喪失感を感じています。

長尾先生は日本の機械翻訳研究の第一人者であり、
日本の機械翻訳業界では天皇にも等しい存在であられたと思います。

長尾先生とは4年前、名古屋でMT Summit XVIが行われた際に少しだけ直接お話させていただきました。
私はどこの馬の骨ともわからない存在ですが、気さくにお話していただき、お名刺もいただきました。
私が翻訳者だと名乗り、機械翻訳の脅威について述べると、「機械翻訳を使って効率を上げていくしかないですね」とおっしゃっていたのが印象的でした。

長尾先生はルールベースが主流であった40年位前に用例翻訳を思い付かれておりましたが、
当時は計算機のパワーが低かったために、理論上のものにとどまっていました。
しかし、今はニューラル機械翻訳が台頭し、「教師データを学習させる」という観点で見ると、そのアイデアは用例翻訳に近いものとなっています。
今は計算機パワーが上がり、長尾先生のアイデアが実装に耐えうるものとなってきました。

ようやく時代が長尾先生に追いついた、と思います。
長尾先生がもし今現役でおられたら、おそらくシンギュラリティを起こしていたのではないでしょうか。
ようやくおもしろくなってきた時代に亡くなられ、惜しいです。

しかし、長尾先生のたくさんのお弟子さん達(いわゆる「長尾組」)が日本中の機械翻訳組織の長や重要な役職に就かれ、活躍されていますので、
長尾先生のご遺志は次世代に引き継がれたと思います。

研究者ではない私にできるのは機械翻訳の教師データ提供や、機械翻訳の評価の部分ですので、
微力ながらその部分で貢献していきたいと思います。

なお、故人のご遺志により、通夜並びに告別式は家族葬にて既に執り行われており、
ご香典・ご供花・ご弔電などは固くご辞退されるとのことです。

心よりお悔やみ申し上げます。

エッジ・トランスレーション
代表 三浦由起子


JTFジャーナル記事「[Transformed]第2回:翻訳メモリの近未来」を拝読しました。
Transformed.jpg

これ、
LSP(Language Service Provider。翻訳会社より広義)から、
機械翻訳に翻訳メモリを活用するアダプテーション担当者が、
企業さんごとに1人付けばいいんじゃないの、と思いました。
【※個人の感想です】

翻訳インターンを修了した機械翻訳研究者側の学生(前回とは別の学生)から、
感想をいただきました。

==================

受講感想ですが、月1回の文量としては学業に支障のない範囲で取り組める量で色々学べたので良かったです。特に一定のフォーマットを持った文章を翻訳するという経験は
学校教育の中でもあまりない経験でしたので為になりました。また、数値周りの表現(今回ですと「1日yy回xxx mg 投与群」の部分など)は日常英会話等では学ぶ機会が
少ない一方、英語論文を執筆する際には必要になるため、勉強の必要性を感じました。

機械翻訳にどのように活かせそうかですが、現状の機械翻訳は文書から文単位で抜き出して学習データとしているものが主流なので、このインターンのように全体のフォーマットを
考慮しつつ翻訳する場合に弱いというのがわかりました。既存の文書単位で翻訳する研究を更に発展させるか、あるいは翻訳メモリのような定形表現の翻訳に使える手法を
ニューラルネットワークに組み込む必要があると思います。あるいは、手法は既存のものを用いて精度を向上させたいとなると、翻訳させたいドメインの文書をとにかく大量に
用意する必要性が高いでしょう。一般的な大規模コーパスからは分野に固有の定形表現や固有名詞は学習できないと思うからです。

==================

こういう機械翻訳研究者側の知見を得られることは、非常に有益ですね。
(あと学生だから若いし頭が柔らかいから、
機械翻訳の精度を向上させる斬新な発想ややり方を思い付いてくれるかも、という期待もあります。)


別件ですが、3/19のNLP2021ワークショップ「文章の評価と品質推定〜人間・機械の「作文」の巧拙をどう見極めるか?〜」では、
グループディスカッションもあるみたいなので、楽しみです。
私はNLP2021のシルバースポンサーですし、このワークショップのグループディスカッションにも参加予定です。

機械翻訳研究者側と建設的な議論ができることを期待しています。

NICT主催の「第4回 自動翻訳シンポジウム ~自動翻訳と翻訳バンク~」が、
3/16にオンライン配信(ZoomおよびYouTubeライブでの配信)で行われます。

ただし、NLP2021の開催期間中(3/15~19)なので、
カブっちゃいますね。。

なんでみんなイベントをカブらすの?
(数年前もNLPとJTF関西セミナーがカブっており、
その時は両方現地会場っだったので、
名古屋→大阪に物理的に移動するのが大変だった。。)

対策として、
「第4回 自動翻訳シンポジウム ~自動翻訳と翻訳バンク~」の方は、zoomとYouTubeライブの両方でやるらしいので、
私はNLP2021はzoom、自動翻訳シンポジウムはYouTubeライブで同時に拝聴する予定です。

聖徳太子かよ! ٩(๑`^´๑)۶

OpenAIが開発した文章生成AI「GPT-3」の仕組みや、その応用例について、
数式なしでわかりやすく説明してくださっている良記事なので、
ご紹介いたします。

次なるAIのブレークスルーは言語分野で起きる
https://www.dhbr.net/articles/-/7225

>別の人物がつくったアプリは、意図的に難易度を高くした医学上の問いに正しく回答し、根底にある生物学的メカニズムを論じることができる。
>具体的には、そのアプリに10歳の男の子の呼吸器に関する症状を示し、その子どもが閉塞性呼吸器疾患と診断されて、投薬治療を受けたという情報を与えた。そのうえで、「治療に使われた薬品はどの受容体に作用する可能性が高いと思うか」という問いに答えさせた。
>すると、プログラムはこの問いに対して正しい回答を導き出し、その子どもが喘息を患っていて、一般的にはその受容体に作用する気管支拡張薬で治療されることを指摘できた。

これすごいな……
てか、もう怖いレベルですね……

>このように、文章作成、コーディング、サイエンスの領域にまたがって一般的推論を行う能力があることを考えると、このテクノロジーはジャンルを超えて、マネジメント、データサイエンス、物理学、生命科学など幅広い領域で活用できる可能性がある。

そのうち世の中がGPT-3が書いた文章だらけになって、
人類が乗っ取られちゃうんじゃないか
と思っちゃいますね。。

エッジ・トランスレーションは、
2019年に続き、
言語処理学会第27回年次大会(NLP2021)のシルバースポンサーになりました。
NLP2021シルバースポンサー

オンライン懇親会にも参加予定ですので、 よろしくお願いいたします。

エッジ・トランスレーション 代表
三浦由起子

WHAT'S NEW?