Nishika AI News Letter - Issue #1
突然のご連絡となる方もいらっしゃるかと思います。
この度、Nishika AI News Letterと題して、AI・データサイエンス関連の最新ニュースをビジネスパーソンの皆様向けに配信させていただくこととなりました。
AI・データサイエンス関連のニュースは、一時のブームにとどまらず、日常的に各メディアで目にするようになっています。
しかし、日常的に流れるコンテンツとなったが故に、注目して見るべきニュースはどれなのか、分かりにくくなっている実態もあると思います。
Nishikaは、「データサイエンティストとデータサイエンスで課題を解決したい人や企業が出会い、データサイエンスにより社会の課題を解決できる場を創造する」ことをビジョンに掲げています。
このNews Letterでは、数あるニュースの中で注目すべきものを取り上げ、さらに弊社データサイエンティストの見解を加えてお伝えすることで、弊社ビジョンにあるよう、データサイエンスが課題解決に資する機会を増やしていきたい、と考えております。
ご関心いただけるようでしたら、購読のほどよろしくお願いいたします。
Summary
自然言語で「こういうWebページを作りたい」と入力すると、実際にそのようなページとなるコードを生成してくれる、といった驚くべき挙動で話題になったOpenAIの汎用言語モデルGPT-3ですが、先日中国版GPT-3ともいうべきモデル Wu Dao2.0 が発表されました。
GPT-3は1750億個ものパラメータがあることも話題になりましたが、Wu Dao2.0は1.75兆個と10倍のパラメータがある、超巨大モデルとなっています。
昨年はLINEが日本語に特化した巨大言語モデルを開発することを発表しましたが、各国がGPT-3に続く状況となっており、汎用的なAIは「莫大なデータ量で殴る」のが定石となっていることが改めて実感されます。
一方で、個別ユースケースに特化したAIの開発は活発に行われています。
1700ものAIモデルを事業で活用しているFacebookは、ユースケースのショーケースのようでもあります。
また、機械学習にはHuman in the loop(HITL)、機械学習による推論に加え人間の洞察を加えてより良い効果を獲得するという考え方がありますが、本LetterではHITLがうまくできた例・できなかった例の両方を取り上げました。
国別のAIのレベルを測るThe Global AI Indexですが、こういったIndexものはお話としては面白いが実態を表しているのか?というものも多いですが、公開データを中心に相当程度定量的に評価したものであるようです。
その中で日本は16位、内訳で見るとDevelopmentで5位・Operating Environmentで43位というのは、誇るべき面も危機感を持つべき面も、真摯に受け止めるべきなのかなと感じます。
Nishika AI News Letterへのご質問はこちら
※本Letterに関する質問、取り上げて欲しいトピック、自社のAI導入の相談、何でも結構です
Application
PyTorch builds the future of AI and machine learning at Facebook
PyTorchはTensorflowと並び深層学習でよく使われる2大フレームワークですが、大元の開発元であるFacebookが、自社のAIモデルを全てPyTorchに移行することを発表しました。
まず注目すべきは1700という既に運用されているAIモデルの数で、AIの活用が、言わばエクセルと同様に、当たり前の存在となっていることが分かります。
というと「Facebookとうちは違うから・・・」とつい思ってしまいがちですが、Facebookのユースケースを見ると、自社に置き換えても十分採用可能なものもある点に注目したいところです。
記事中では以下のユースケースにAIモデルを利用していると触れられています。
Instagramのパーソナライズ
AR/VRにおける人物セグメンテーション
有害なコンテンツの認識
Text2Speech
OCR
人とAIが協働で熟練工の技を伝承する「不良予兆感知システム」トヨタ九州とトライアートが開発
鋼板に圧力をかけてパネルを成形する「プレス工程」において量産されるパネルの形状のズレ・鋼板の伸長度の差異を、サーモカメラの画像をもとに検出する技術のプレスリリースです。
サーモカメラの画像からパネルの基準形状となるマスター画像を生成するところが肝でしたが、AI単体でこの工程を完結するのではなく、大まかな形状指定を人間にさせることで目標を達成したとのこと。
もちろん完全にAIで完結できればそれでよかったのでしょうが、完全自動に固執するあまり実現したい効果を疎かにしてしまっては元も子もありません。実現可能な落とし所を見つけられたという点で、好例と言って良いと思います。
全米で導入の顔認識システム、失業手当申請を次々拒否。数か月受給できない人も
失業給付申請時の本人確認に顔認識システムを導入したが、認識がうまくいかなかった場合の対応が杜撰で問題となっている例。
これはAI導入の非常に初歩的な誤りを冒していて、教科書に載りそうな例です。精度は99.9%であることが確認できていたそうですが、0.1%の誤りが発生した場合のフローを何も考えていなかった、という話。
本Letterをお読みの皆様には釈迦に説法ではありますが、100%の精度を達成するAIは存在しません(無理に作ろうと思えば作れますが、異常検知で全てのものを異常と言ってしまえば100%見落としはない、といった無意味なものになってしまいます)。
100%の精度が必要な時は、機械だけで達成しようとするのではなく、必ず人と機械の協働作業で達成する、という基本を忘れないようにしたいものです。
Technology
China’s massive multimodal model highlights AI research gap
中国版GPT-3ともいうべきモデル Wu Dao2.0 が発表されました。
GPT-3は1750億個のパラメータがあることも話題になりましたが、Wu Dao2.0は1.75兆個と10倍のパラメータがある、超巨大モデルとなっています。
テキストの生成、画像キャプションの生成、アート画像の生成、タンパク質の3D構造予測などのユースケースを想定しています。
ちなみに先日、中国清華大に「バーチャル女子学生」が入学というニュースがあり、顔と声はこのWu Dao2.0で生成した、とのことでした。これ自体は単にニュース性を狙った取り組みですが、新技術の発表にとどまらず早速使ってみた、というところまでセットで進める点は、見習うべきと感じます。
Editor Picks
AIの各方面におけるレベルを国別に測るThe Global AI Indexで、日本は16位という結果でした。
学会への参加度・GithubリポジトリへのCommit数・特許数などの観点で評価されるDevelopmentは5位と上位に位置しており、誇るべきことですが、
データ保護の法規制整備状況・AI人材の性別面でのDiversityといった観点で評価されるOperating Environmentで43位と、かなり下位になったことが響いてこの順位となっています。
尚、AI系meetupグループのメンバー数やLinkedInでデータサイエンティストと登録している人数などの観点で評価されるTalentは28位で、人材面でもまだまだ伸び代のある状況と言えます。