Nishika AI News Letter - Issue #13
Summary
モノタロウさんの、機械学習を現場に導入する際の出来事は、情景が目に浮かぶようです。「結果の解釈が難しい」問題の解決策は「説明可能なAIの導入」ではないというのは共感される方も多いのではないかと思います。
テキストを入力すると画像を生成するDALL-EのupdateもOpenAIから発表されました。公式動画中では「税金を支払う猿」を自然な画像で出力するといった例が示されていて面白いですが、短いテキストから画像を生成するだけでなく、ストーリーのある文章から動画を生成するまでになると、コンテンツ産業への影響も大きくなりそうです。(M)
Nishika AI News Letterへのご質問はこちら
※本Letterに関する質問、取り上げて欲しいトピック、自社のAI導入の相談、何でも結構です
Application
That smiling LinkedIn profile face might be a computer-generated fake
LinkedIn上にGANで生成された顔画像の偽営業担当者アカウントが1000以上発見された、と言う話。尚、使い方としてはこのアカウントから定型文でターゲットにアプローチし、返信があればそこから実際の担当者が対応するという仕組みの模様。
こういったアカウントには画像にも一定の特徴がある他、AmazonやSalesforceなどいかにもな大企業の勤務歴がある割に職務内容が薄い、といった分かりやすい特徴もあるようですが、長い目ではこう言った特徴すらも洗練されていき、判別が難しくなりそうです。
あえて予測の更新頻度を落とす| サプライチェーンの現場目線にたった機械学習の導入
機械学習を現場に導入する際に起きた問題点とその対策。特に2点目の結果の解釈の問題が学びが大きく、深掘りして現場のニーズを紐解いてみると「需要予測の仕組みそのものを知りたいのではなく、何かトラブルが起きたときの具体的な調査・対応方法を知りたい」ことが分かったと言う話。現場は所謂XAI(説明可能なAI)を求めているわけではない、というのが学びです。
Technology
テキストから見事な画像を生成してくれるDALL-Eのupdate、DALL-E-2をOpenAIが発表。画像の一部をテキストによる指示を与えて書き換える"inpainting"機能を実装。以下の公式動画では、万能ではなく、ミスラベルや学習データがないことによる限界も丁寧に説明している。
Editor Picks
Gartnerが発表した2022年の戦略的テクノロジートレンドの中で、GenerativeAIが取り上げられています。以前とりあげたテキストを生成するGPT-3や、本日のLetterでとりあげたテキストから画像を生成するDALL-E-2など、確かに生成系のAIはホットなトピック、かつ既に一般ユーザーが手元で使える状態までは来ていて、これから産業化していく段階だと思います。
一方で、個人的にはPrivacy-Enhancing Computationも気になります。データを秘匿化して機械学習を行う秘密計算や、学習データにノイズを与えることで個人の特定可能性を排除する差分プライバシーを活用した機械学習などは既に利用可能となっており、具体的なニーズが存在するという意味ではGenerativeAIより有望な領域かもしれません。