Nishika AI News Letter - Issue #16
Summary
勢い余って冒頭に画像を貼ってしまいましたが、今回のAI News Letterのハイライトはやはり、新たな画像生成モデル、Googleの発表したImagenです。純粋なアートとして見ても、「雪の上で空手の帯を巻いたドラゴンフルーツ」など人間には容易に描けそうもないものも多く、AIならではの作品が生み出されているなと感じます。あまりに見事なアウトプットで、フェイクニュースやポルノへの利用を懸念して一般利用を一旦差し止めているのも納得です。
画像生成に先んじて実用化が進んでいるテキスト生成についてもいくつか事例を取り上げました。Webコンテンツや広告コンテンツを生成するAIは既に米国で多くの人に使われており、日本でも求人原稿の生成にAIを利用する研究がスタートしました。GPT-3はじめ基盤技術の利用には決して安くはない費用がかかりますが、実用のボリュームの急拡大に伴って費用が逓減していくことが期待されます。(M)
Nishika AI News Letterへのご質問はこちら
※本Letterに関する質問、取り上げて欲しいトピック、自社のAI導入の相談、何でも結構です
Application
A Face Search Engine Anyone Can Use Is Alarmingly Accurate
PimEyesという顔画像検索サービスの是非についての記事。
「個々の顔画像を保存しているわけではなく、個々の画像のURLを保存しているだけなのでプライバシーの規制の対象にならない」という主張はその通りとも思うが、もし顔画像の特徴量を抽出して保存していたらそれはプライバシー情報に相当するとも思われる。グレーなライン。
Gas Prices Are High—Does the Popular App Upside Save Money?
Upsideは、GS、食料品店、レストランと連携し、ユーザーの位置情報、過去の購入履歴などの匿名化情報を基に計算した金額をキャッシュバックするアプリを提供。
メルペイ後払いの与信額の件と言い、非常に明示的な形で顧客を区別するのが当たり前になってきていますね。
ここからGPT-3による文書生成アプリケーションを2つ。
ContentEdgeは、GPT-3を利用してWebコンテンツの生成をSEO最適化したキーワードを盛り込んだ形で行うもの。
Jasperは、Facebook広告文などマーケティング系のコンテンツを自動生成。「プロフェッショナル」などと口調を指定することでその人っぽい文章を生成。
ちなみにいずれのサービスでも、GPT-3が学習した文章そのままを出力している場合そのまま使うとまずいので、学習データと完全一致しているかをチェックする機能を備えている。
Technology
テキストから画像を生成するモデルとして新たにGoogleから発表。論文はこちらだが、生成モデルの品質を評価するFIDスコアで従来のモデル(先んじて画像生成で驚くような結果を示し、最近updateが発表されたOpenAIのDALL-E 2含む)を凌駕。
ただし、フェイクニュースやポルノへの悪用を懸念し、現状では一般利用が可能な形での公開はしていない。悪用の可能性がある画像の出力が懸念される背景には、DALL-Eでは学習データから除いていたような不適切な画像を、あえて含んだデータセットで学習しているということがある。
キーワードから約6秒で文章生成する執筆AI、“求人原稿の自動作成”へ開発元がマイナビと実証実験
求人原稿のAIによる生成。異なる領域ですが、大量のソースコードから学習したプログラムコードを生成するGitHub Copilotが非常に高い有用性を示している中で、そのアナロジーで考えれば、マイナビさんの大量のデータソースをもってすればうまくいくように思います。
呼気の成分から個人を識別するという面白い手法。ただし「空腹状態の20人を対象とした。呼気に含まれる水分を除き、吹きかけ方などを統一した上で、97%以上の精度」ということで、個人認証としての実用はこれから。