Nishika AI News Letter - Issue #18
Summary
画像生成AIの勢いが止まりません。Googleは新たにテキストから画像を生成するモデルPartiを発表しました。画像生成モデルとしては前回のLetterでDALLE-2、前々回のLetterでImagenをご紹介したばかりではありますが、生成モデルの品質を評価するFIDスコアは当然のように最高水準を更新しています。
音声翻訳のスタートアップにも注目しています。テキスト翻訳ツールとしてDeepLを使い、その恩恵に預かっている方も多いと思いますが、ついに音声から音声へ翻訳できるようになるとすると、処理速度次第ではドラえもんの「ほんやくコンニャク」もそろそろ現実的になってきているかもしれません。(M)
Nishika AI News Letterへのご質問はこちら
※本Letterに関する質問、取り上げて欲しいトピック、自社のAI導入の相談、何でも結構です
Application
ロンドンのスタートアップPapercupは、ビデオ音声を翻訳する「音声翻訳」サービスを提供。英語のビデオを入力すると、スペイン語やポルトガル語、イタリア語などの音声が吹き込まれたビデオが出力される。
ねつ造された「フェイク画像」を見抜く「ファクトチェック」の凄い最前線
直接的にAIを活用した事例ではありませんが、逆にAIを使わずともここまでいけるという例(AIは開発・運用に手が掛かるものであり、使わずとも目的を達成できるならそれが一番良い)。
ウクライナ戦争で注目を浴びたフェイク画像とそのファクトチェックですが、メタデータのチェックやinVIDというツールを活用した画像検索によって一定程度は少しの訓練で誰でも見抜けるようになる。もっとも、メタデータがない場合や撮影の角度が異なるなどの理由で画像検索で引っかからない場合もあり、その場合は現地ヒアリングも含めた泥臭い作業が行われている。
スマートニュース、国会議案データベースを無償公開 過去20年分をGitHubで
国会の過去20年分以上の議案データ約1万8000件を収集・整理しオープンデータ化。かつ、商用利用を禁止せず広く利用できるようにしている。
AIを使ったユースケースとしては議案の修正箇所特定や、議案っぽい文体への変換などがすぐ思いつきますが、そもそもオープンデータ化によって初めてさまざまなユースケースを考えるきっかけが生まれるので、素晴らしい取り組みだと思います。
今後もAIの「燃料」であるデータそのものに関するニュースも取り上げていきます。
Technology
Parti:Pathways Autoregressive Text-to-Image
Googleが新たに画像生成モデルPartiを発表。200億パラメータに達するまで生成画像の品質は上がり続けるとのこと。
Editor Picks
Expanding Our Work on Ads Fairness
米国政府がMetaに対して住宅に関する広告配信のバイアスを修正するよう要請。
なんとも微妙な話に感じます。部分的に修正しても結局いたちごっこで、本当にどんな側面から見てもバイアスをなくしたいのであれば説明変数から取り除くしかないと思います。