Nishika AI News Letter - Issue #12
Summary
ヤフーさんの名寄せ作業を自動化する取り組みは非常に普遍的なテーマで、かつユースケースごとに個別の名寄せニーズがあることから非常にホットなテーマです。
Googleマップの情報更新を機械学習で行っている話は、データ量的に当然かなりの割合で自動更新されているはずだがどう更新しているのかと思っていましたが、その詳細はかなり驚きました。
化学兵器をAIで設計する研究は、毒性を回避する研究の逆転の発想ですが、公開データから学習可能という点が怖いですね。。。(M)
Nishika AI News Letterへのご質問はこちら
※本Letterに関する質問、取り上げて欲しいトピック、自社のAI導入の相談、何でも結構です
Application
BERTとベクトル検索を用いたYahoo!ショッピングの製品名寄せ作業の効率化検証
Yahooショッピングにおける製品名の名寄せを自動化する取り組み(例:「CHANEL アリュール オム スポーツ オードゥ トワレット (ヴァポリザター) 50ml 男性用香水、フレグランス」と「シャネル アリュールオム スポーツ 100ml EDT 香水 フレグランス 男性用香水、フレグランス」を同一製品として紐付ける)。弊社コンペで開発された類似画像検索技術のテキスト版。
名寄せニーズはとても普遍的なので、非常に応用範囲が広いテーマ。
グーグル、AIと画像技術で「Googleマップ」の情報を最新に保つ方法を明かす
グーグルが、営業時間が最新でないことを自動的に識別する機械学習モデルを開発したと言うニュース。「ビジネスオーナーが最後にプロフィールを更新した日付や、他店舗の営業時間、お店が混雑する時間帯などの複数の要因を考慮し、営業時間が正しく更新されていないことを自動的に検出する」ということで、ここまでやっているとは驚きです。
動物の動画から3Dアニメーションを作成。人工データを教師データに機械学習している。アニメーション制作はかなりの工数がかかっている領域で、効率化の恩恵が大きい。
Technology
evolutionary model of variant effect (EVE)
病気を引き起こす遺伝子の変異を教師なし学習(VAE)で特定。教師あり学習をAUCで凌駕。ただ本来AUC0.9(AUCは判別能を示す指標、ランダムで0.5で最大値が1)に達するような簡単なタスクではないようには思えます。
Dual use of artificial-intelligence-powered drug discovery
化学兵器をAIで設計。これまで毒性を回避するような学習をしていたが、逆に毒性を目的変数に最大化するように分子構造を探索してみている。"We trained the AI with molecules from a public database"が怖い。
Editor Picks
INDIGENOUS KNOWLEDGE GRAPH (IKG)
少数民族のナレッジグラフを作り理解に役立てる取り組み。具体的には画像アノテーションを少数民族の目で改めてやり直してもらう。専門家ドメイン知識で学習させたAI活用もそうだが、誰でもできることをさせるよりごく一部の人ができることをAIにさせた方が価値が高い。