Nishika AI News Letter - Issue #8
Summary
GAFAやDeepMind, OpenAIといった著名なAI企業が今どういう技術領域に注目しているのかを1記事で把握したければ、Big Tech & Their Favourite Deep Learning Techniques が必読です。とはいえ、記事を読むのも時間がない!という方向けにキーワードだけ羅列しておくと、DeepMindは強化学習、OpenAIは巨大言語モデル、Facebookは自己教師あり学習、GoogleはAutoML、Appleは連合学習、Amazonは転移学習、IBMは量子機械学習、です。こうしてみると、各AI企業の方向性にはしっかり色があることがわかります。
国産の事例では、化学プラントの運転のAI化が面白いです。技術的に新規性はないのですが、深層学習と強化学習が1つのユースケースで併せ活用されています。ディープラーニングで○○を予測/分類しました!というシンプルな事例は(極々当たり前になったという意味で)古くなった、と感じます。(M)
Nishika AI News Letterへのご質問はこちら
※本Letterに関する質問、取り上げて欲しいトピック、自社のAI導入の相談、何でも結構です
Application
一見してとても新規性のあるという事例ではないですが、様々な要素技術を1つのユースケースに入れ込んでおり面白いという観点からPick。化学プラントの運転をAI化するという話。
単純な現象が起こっている蒸留塔では、ディープラーニングによって構築した状態予測モデルを活用し、実体をデジタル空間上に再現したシミュレーション環境を作成。シミュレーション環境上で探索した制御パラメータが、実用でも効果を発揮することを確認。
さらに、より複雑な現象が起こっている反応塔では、ディープラーニングだけでは不十分だったが、人間の操作履歴を元に強化学習を行う模倣学習により、シミュレーション環境の作成に至った。
ディープラーニング&強化学習(模倣学習)の実用事例。これからのAIは複数技術の掛け合わせになっていきますね。
その個人情報はうそか本当か、AIが判定 4種類のうそのつき方が明らかに
オンライン上で収集された個人情報の真偽をAIにより判定したというトピック。約89%の精度で真偽判定できた。また、ユーザーは真実を隠すため、主に4つの方法を用いてプライバシーを保護することが分かったとのこと。嘘を書く時は一定の傾向がある、ということですね。
個人情報を騙った偽の情報は、個人情報保護の観点ではむしろ積極的に導入されていて、人工的に生成した個人情報をまぶすことで個人の特定可能性を下げるために使われています。しかし、個人情報を活用する側からすると当然偽のデータは除きたいというモチベーションがあります。
事例としては面白く、商品レビューのサクラチェックなどにも適用できそうな汎用性も感じられますが、正誤データを収集するのが最大の壁になりそうです。
Efficient and targeted COVID-19 border testing via reinforcement learning
海外からの渡航者に対するCOVID-19の検査について、利用可能な検査方法や検査可能数に制限がある中で、その割り当て方法をどう決定するかについて。
現在最も一般的である、渡航者の出身国によって決定する方法よりも、年齢、性別、出身国、国内の地域などの出入国書類のデータに基づいてAIが決定した方法がより効果的であったという話。
ギリシャでは昨年、入国希望者の17%をカバーする程度の検査数しか提供できていなかったが、AIを活用しリスクの高い入国者を特定し検査を行なっていた。ランダム検査と比較して、旅行シーズンのピーク時(8月、9月)には4倍、ピーク時以外には1.85倍の感染者を特定できたとのこと。
Technology
New Trends in Quantum Machine Learning という、量子機械学習に関するサーベイ論文の日本語解説記事。arxivなので正式に採択された論文ではないことを念頭に置く必要がありますが、IBMも昨今注力する先端領域について触れておくのは、意味があると思います。
詳細な解説は記事に譲るとして、ビジネスパーソンとしては、「データもしくはアルゴリズムが量子的であるものを量子機械学習と呼ぶ」という定義は覚えておくべきでしょう。
「量子的である」というのは、電気が流れているか否かによって表現する0 or 1の状態ではなく、量子力学の特性を活用して表現する0でも1でもある状態(これが直感的ではないのが量子力学の難しく感じられるところ)のことで、そのような量子力学の特性を活用した機械学習を行なっていれば、それを量子機械学習と呼んでいます。
また、現時点では古典的な機械学習と比較して、高い性能を示せておらず、必要とするリソースも希少である(コストが高い)ことも認識しておく必要があります。
Editor Picks
Big Tech & Their Favourite Deep Learning Techniques
著名AI企業が注力している技術領域がわかりやすくまとめられており、一読の価値があります。
DeepMindは強化学習、OpenAIは巨大言語モデル、Facebookは自己教師あり学習、GoogleはAutoML、Appleは連合学習、Amazonは転移学習、IBMは量子機械学習。ちょっとMicroSoftだけ表現し難いのですが、LightGBMという最も多くのデータサイエンティストが利用している?機械学習ライブラリを提供してくれている企業でもあり、データサイエンスの裾野を広げる役割を担ってくれているとも思います。