Nishika AI News Letter - Issue #21
Summary
Twitterのタイムライン上ではAIによる画像生成が大流行ですが、ビジネスの現場では地道な取り組みも目立ちます。半導体大手SUMCOが全ての製造装置からデータを集め解析している点や、135万枚の医用画像から学習を行ったRadImageNetが公開され、医用画像AI研究を大きく推進することが期待されている点など、データを地道に蓄積している企業・産業が先んじて進化を遂げている点は今も昔も変わりません。(M)
Nishika AI News Letterへのご質問はこちら
※本Letterに関する質問、取り上げて欲しいトピック、自社のAI導入の相談、何でも結構です
Application
神絵を描くAI「 #Midjourney 」はどうやって生まれたか…その可能性と限界、そして課題
Twitterのタイムラインを見るとたくさんのAIによる生成画像が溢れている昨今。DALLE、そしてMidjourneyによる生成が大半ですが、Midjourneyについての試行錯誤を詳述。実はプロンプトと呼ばれる入力文の作成にコツがあり、良い画像を生成するには「プロンプトエンジニアリング」と呼ばれつつあるテクニックが必要。
半導体シリコンウエハー世界大手のSUMCOは、すべての製造装置から毎秒1万超のデータを集めて解析し、異常予知を行う。画像や音も解析の対象としている。
生産現場ではAI導入よりも前に、装置からのデータ取得環境の整備が急務である事が多く、ある意味先進的な取り組みと言える。
大成建設、ビルの「主治医」に 点検データや周辺環境を毎日「診察」 設備故障未然に防止
大型ビルなら数百カ所にのぼる日々の点検データをクラウド上で分析し、故障の兆しをつかんで対処。
第二次大戦中のユダヤ人大量虐殺の犠牲者が祖先であるか否かについて、ユーザーがアップロードした画像と米国ホロコースト記念館の写真コレクションにある顔を類似画像検索し、最も類似の高い10人の顔を返すことで犠牲者の身元特定に役立てる。
農薬の分子構造から、農作物の受粉において有益なミツバチを選択的に生存させるようなものを分類する機械学習モデルを構築。致死性があると判断した分枝のうち67-68%が実際に致死性であった。
Technology
これまでで最大規模のオープンソース言語モデル。世界250機関から1000人以上の研究者が参加するBigScience Research Workshopにて開発された。OpenAIのGPT-3やGoogleのLaMDAと異なり、オープンソースであることがポイント。GPT-3と同規模であり、46の自然言語と13のプログラミング言語で出力を生成できる。残念ながら日本語は含まれず。。。
RadImageNet: An Open Radiologic Deep Learning Research Dataset for Effective Transfer Learning
135万枚のCT, MRI, エコーの医用画像から学習を行ったRadImageNetが公開。ImageNetと比較し、RadImageNetを事前学習に使うと、甲状腺超音波検査などのタスクにおいて精度(AUC)が1〜10%上昇。