Nishika AI News Letter - Issue #44
生成AIの登場で、当然ながら生成AI自身が脚光が浴びている一方で、「生成AIの登場が他のAIの成長にも大きな影響を与えている」点には注目したいです。AIの教師データで、これまでかなりの費用をかけてクラウドワーカーに作成を依頼する必要があったものでも、生成AIを使うことで量産することができるためです。
実際には、人間が作成した教師データと同等の性能を達成できるかは場合によりますし、生成AIへの指示を気をつけないと偏った教師データが作られてしまうなど留意点はあるものの、従来のAIの変化にもぜひ注目して見ていただければと思います。
Promotion
Nishikaがデータ分析コンペティションを通じて蓄積した画像検索AIに関する知見をもとに開発した、最高水準の精度を誇るEC向け画像検索AI「Nishika Image Finder」をリリースいたしました!
約50万件の商品をお持ちのあるEC事業者様のデータを活用した検証にて、MRR (Mean Reciprocal Rank), Recallのいずれの指標でも、GoogleのVision API Product Searchの水準を10ポイント近く上回りました。
AI News Letterでは各社の提供する最先端AIをご紹介し続けていますが、News Letter中でも何度か取り上げている、音声認識AI OpenAI Whisperを搭載したソフトウェア “SecureMemo” をリリースいたしました!
Whisperを搭載・チューニングし、名実ともに世界最高水準の精度を示しながら、オンプレミス・オフライン環境で利用可能でありセキュアな用途に有用な点が特徴です。
ChatGPTの使い方について、とても追いきれないほどの速さで日々報告がされる中、結局ビジネスで使える使い方は何なのか?とお考えの企業の皆様向けに、ChatGPT研修を提供することとしました!
ChatGPTの基本原理から、有用性だけではなく把握しておくべき危険性、業務で効果を生み出す活用方法までお伝えした上で、ワークショップ形式でお客様自身にとって有益なChatGPTの使い方を編み出すプログラムです。
弊社が実際に日々行なっている活用方法をお伝えしたり、コンペを通じて蓄積した危険性に関する知見をお伝えするなど、弊社独自の実践的コンテンツとなっております。
ご関心あれば、是非お声がけください!
Application
大規模言語モデルを使って自動車走行時の状況説明をさせてみる? -社内LLMハッカソン記-
視覚情報を認識するモデルと大規模言語モデルを組み合わせて、「自動車走行時の特に危険な状況を説明することができないか?」という課題に取り組んだ例。LLMは現状では入力はテキストである必要があるので、画像からテキスト情報を抽出して、LLMに受け渡す方法としてImage2Paragraphというリポジトリの画像キャプショニングの手法を採用しています。
結果、LLMは交通状況を一定理解できたものの、画像・テキストを経由することでコンテキストが失われている(実際の走行データは動画であるため)、人が危険と思う状況を認識しきれていない(LLMが人間の常識を持ちきれていない)といった課題が明らかになっています。課題のレベルが高くなっており、逆に実用までの距離が短くなってきたとも言えると思います。
神戸市、“庁内版ChatGPT”を内製 利用スタート 個人情報の扱いは?
パナソニックなどの民間企業における法人内ChatGPTの活用例は続々と報告されていますが、地方自治体として初めて、神戸市がChatGPT環境を内製したというニュース。地方自治体の意思決定プロセスの重たさ(通常、予算確保に動いた年の翌年に取り組みを実行できる)を考えると、素晴らしい意思決定スピードの速さ。
LayerX社におけるLLMの取り組み事例・取り組み姿勢。p14にある “Chat is not all you need”, Chat UIが常に最適解ではないはず、という考えは常に意識すべきところ。例えばChatGPTの真価は「XXXに関する情報を抽出して」といった情報の抽出にあるのではないか、という考えも個人的には持っており、忘れてはいけない論点。
Technology
High-resolution image reconstruction with latent diffusion models from human brain activity
人間の脳のfMRIスキャンから視覚画像を再現する研究の1つだが、Stable Diffusionを利用している点に注目。通常Stable Diffusionはテキストを入力とし画像を生成するが、本研究ではfMRIスキャンで得られたニューロンの活動情報から、入力となるテキストと画像を生成するように学習を行い、Stable Diffusionに与えて、視覚画像を再現している。
Editor Picks
クラウドワーカーとのマッチングサービスであるAmazon Mechanical Turkでワーカーによって提供された医学研究の要約の中で、ChatGPTによって生成された形跡があるものが多く発見されたというもの。サンプル数も少ないので「多い」とまで言えるかはともかく、クラウドソーシングサービスで十分起こり得る(既に起こっている?)現象です。
しかし、当然ながらこの流れは悪いことではないと考えます。例えばAIの教師データで、これまでかなりの費用をかけてクラウドワーカーに作成を依頼する必要があったものでも、生成AIを使うことで量産することができます。
人間が作成した教師データと同等の性能を達成できるかは場合によりますし、生成AIへの指示を気をつけないと偏った教師データが作られてしまいますが、「生成AIの登場が他のAIの成長にも大きな影響を与えている」点には注目したいです。
生成AI対策で監査・認証制度、政府検討へ…開発・提供者の透明性向上図る
生成AIについて、AIの開発者・提供者の透明性向上のため第三者の監査や認証制度の導入が政府により検討されているとのこと。これまでのAIにはなかった制度であり、生成AIが与えるインパクトがこれまでとは次元が違う、と捉えられていることが改めて分かります。一方で、一般にこのような制度の導入は中小プレイヤーの参入障壁を高くするもので、AI界隈においては企業体力のあるプレイヤーに存在感が集中する、という現象が加速しそうです。