Nishika AI News Letter - Issue #56
2023年、最後のNishika AI News Letterです。徐々に仕事納めに入っていらっしゃる方もおられるかと思います。本年もお疲れ様でした。
今年は生成AIが席巻した年でしたが、実はChatGPTが公開されたのは2022年11月30日でまだ1年ほどしか経っていない、と聞くと驚く方もいらっしゃるのではないでしょうか。生成AIは大規模「言語」モデルとして登場しましたが、今年の後半には画像も含めたマルチモーダルな対話が可能なGPT-4V、Geminiが登場し、来年は音声、動画、匂い?などとマルチモーダルの領域が広がっていくことが想像されます。
2015年に「AIが人間の仕事の49%を奪う」というレポートが野村総研・オックスフォード大学から提示され、そこから数年が経ち、いよいよ本当にAIが人間の仕事を代替してきた実感があります。本稿では、プロンプトインジェクションによって人間ならあり得ない挙動を生成AIがしてしまったニュースをPickしています。人間こそが担える役割は確実に存在すると言えますが、今やっている仕事はAIでできる仕事なのでは?という目線を持つことは喫緊で重要と言える状況になりました。
先日のM1で優勝された令和ロマンの松井ケムリさんは、芸人になりたいと父親に伝えた際「AIにできない仕事だから良いんじゃないか」と言われたそうです。同様の目線を持った(かっこよくて)視座の高い人間になっていきたいものです。
Nishikaは、人間「にしか」できない仕事をしていく世界の実現に向けて、生成AIを活用したシステムの開発はもちろん、生成AIと共存した人間の体験開発にも力を入れています。生成AIの発展を追いかけるのも大切ですが、生成AIの発展に連れて人間の働き方を変えていくことも必要です。そんな働き方を我々も提示していきます。
来年もどうぞよろしくお願いいたします。良いお年をお迎えくださいませ。
Promotion
弊社ではオンプレミスAIソフトウェア “SecureMemo” を提供していますが、SecureMemoの音声認識・話者特定の精度の高さをご評価いただくお客様の声が多いことから、SecureMemoのクラウド版と言える “SecureMemoCloud” のリリースを決定し、無償トライアル版を公開いたしました!
単なるSecureMemoのクラウド移植版ではなく、会議録の特性に特化したAI要約機能も付加している点も特徴です。
無償でお試しいただけますので、こちらで是非その精度を体感ください!
Nishikaは、世界最高水準の精度94.7%のAIを搭載しつつ、オフライン環境で処理が完結するAI文字起こしソフトウェア “SecureMemo” を提供しております!
「精度の圧倒的な高さ」「オフライン完結」の2つを両立しているサービスは他になく、医療機関・警察・民間企業の経営企画/IR/人事部門様といったところから引き合いをいただいています。
音声認識AIとしてOpenAI Whisperを搭載、オリジナルWhisper由来のバグ修正など実用可能な水準に改修した上でご提供しています。
さらに、独自開発した完全自動の話者特定AIも搭載しています。
ご関心あれば、是非お声がけください!
ChatGPTの使い方について、とても追いきれないほどの速さで日々報告がされる中、結局ビジネスで使える使い方は何なのか?とお考えの企業の皆様向けに、ChatGPT研修を提供することとしました!
ChatGPTの基本原理から、有用性だけではなく把握しておくべき危険性、業務で効果を生み出す活用方法までお伝えした上で、ワークショップ形式でお客様自身にとって有益なChatGPTの使い方を編み出すプログラムです。
弊社が実際に日々行なっている活用方法をお伝えしたり、コンペを通じて蓄積した危険性に関する知見をお伝えするなど、弊社独自の実践的コンテンツとなっております。
ご関心あれば、是非お声がけください!
Nishikaがデータ分析コンペティションを通じて蓄積した画像検索AIに関する知見をもとに開発した、最高水準の精度を誇るEC向け画像検索AI「Nishika Image Finder」をリリースいたしました!
約50万件の商品をお持ちのあるEC事業者様のデータを活用した検証にて、MRR (Mean Reciprocal Rank), Recallのいずれの指標でも、GoogleのVision API Product Searchの水準を10ポイント近く上回りました。
Application
【悲報】ChatGPTが新車を1ドルで勝手に売ってくる事案が発生
カリフォルニアのシボレー販売店で導入された顧客対応目的のChatGPTが、プロンプトインジェクションによって多大な特典を約束したり、新車を1ドルで売る決断をしてしまったという例。
法的拘束力はないように思うので金銭的な実害はなさそうだが、レピュテーション面では生成AIチャットを2Cに提供する企業は見逃せない事例。
ユーザーが客とマネージャーの一人二役を演じることで、通常のユーザーからのリクエストに対して出しえない回答を出させたというテクニックが、(正しい使い方をするのであれば)参考になります。
プロンプトインジェクション対策は種々議論されていますが、100%攻撃を阻止するには利便性を損ねざるを得ず、何を言われても揺るぎない常識をもとに回答する人間の価値を感じるトピックでもあります。
NEC、映像認識AI×LLMにより、動画から説明文章を自動生成する技術を、世界で初めて開発
映像認識AIで動画中に何があるか・何が起こっているかを分析、分析した結果を参照させながらLLMと対話するシステムを提案。
事前に対象分野の映像を使ったLLMのファインチューニングが必要ということで、Zero-shot or Few-shotで実用できるLLMの良さをそのまま活かしてというわけではなさそうだが、映像認識×大規模言語モデルの組み合わせは応用範囲が広い。
「正答率62.5%→94.1%」に改善も...三豊市 “チャットGPT” を使ったゴミ出し案内 実証実験の結果、導入を断念【香川】
東大松尾研がPoCで開発していた、ゴミの分別方法について回答するGPTを活用したチャットシステムの精度が、目標としていた99%に届かず本格導入を断念、というニュース。
ゴミに出されるものはそれこそ無限にあり、それが何かわからなくてもWebで検索して新しい知識を入れ、どの分別か特定して回答できる時点で画期的なAIシステムですし、かつ精度94.1%という高い水準に達したのも素晴らしいと思いますが、目標が99%、つまり「原則間違ってはいけない」という無謀な水準だったことが話題になっています。
「確率的な挙動をするAIを活用しているのに目標設定がおかしい」「PoCなので別にそういう結末もあるでしょ」など様々な意見が寄せられていますが、94.1%の精度でゴミの分別方法について回答できるシステムというのは大変に有用だし、そもそもこのシステムがない状態でどれだけ正確にゴミ出しがされてきたのか?という話ですので、なんとかどこかの機会で活用されてほしいと感じます。
Technology
3DAxiesPrompts: Unleashing the 3D Spatial Task Capabilities of GPT-4V
画像理解を行うGPT、GPT-4Vに対するプロンプト技術の報告。3Dの物体画像について、3次元座標系を描き足すだけで空間認識能力が向上するとの実験結果。実用性がありそうな研究。
Editor Picks
78%の精度で生涯年収と死亡時期を予想できる「運命計算機」を開発
デンマークにて、国民約600万人分のデータを学習させることで、人の生涯年収や死亡時期を78%の精度で予測できるモデル「life2vec」が開発できたとのこと。
記事によれば、保険の契約は雇用の決定にlife2vecを活用することは違法となるとのことですが、保険会社のデータサイエンス部隊は興味津々のトピックと思われる。
自分では如何ともし難い変数(性別とか)以外の説明変数を知りたいところです。
プロ驚き屋AIをチームのSlackに招待しタイムラインを荒らす
最後に、年末のお時間のあるときにどうぞ、という柔めのトピックをPickして終わりたいと思います。
X(旧Twitter)のタイムラインでは、目まぐるしく日々発表されるAI関連のニュースに「これはすごい!」と驚く投稿がインプレッションを集めており、一部からは「技術的な正しい理解もなくただ驚いている」という意味で「プロ驚き屋」と揶揄されています。
プロ驚き屋に対して(かなり)批判的な意見を持つ本記事の作成者が、プロ驚き屋を模倣した発言を生成AIにさせ、XだけでなくSlackなどのコミュニティ内チャットにプロ驚き屋を召喚する、という遊びをしています。AWS上でのアプリ開発方法や、安易な驚きに対して怒るのではなくアンガーマネジメントの考えに則って冷静になるよう呼びかけるプロンプト検討までされていて、なかなか面白いです。
翻って「驚き」投稿ですが、私は悪いことばかりではないかな、と思っています。情報が氾濫している中で、最先端の情報をある程度キュレートして教えてくれる存在は有益とも言えます。
実際のところは悪影響もあって、得た情報の正しさを1つ1つ吟味する時間もないので、半信半疑でも一旦は信じてみて、後でがっかり、ということはあります。ただ、後で実態が分かって裏切られても良い、新しい技術の進捗に乗り遅れるよりはマシ、と捉えることができれば、「驚き」のメリットをデメリットより大きく享受できるのではないかと思います。