Nishika AI News Letter - Issue #51
100kという大きな入力token数で注目されるClaudeの日本展開は注目。生成AIの世界ではOpenAIが圧倒的で、GPT-4, DALL-E 3, Whisperと各データにおけるトップランナーと言える生成AIは全てOpenAIが出しているという現状ですが、健全な競争のために是非Claudeには頑張ってもらいたいところです。
プロンプトを工夫したフレームワークでLLMを特定領域に活用しようという試みも増えてきている印象です。精神療法に活用する例などをとりあげています。
Promotion
弊社ではオンプレミスAIソフトウェア “SecureMemo” を提供していますが、SecureMemoの音声認識・話者特定の精度の高さをご評価いただくお客様の声が多いことから、SecureMemoのクラウド版と言える “SecureMemoCloud” のリリースを決定し、無償トライアル版を公開いたしました!
単なるSecureMemoのクラウド移植版ではなく、会議録の特性に特化したAI要約機能も付加している点も特徴です。
無償でお試しいただけますので、こちらで是非その精度を体感ください!
Nishikaは、世界最高水準のAIを搭載しつつ、オンプレミス・オフライン環境で動作するAI文字起こしソフトウェア “SecureMemo” を提供しております!
音声認識AIとしてOpenAI Whisperを搭載、オリジナルWhisper由来のバグ修正など実用可能な水準に改修した上でご提供しています。さらに、独自開発した話者特定AIも搭載しています。
ChatGPTの使い方について、とても追いきれないほどの速さで日々報告がされる中、結局ビジネスで使える使い方は何なのか?とお考えの企業の皆様向けに、ChatGPT研修を提供することとしました!
ChatGPTの基本原理から、有用性だけではなく把握しておくべき危険性、業務で効果を生み出す活用方法までお伝えした上で、ワークショップ形式でお客様自身にとって有益なChatGPTの使い方を編み出すプログラムです。
弊社が実際に日々行なっている活用方法をお伝えしたり、コンペを通じて蓄積した危険性に関する知見をお伝えするなど、弊社独自の実践的コンテンツとなっております。
ご関心あれば、是非お声がけください!
Nishikaがデータ分析コンペティションを通じて蓄積した画像検索AIに関する知見をもとに開発した、最高水準の精度を誇るEC向け画像検索AI「Nishika Image Finder」をリリースいたしました!
約50万件の商品をお持ちのあるEC事業者様のデータを活用した検証にて、MRR (Mean Reciprocal Rank), Recallのいずれの指標でも、GoogleのVision API Product Searchの水準を10ポイント近く上回りました。
Application
OpenAIのChatGPT対抗一番手と言えるAnthropicのClaudeですが、日本含む95カ国で利用可能となったとのニュース。みなさん、是非使ってみましょう。
以前からClaudeにおいて注目されてきた特徴が、入力トークン数の多さ。GPTが高々32kであるのに対し、100kものトークン数に対応しており、要約など大量のテキストを入力することが想定される用途での価値が注目されています。
精神療法の領域でのAI活用の一環として、生成AIによって「認知の歪み」を診断する「Diagnosis of Thought (DoT)」というフレームワーク。生成AIが、ユーザーの説明の中で事実・主観を選別し、ユーザーの考えに影響を与える「認知の歪み」を見出すというもの。
Teaching Large Language Models to Self-Debug
LLMがコードを生成できるのはよく知られていますが、それに自己デバッグ機能を追加するフレームワークの提案。かなりシンプルなプロンプトであり、「生成した**が何をするか説明して」「生成した**は正確ですか?不正確であれば、何が問題か説明して」と聞くことでデバッグになるというもの。
LLMは「光の速さで自分の意見を変える」特徴があり笑、まあ良い面も悪い面もありますが、ここではその特徴をデバッグには有用であると捉えている点が注目です。
メルカリ、生成AI・LLMを活用してお客さまの最適な行動を促す「メルカリAIアシスト」の提供を開始
メルカリとして初めて、ユーザーが直接触れる形で生成AIを実装。出品商品の改善提案機能。商品名の改善提案の例が説明されているが、どの程度教育をしたのか・していないのか気になるところ。また、注意事項はかなり念入りに書かれており、挙動が制御しきれない生成AIとの付き合い方を考える上で参考になる。
Technology
YouTubeで言葉のカベが消えそう。アドビの「多言語化」技術には夢がある
AdobeのカンファレンスAdobe MAXで発表された、AIにより動画を本人の声のまま多言語に置き換える技術「Project Dub Dub Dub」。記事中では動画コンテンツを簡単に多言語化できる可能性が触れられていますが、動画に限らず現実世界の多言語コミュニケーションの壁を著しく下げることにもつながりそうで、注目。
アップルがマルチモーダル大規模言語モデル「Ferret」を公開。画像内の形や場所を言葉で説明(生成AIウィークリー)
画像内の特定の部分や領域を自然言語で理解するモデル。従来の物体検出モデルと異なり、bouding boxと呼ばれる四角で物体の場所を捉えるのではなく、形状に沿って物体を捉えることが可能となっている。
Editor Picks
Training AI to Play Pokemon with Reinforcement Learning
強化学習でポケモンをプレイするAIを訓練し、最短のクリアルートを探索する様子を撮影したもの。シミュレーションの様子を可視化したリンク先の動画が一瞬ぎょっとするところで、こういうことを学習してるんだな・・・というのが実感できるので一見の価値あり。