Nishika AI News Letter - Issue #73
リコーさんの、生成AIと壁打ちできる会議室はとても面白い取り組み。文字通り壁に話しかけていたらアイデアを出してくれたり考えを整理してくれたりする体験は面白過ぎます。Salesforceの提案する、実際の顧客との商談前に練習を重ねることができるAIエージェントもそうですが、絶対の正解が定義されている用途ではないところがAI向きで実用性も感じ、伸びるんじゃないか?と思うユースケースです。
Promotion
SecureMemoCloudは、世界最高水準の精度96.2%の音声認識AIを搭載した会議録作成支援サービスです。
評価用に作成された綺麗な読み上げ音声ではなく、リアルなビジネス会議音声について他社の追随を許さない高精度を誇るAIモデル「shirushi」を搭載している点が最大の特徴です。さらに、音声認識AIと生成AIを組み合わせた専門用語・社内用語の認識機能を備えており、圧倒的な認識性能を誇ります。
将来は、文字起こし結果をもとに会議アシスタントとしてあなたをサポートする生成AIの搭載を目指しています。
SecureMemoは、世界最高水準の精度96.2%の音声認識AIを搭載しつつ、オフライン環境で処理が完結するAI文字起こしソフトウェアです。
「精度の圧倒的な高さ」「オフライン完結」の2つを両立しているサービスは他になく、警察・医療機関・民間企業の経営企画/IR/人事部門様といった皆様にお使いいただいています。
評価用に作成された綺麗な読み上げ音声ではなく、リアルなビジネス会議音声について他社の追随を許さない高精度を誇るAIモデル「shirushi」を搭載している点が最大の特徴です。さらに、独自開発した、声紋登録不要で完全自動の話者特定AIも搭載しています。
Application
生成AIと“壁打ち”できる貸し会議室、秋葉原に リコーの「次世代会議室」採用
生成AIを使った体験を空間を絡めて提供するとても面白い取り組み。実用的にはタイトルにもあるKABEUCHIが面白くて、文字通り壁に話しかけていたらアイデアを出してくれたり考えを整理してくれたりする体験は面白過ぎる。基盤技術として音声認識やプロンプティングは必要なので、そのあたり弊社の強み領域と重なるところ。
全社を挙げて生成AI活用に取り組んでいる日清食品グループの経過報告。特にマーケティング部門で使い込まれているようで、実務で叩きに叩いたであろうマーケティング用途のプロンプトサンプルがなかなか有用そう。
業務システムのデータの集約・生成AIとの連携も既に取り組んでいる模様。
製品在庫とか売上といった数値情報の確認について、ハルシネーションのリスクはどう回避しているのかなど細かいところは気になるが、
最終ページの「AI活用を予め前提とした業務プロセスの構築」が実現できれば、先進的な生成AIの実用例として世界に発信できる例になると思う。
Salesforceが自律型営業支援AIエージェント「Einstein SDR Agent」と「Einstein Sales Coach Agent」を発表。営業やCustomerSuccessを自動的にやってくれるのは以前からあったものをただAIと名付けただけとして、実際の顧客との商談前に練習を重ねることができるのはまさにAIエージェント、before生成AIではできなかった体験だと感じます。
LLMでなく小規模言語モデル(SLM)として最高レベルの性能を達成したとしてプリファードネットワークスによるリリース。自動車やロボット、製造設備への搭載を想定しているとのことで、ベンチマークテストと実際の利用用途がどの程度重なっているかが気になるところ。
プロンプトによる指示でフロントエンドのコード生成を行うUI生成AI「v0」。同様の昨日はClaudeのArtifact機能としても提供されていたが、性能はより良いと噂。
Technology
Meta Knowledge for Retrieval Augmented Large Language Models
RAGは文書をそのまま放り込むのではなく、文書を一度Q&Aに変換してメタデータを付与する準備のフェーズを加えると精度が大幅に向上することが示された。
RAGを使って最終的にLLMにさせたいことはQAであることがほとんどなので、学習データの渡し方もQA形式にする、というのが精度向上につながるのは、直感的にも技術的にも納得のいくところ。
LLM Stability: A detailed analysis with some surprises
LLMの出力の安定性を評価した研究によると、GPT-4oの出力は内容レベルでは90%程度毎回同じ内容を回答するが、文字レベルでは全く安定しないことがわかったとのこと。
LLMにチャット用途のように自由な出力をさせるのではなく、一定の制約や選択肢のもと出力させたい用途はかなり多いが、まさにじゃじゃ馬という感じで、出力例や出力形式を明示しないと指示に従わないので、体感に合うところ。プロンプトで粘るか、ファインチューニングする選択肢もある。
Editor Picks
ウォルマートは独自のLLMを構築し、8.5億個の商品カタログの作成に生成AIを使用。商品の属性や特徴の情報を入力するのに活用。人手で作業したとすれば100倍の工数がかかっていたとのこと。これだけ規模があれば生産性向上の効果は大きいし、独自LLMを構築する価値もある。