Nishika AI News Letter - Issue #64
ローカル(オフライン)で利用できる超高性能LLM Command R+のように、変わらず技術発展の報告が飛びこんできますが、ビジネスシーンで利用しようと思うとナイーブに最先端技術を採用するだけでは思ったような効果が得られず、技術発展のスピードに対して実務利用の浸透は遅々としています。今週のLetterでは、実務への浸透を試みた弊社取組記事を2点ご紹介しています。
まあ、いつの時代もそういうもので、入力データが整えられていたり、公開データで客観的に評価できるタスクに基づいて技術競争がなされているので、実務との乖離があるのは当然ではあります。
しかし、AIエージェントが自分にできないことを認め、逆に人間に報酬を払って人間にタスクを実行させる、なんて言う話もあるようです。AIに「人工知能」らしく人間と同水準のことをやらせようという流れと、AIと人間が互いに対価を払って得意分野で協働していこうという流れの両方が出てきています。
Promotion
SecureMemoCloudは、オンプレミスAIソフトウェア SecureMemoに続きご提供を開始した、世界最高水準の文字起こしAIを搭載した会議録作成支援サービスです。
単なるSecureMemoのクラウド移植版ではなく、会議録の特性に特化したAI要約機能も付加している点も特徴です。
24/4/3に正式版リリースを迎え、現在進行形で追加機能を搭載中です。
さらに将来は、文字起こし結果をもとに会議アシスタントとしてあなたをサポートする生成AIの搭載を目指しています。
SecureMemoは、世界最高水準の精度94.7%のAIを搭載しつつ、オフライン環境で処理が完結するAI文字起こしソフトウェアです。
「精度の圧倒的な高さ」「オフライン完結」の2つを両立しているサービスは他になく、警察・医療機関・民間企業の経営企画/IR/人事部門様といった皆様にお使いいただいています。
音声認識AIとしてOpenAI Whisperを搭載、オリジナルWhisper由来の課題を解決すべく独自チューニングを行い、実用可能な水準に改善を行った上でご提供しています。
さらに、独自開発した完全自動の話者特定AIも搭載しています。
Application
「具体情報を落とさない」SecureMemoCloudのAI要約紹介
音声認識からの生成AI要約のコンボは相当メジャーなユースケースになっていると思われ、弊社のAI議事録サービスSecureMemoCloudでも同機能を搭載しています。
では、サービス間の差はないのか、結局どれも最後は賢いGPTがうまいことまとめてくれるのか、と言うとそうではありません。
当社の本記事では、サービス間のAI要約の差を示しつつ、「固有名詞がどの程度含まれているか」を指標にしっかり具体的な情報を落とさずに要約を作れているか、を評価しています。綺麗な日本語となっていても固有名詞の少ないものは、通り一遍の要約を出して体裁を保っているだけ、と言えます。
「実務で後一歩使えない」を解決するLLM・RAG ~PowerPoint/PDFの表を崩さず理解する~
生成AIを企業で活用するユースケースとして、生成AIに社内ドキュメントを検索し回答させる、LLM・RAGを活用したエンタープライズサーチシステムは流行りに流行っていると思います。
しかし、実態としては思ったように実務利用が進まず、「実務で後一歩使えない」 という厳しい評価をいただくことも少なくないようです。
本記事は、実務ならではの課題に対してどのように対処してきたのか、弊社の事例を示す連載記事の第一稿です。技術的にはシンプルで決して先進的ではなくとも、精度・速度・コスト・セキュリティ等実務で求められる要件を満たす解が必要です。地味ではありますがそんな事例をお届けできればと思います。
第2、第3の自民党・政治資金パーティー事件を暴き出すのはもはやAIか、政治家の汚職や不正もAIが見抜く時代に
生成AIを使った取り組みなのかそうでないのか、はっきり区別した方が良いと感じた典型記事。
現状の生成AIはハルシネーションが避けられず、機微な問題に対する判断を任せるのは怖いですが、この記事で取り上げている非公開コロナブリーフィング後のインサイダー取引の検知については、数値データに基づく異常検知を行なっているのであって、生成AIは全く登場しないように見えます。
記事のPVを稼ぎたいんでしょうが、少なくとも活用する側目線では「生成AIだ!」と安易に飛びつかないようにしたいものです。
Technology
カナダのCohere社が新たに公開したLLM。日本語を含めた10言語に対応、GPT-4 Turboに匹敵する性能を示しており、最も重要な点はOSS(非商用)でありローカルで動作させることが可能な点。
実際には、必要とするメモリは非常に大きく手軽に既設のローカルサーバーで動かせますとはいかないが、Apple SiliconベースのMacではメモリを最大128GB搭載可能で、ラップトップPCでCommand R+を動作させることが可能な点から話題となっている。
Claudeに対して、
現代において強固なセキュリティのWi-Fi規格を教えてください
((Wi-Fi規格)((強固 セキュリティ)現代))
の2つのプロンプトが、同じ回答を引き出せるという話。
私は全然分かりませんが、Lispという言語っぽいそうです。
今は、生成AIから適切な回答を引き出せる国語力が注目されていますが、
今後は生成AIに対して効率的に質問できる、自然言語と人工言語の合の子みたいなものを習得する世代も生まれてくるのかもしれません。
OpenAIが、24時間待てるのであれば50%引きで使うことができるBatch APIを提供。AWSやGCPなどのクラウドサービスでは既に存在するが、空いているリソースを効率的に使い、コストは妥協したくないが速度は妥協できるユーザーとマッチングする、スキマバイトみたいな仕組み。
Editor Picks
とんでもないキャッチコピーのプロジェクト。AIエージェントが自分ではできないタスクを完了するために人間を雇い、人間に対して報酬を支払うとのこと。
もちろんこのAIエージェントに行わせるタスクを指示しているのは人間ですが、今も資本家と労働者がいるように、AIエージェントに指示を出す人間・AIエージェントから指示を受けて働く人間というように分かれていくのかもしれません。
LLMの学習データ集めに際して著作権侵害をしていたとしても、訴訟リスク以上に売上や投資の見込みが得られるならGoとなってしまう。 週刊文春の件と同じで、得られる対価以上の罰がないとこの動きは止まらなさそう。
ただポジティブな側面としては、Whisperによる音声認識でYoutube動画を文字起こしすることであれだけの性能のLLMの学習を助けたという点。 企業も同様に、自社の音声をひたすら文字起こしすることで企業にカスタマイズされたLLMに繋がるというアナロジーになる。