Nishika AI News Letter - Issue #58

Jan 26, 2024

私事で恐縮ですが、インフルエンザに罹患してしまいNews Letterの送信が遅れてしまいました。マラソンに向けてトレーニングしていた成果が一定リセットされてしまったのが辛いところ。運動はAIの学習と違ってやれば必ず結果が出るのは良いですが、リセットされることがあるのが辛いところですね。

閑話休題。ChatGPTに複数の人格を持たせ、互いに議論させて考えを深めるプロンプトは以前Softbank孫さんが紹介して話題になりましたが、個人的に有用なプロンプトを知ることができたので紹介。ただChatGPT同士で議論させるのではなく、１ターンごとに人間が議論に対してフィードバックを与えられる仕組みが新しい。「ChatGPTすごいけど、一定以上深いところまでは考えられないな」と感じることが多かった中、こんなところもできるのかと驚かされました。

パルワールドの驚異的な流行でも話題になっている知的財産権、AIの世界でも引き続き議論が尽きないところ。文化庁も検討を進め、パブコメを開始して意見を募っている。

Nishika AI News Letterへのご質問はこちら

Promotion

SecureMemoCloud

SecureMemoCloudは、オンプレミスAIソフトウェア SecureMemoに続きご提供を開始した、世界最高水準の文字起こしAIを搭載した会議録作成支援サービスです。

単なるSecureMemoのクラウド移植版ではなく、会議録の特性に特化したAI要約機能も付加している点も特徴です。

現在β版であり、無償でお試しいただけますので、是非その精度を体感ください！

SecureMemo

SecureMemoは、世界最高水準の精度94.7%のAIを搭載しつつ、オフライン環境で処理が完結するAI文字起こしソフトウェアです。

「精度の圧倒的な高さ」「オフライン完結」の2つを両立しているサービスは他になく、警察・医療機関・民間企業の経営企画/IR/人事部門様といった皆様にお使いいただいています。

音声認識AIとしてOpenAI Whisperを搭載、オリジナルWhisper由来の課題を解決すべく独自チューニングを行い、実用可能な水準に改善を行った上でご提供しています。
さらに、独自開発した完全自動の話者特定AIも搭載しています。

Application

ChatGPTに複数の人格を生み出して議論させる方法

少し古い記事ですが、Softbank Worldで孫正義さんが言われたChatGPTの使い方「複数人格を持たせ、互いに議論を交わさせることでこちらの質問に対する回答を洗練させる」使い方について、個人的に今の所最も有効なプロンプト。

プロンプトコピペの上、最後に質問を入れるだけで議論がスタート。完全に自動で議論が進むのではなく、議論の１往復ごとに天の声としてフィードバックを与えることができるので、自分の思うように議論の方向を誘導・深化できるのがポイント。

Gmailと連携したAI「Bard」で、「Re:」が連鎖したメールを読む苦行から解放されるか？　試してみた

かなり多くの人が共感するであろう苦行、「Re:の連鎖問題」を生成AIで解消しようとした例。

ただし、メールの要約は、やりとりする中でコロコロ結論が変わったり、知りたいのが金額や日付などピンポイントの数値情報に正確性を求めるものだったりして、今のLLMが比較的苦手とするタスク。

GPT-4でもハルシネーションの防止はなかなか難しく、同様の学習データを使っているならGemini Proでも同様だと思うが、しかし技術の進歩が待たれるところ。

アクセルマーク、LLM活用によりCookieに依存しないDSPの提供を開始

LLMが得意とする文章の要約機能を応用し、非構造化データや半構造化データを構造化データに変換することで、コンテンツ解析の精度を格段に上げることを実現いたしました。

LLMをデータ処理プロセスに組み込むのは、チャットのまま使うこと以上にビジネスの現場では有望なユースケースと思っているところ。その一例。

Technology

RAG vs Fine-tuning: Pipelines, Tradeoffs, and a Case Study on Agriculture

生成AIの性能をさらにあげる（例：社内ナレッジについても回答させる）試みは四方八方で行われていますが、手法としてRAG（Retrieval-Augementd Generation, 外部の知識ベースに接続して、その情報を踏まえて回答する）を採用するのか、AIモデル自体をファインチューニング（追加学習）させるのか、論点となることが多い。どちらが良いのか、どちらもやるとどうなるのか検証した論文。

論文ではファインチューニングで6point, RAGでさらに5point精度が上がったとのこと。しかし、実際に開発している勢からは実感と異なるという声も。私も個人的には、RAGは知識を拡張するのに向いていて、回答の仕方・スタイルをチューニングしたければファインチューンする、という形で、必要なシーンが異なる印象。まだまだ議論が尽きない。