Nishika AI News Letter - Issue #58
私事で恐縮ですが、インフルエンザに罹患してしまいNews Letterの送信が遅れてしまいました。マラソンに向けてトレーニングしていた成果が一定リセットされてしまったのが辛いところ。運動はAIの学習と違ってやれば必ず結果が出るのは良いですが、リセットされることがあるのが辛いところですね。
閑話休題。ChatGPTに複数の人格を持たせ、互いに議論させて考えを深めるプロンプトは以前Softbank孫さんが紹介して話題になりましたが、個人的に有用なプロンプトを知ることができたので紹介。ただChatGPT同士で議論させるのではなく、1ターンごとに人間が議論に対してフィードバックを与えられる仕組みが新しい。「ChatGPTすごいけど、一定以上深いところまでは考えられないな」と感じることが多かった中、こんなところもできるのかと驚かされました。
パルワールドの驚異的な流行でも話題になっている知的財産権、AIの世界でも引き続き議論が尽きないところ。文化庁も検討を進め、パブコメを開始して意見を募っている。
Promotion
SecureMemoCloudは、オンプレミスAIソフトウェア SecureMemoに続きご提供を開始した、世界最高水準の文字起こしAIを搭載した会議録作成支援サービスです。
単なるSecureMemoのクラウド移植版ではなく、会議録の特性に特化したAI要約機能も付加している点も特徴です。
現在β版であり、無償でお試しいただけますので、是非その精度を体感ください!
SecureMemoは、世界最高水準の精度94.7%のAIを搭載しつつ、オフライン環境で処理が完結するAI文字起こしソフトウェアです。
「精度の圧倒的な高さ」「オフライン完結」の2つを両立しているサービスは他になく、警察・医療機関・民間企業の経営企画/IR/人事部門様といった皆様にお使いいただいています。
音声認識AIとしてOpenAI Whisperを搭載、オリジナルWhisper由来の課題を解決すべく独自チューニングを行い、実用可能な水準に改善を行った上でご提供しています。
さらに、独自開発した完全自動の話者特定AIも搭載しています。
Application
少し古い記事ですが、Softbank Worldで孫正義さんが言われたChatGPTの使い方「複数人格を持たせ、互いに議論を交わさせることでこちらの質問に対する回答を洗練させる」使い方について、個人的に今の所最も有効なプロンプト。
プロンプトコピペの上、最後に質問を入れるだけで議論がスタート。完全に自動で議論が進むのではなく、議論の1往復ごとに天の声としてフィードバックを与えることができるので、自分の思うように議論の方向を誘導・深化できるのがポイント。
Gmailと連携したAI「Bard」で、「Re:」が連鎖したメールを読む苦行から解放されるか? 試してみた
かなり多くの人が共感するであろう苦行、「Re:の連鎖問題」を生成AIで解消しようとした例。
ただし、メールの要約は、やりとりする中でコロコロ結論が変わったり、知りたいのが金額や日付などピンポイントの数値情報に正確性を求めるものだったりして、今のLLMが比較的苦手とするタスク。
GPT-4でもハルシネーションの防止はなかなか難しく、同様の学習データを使っているならGemini Proでも同様だと思うが、しかし技術の進歩が待たれるところ。
アクセルマーク、LLM活用によりCookieに依存しないDSPの提供を開始
LLMが得意とする文章の要約機能を応用し、非構造化データや半構造化データを構造化データに変換することで、コンテンツ解析の精度を格段に上げることを実現いたしました。
LLMをデータ処理プロセスに組み込むのは、チャットのまま使うこと以上にビジネスの現場では有望なユースケースと思っているところ。その一例。
Technology
RAG vs Fine-tuning: Pipelines, Tradeoffs, and a Case Study on Agriculture
生成AIの性能をさらにあげる(例:社内ナレッジについても回答させる)試みは四方八方で行われていますが、手法としてRAG(Retrieval-Augementd Generation, 外部の知識ベースに接続して、その情報を踏まえて回答する)を採用するのか、AIモデル自体をファインチューニング(追加学習)させるのか、論点となることが多い。どちらが良いのか、どちらもやるとどうなるのか検証した論文。
論文ではファインチューニングで6point, RAGでさらに5point精度が上がったとのこと。しかし、実際に開発している勢からは実感と異なるという声も。私も個人的には、RAGは知識を拡張するのに向いていて、回答の仕方・スタイルをチューニングしたければファインチューンする、という形で、必要なシーンが異なる印象。まだまだ議論が尽きない。
Editor Picks
生成AI勃興の裏で加熱するトレンド"e/acc"とは?社会の分断を防ぐために理解すべきことと、日本への示唆
効果的加速主義(e/acc, イー・アック)「全ての先端技術は世のためになるのだから、テクノロジーを規制せずに技術進歩を無制限に加速するべき」に関する二人の考えの対比。
サムアルトマンの「AIによって人々は「生存のための労働」から解放され、「本当にやりたい活動」へと時間の使い方は変わる世界」は我々も目指しているところ。
「生存のための労働から解放される」なんてどの動物も達成していないことで、やっぱりヒトとしてはそこを目指したくなる。
生成AIの利用が広がる中で、AIと著作権に関する考え方について国がパブコメを開始。文化庁が検討中の内容はこちら。お役所文書の解説文を出していただいている方もおり、こちら。
プロ声優による高音質のキャラクター演技セリフ発話音声データセットを公開。合計449キャラクター、約36万の音声ファイル、合計約581時間、343GBの音声が含まれる。非常に貴重なデータセットだが、著作権上の問題がX上で議論されている。
AI領域に詳しい弁護士の方の見解の1つはこちら。明快に問題がある/ないとは言えない模様。
The Twelve Startups Battling For a Slice of Nvidia’s Pie
NVIDIAに戦いを挑むAI半導体スタートアップ12社。
学習特化型/推論特化型/両方が存在。新しいAIプログラミング言語Mojoを提案するModularのようなソフトウェア特化プレイヤーも。