Nishika AI News Letter - Issue #78
どこで見たか忘れましたが、オレオレ詐欺対策の電話がエキスパートシステムになっていて、まず息子の名前を1-3から選ばせ、次に好きな食べ物を1-3から選ばせ、間違えると警察に繋がる、というコントを以前見たことがあります。
そのさらに高性能版というべきか、詐欺対策に生成AIがおばあちゃんになりきりだらだらと世間話をして詐欺師の時間を奪う、というボットを英通信キャリアO2が発表。
ちょっと笑ってしまうような生成AI活用ユースケースですが、「詐欺電話に関するYoutubeという固有データでトレーニング」「精度・レイテンシの問題が逆に高齢者らしくなる」という2点を抑えていて、笑いの中に生成AI活用のポイントが隠れています。
Promotion
新サービスのお知らせ!「最新AI動向の解説勉強会サービス」スタート
最先端のAI技術の発展を学ぶチャンス!毎月2回、日々AI最新動向を調査、研究しているNishikaのデータサイエンティストによる最新のAI動向の解説をお届けします。本勉強会では、単なる座学にとどまらず、実践的な演習も交え、最新AIの理解を深めることができます。
勉強会のポイント:
最新のAIニュース解説
常に進化するAI業界の動向をいち早く把握!定期的にお届けしているAI News Letterの内容を中心に、Nishikaのエンジニアが最新のAI技術やAI関連のビジネストレンドについて解説します。
Nishikaのデータサイエンティストが毎月2回、貴社に訪問し勉強会を実施します。
R&Dの研究レポート共有
Nishikaエンジニアチームが日々行っている研究開発(R&D)の最新の研究結果を公開し、その成果や取り組みについて深堀りします。
実践的なハンズオン形式
座学だけでなく、実際に手を動かして学べる演習も含まれているため、習った知識をすぐに実践に活かせるスキルが身につきます。
こんな方におすすめ:
DX推進部など、AIの最新動向を常にキャッチアップする必要のある方
AIの最新情報について、技術面に加えビジネス面でも理解を深めたい方
ハンズオンでの実践を通じて、AIの理解を深めたい方
AI技術の最新トピックやR&Dの内容を直接学べるこの機会をお見逃しなく!
お申し込みや詳細のお問合せは、info@nishika.comまでご連絡下さい。
「業務で生成AIを使いたいがパブリックな環境でインターネット通信されるのが不安」というニーズのある企業様向けに、自社専用「オフライン生成AI」の導入サービスを開始しました!
日本初のオフライン生成AI要約を備えたAI議事録ツール「SecureMemo」
プライベートな環境で社内Qに回答してくれる生成AI「AIコンシェルジュ」
自社専用生成AI「クラフト生成AI」
などをオフラインで実現する技術にご関心のある方、弊社(h1-matsuda@nishika.com)までご連絡ください。
SecureMemoCloudは、世界最高水準の精度96.2%の音声認識AIを搭載した会議録作成支援サービスです。
評価用に作成された綺麗な読み上げ音声ではなく、リアルなビジネス会議音声について他社の追随を許さない高精度を誇るAIモデル「shirushi」を搭載している点が最大の特徴です。
もう1つの特徴は、ほぼ完成版の議事録「ほぼ完議事録」機能。
日時・参加者・決定事項・議事要旨を備えつつ、トピック分割やインデントを活用した構造化を行い、さらに話者の付与・清書・文体の統一などを全てAIが行なった、業界で他に類を見ない機能です。
Application
Google Gemini、宿題の手助け求めた学生に暴言。「どうか死んでください」
一瞬フェイクニュースかと思う内容ですが、GeminiのチャットURLも公開されているのでどうやら事実のよう。
ハルシネーションの可能性をゼロにすることはLLMの原理上不可能
ただし、このように極端に不適切な発言をさせないために監視役のLLMを入れるなど、制御機構はいくらでも考えられる
の2点を改めて認識しておかないといけません。
詐欺電話に延々と応対し時間を浪費させるAIおばあちゃん、O2が開発
詐欺電話に関するYoutuberの協力を得てトレーニング
高齢者設定なので、レスポンスが遅くても、多少ずれた返答でも、不審がられない
と、「固有データ収集」「精度・レイテンシ」のAI実用化の壁2点をクリアしている点でも注目の事例。
DeepL、リアルタイム音声翻訳機能「DeepL Voice」の提供開始 日本語含む13カ国語で利用可能
DeepLがWeb会議や対面の会話をリアルタイムで音声to字幕に翻訳する機能を提供。
これはこれで注目の動きですが、日本のKotoba Technologies社はさらに一歩進み、リアルタイムの音声to音声の翻訳を開発中。英日翻訳デモはこちら。
所謂「ほんやくこんにゃく」はOpenAIも取り組んでおり、技術的には非常に性能競争が激しいところ。
一方で、ビジネス的な意味で覇権を握るかどうかは技術だけでは決まらず、アプリとしての体験をプロデュースしたところだと思われる。
例えば、こちらのポストにあるように生成AIが翻訳精度では圧倒的な中、一世代前に話題を攫ったDeepLも未だ使われているという話。以下の体験がユーザーに刺さっている。
拡張機能でページ全体翻訳
文章のそのまま翻訳(太文字などもそのまま)
ファイル翻訳
Technology
Depth Up-Scalingを用いた「Llama-3-ELYZA-JP-120B」の開発
METIが主導する生成AIプロジェクト「GENIAC」の研究成果の1つとして、ELYZAが発表しているDepth Up-Scalingにより巨大モデル作成のアプローチ。
一般に大きなパラメータサイズのモデルから小さなモデルを作る蒸留などのアプローチは知られているが、70Bのモデルからより大きな120Bのモデルを開発するアプローチは新しい。今回の取り組みではスケールアップのみで元のモデルの性能を上回ることはできなかったようだが、スケールアップのみでの性能向上に成功した例もある(こちら)。