Nishika AI News Letter - Issue #82
新年明けまして・・・と言うには完全に遅いタイミングですが、しかし他の言葉もしっくりきません。
ということで、新年明けましておめでとうございます。本年もよろしくお願いいたします。2025年のNishika AI News Letter #1です。
SNS上ではAIエージェントが大変賑わいを見せています。生き馬の目を抜くビジネスをやっている立場としては、どうしても現時点で実用的か?という目線で見てしまうのですが、「これまで社員がやっていた仕事の多くを普通にAIが担う」前提で、今のうちから仕事のオペレーションを考えておく、というのは無駄のないことだと思います。
未来のAIエージェントがどんな仕事をやってくれるのか?というのは、browser-useのデモ動画を見ていただくと一端が掴めるのではないかと思います。
ソフトウェアだけでなくハードウェアの進化にも注目です。CES2025でNVIDIAが発表したノートPC向けGPU、NVIDIAに対抗すべく新規のカスタムシリコンを発表しているAWSなどの動きは注目です。ここ数年内に、ビジネスパーソン一人一人が専用GPUが搭載されたPCを持つようになっていても不思議はない、その前提で仕事のオペレーションを考えておくことも、これまた無駄のないことだと思います。
Promotion
「業務で生成AIを使いたいがパブリックな環境でインターネット通信されるのが不安」というニーズのある企業様向けに、自社専用「オフライン生成AI」の導入サービスを開始しました!
日本初のオフライン生成AI要約を備えたAI議事録ツール「SecureMemo」
プライベートな環境で社内Qに回答してくれる生成AI「AIコンシェルジュ」
自社専用生成AI「クラフト生成AI」
などをオフラインで実現する技術にご関心のある方、弊社(h1-matsuda@nishika.com)までご連絡ください。
SecureMemoCloudは、世界最高水準の精度96.2%の音声認識AIを搭載した会議録作成支援サービスです。
評価用に作成された綺麗な読み上げ音声ではなく、リアルなビジネス会議音声について他社の追随を許さない高精度を誇るAIモデル「shirushi」を搭載している点が最大の特徴です。
もう1つの特徴は、ほぼ完成版の議事録「ほぼ完議事録」機能。
日時・参加者・決定事項・議事要旨を備えつつ、トピック分割やインデントを活用した構造化を行い、さらに話者の付与・清書・文体の統一などを全てAIが行なった、業界で他に類を見ない機能です。
Application
2025年に入り、急激に「AIエージェント」という言葉を見かけるようになりました。流行の一端を担っているのが、ブラウザを自律的に操作できるAIエージェントbrowser-useです。
プロンプトでLLMに指示を与えると、Webブラウザを操作して指示を実行するというもの。以下は「リクルートの最新の決算説明会資料をとってきて」と指示したときの例。正しく資料のURLを特定できています。
これまでのLLMに、Webブラウザを操作する「手」が付いた、というと分かりやすいでしょうか。
実際に業務で使えるのか?と言うと、正直なところかなり用途を選びます。例えば「食べログで新橋で今日19時から入れる居酒屋を探して」と言うと、新橋や19時を選択するUIが解釈できず、先に進めずに止まってしまいました。
「人間は画面を解釈できて予約できてるんだから、AIにもできるでしょう」とは思いますが、ただでさえ大量の情報(トークン数)を処理しながらブラウザを操作している様子を見ると、操作時間やAPI費用の面でコスパが合わないかなと感じます。
とはいえ、冒頭のIR資料取得のように、RPAではできなかった少し多様性のあるタスクについて、AIエージェントに実行させる価値はありそうです。
ロボティクスもそうですが、LLMがさらに社会にインパクトを生むには手足を身につけることだと思いますので、今後の発展が注視されます。
より読者の皆さんに身近なAIエージェントとしてbrowser-useを先に取り上げましたが、既に実用段階に入っているAIエージェントもあります。コーディングアシスタントです。
Github Copilot, Cursor, Devinなど様々な実用水準のツールがありますが、中でも話題になっているのはcline。OSSで開発コミュニティが活発というのが話題性を生んでいます。日本語でclineに指示を出し、提案をacceptするだけでコーディングが進んでいきます。
現時点では一度誤った前提を置くとなかなか修正が効かないとか、コーディングの品質が良くない(全体のコード設計を見た上で考えてない)などの批判もありますが、批判のレベルが高いことはそのサービスの実用性の高さも示していると思います。
clineの利用時も、何もない状態で提示する指示書の重要性がよく取り上げられており、人に求められることが「何を作らせるか」を突き詰められる能力にシフトしていることを強く実感する流れです。
Technology
NVIDIAが新型GPU「GeForce RTX 50シリーズ」を発表 新アーキテクチャ「Blackwell」でパフォーマンスを約2倍向上 モバイル向けも
CES2025で、NVIDIAが新型GPUを発表。発表の中にはノートPC向けGPUも含まれており、RTX 5070 LaptopはRTX 4090と同等の性能で半分の消費電力、価格は1299ドル。
このニュースを見ると、普段使いのノートPCに専用GPUが搭載され、PC搭載のAIを自在に使い回すビジネスパーソンがどんどん増えてきてもおかしくないと感じます。データセンター向けのGPUは品薄という話は聞きますが、逆にノートPC向けのGPU需要は意外に立ち上がり切っておらず、今のうちにユースケースを固めて調達するのが吉に思えます。
AWSが発表したTrainium2から見る、AIアクセラレータのGPUに対する勝算は?
1ヶ月ほど前のニュースですが、AWSがTrainium2というカスタム半導体を発表。GPUよりも電力効率が高く提供コストが低いことを売りにしています。
実際にTrainiumを利用した開発時は、周辺ライブラリが整備されていないことでエンジニア工数的な意味のコストがかかるのが実態です。
とはいえ、現状のままNVIDIA GPUの寡占市場である限りGPUの価格は下がらないのも事実。強力な競合の成長は、ユーザーの立場からすれば望むところです。
Researchers open source Sky-T1, a ‘reasoning’ AI model that can be trained for less than $450
450USD未満で学習したLLM, Sky-T1-32B-Preview。少なくともMATH500やLiveCodeBenchといったベンチマークではo1 previewに勝つ程度。 タスク特化とはいえ、このコストでこのサイズのモデルが作れるとユースケースが広がる。
Editor Picks
AIは競争の末に単一の勝利者が誕生するのではなく「マルチモデル」に行きつくとOpenAIの元責任者が予測
タスクによって最適なモデルが変わる中で、最適なモデルにクエリを送信しながら、品質が低下しないのであれば、より安価で高速なモデルも活用する「ルーティング」が重要になってくるという話。
生成AIは最終的にただ1つの勝者が残るのか?という問いに対する1つの予測。