Nishika AI News Letter - Issue #35
引き続き生成系AIがHotですが、NotionAI、Paperpalなど、言語生成系AIの中で特定用途に特化したものも出てきています。ChatGPTを使った遊び半分?の研究も活発で、ChatGPTの感情を可視化してみた例は読み物として面白いです。生成系AIがパラダイムを変えたのは間違いない中で、日本としてどういう勝ち筋があるか述べた松尾・安宅両先生の考察も考えさせられました。一言で言えば「この新しい道具をどう使うか」の発想・実行力勝負になってきそうです。
Promotion
AI News Letterでは各社の提供する最先端AIをご紹介し続けていますが、News Letter中でも何度か取り上げている、音声認識AI OpenAI Whisperを搭載したソフトウェア “SecureMemo” をリリースいたしました!
Whisperを搭載・チューニングし、名実ともに世界最高水準の精度を示しながら、オンプレミス・オフライン環境で利用可能でありセキュアな用途に有用な点が特徴です。
弊社はデータ分析コンペという、データサイエンティスト同士が競い合った結果生まれた非常に高い精度のAIを提供する仕組みがありますが、参加する側の立場になるのは敷居が高いという方も多くいらっしゃるのではないかと思います。
そこでこの度、Udemyにて「中古マンション取引価格予測」という皆様に馴染み深いテーマを題材とした初心者向けコンペ講座を公開しました。現在特別価格で購入可能ですので、リンクからご購入いただくか、購入時にクーポンコード「65BEB5565B3E168101ED」を入力ください。
Application
メモ、タスクリスト、データベースなど様々な機能を一元的に提供するNotionが、Notion AI機能をリリース。GPTのような生成系AIが搭載されており、記事作成や表の自動作成、文章のトーン変更など様々な表現が可能。「スペース」を打つだけでAIに命令を与えられる、非常にストレスのないUXも見事。
以前も取り上げたが、AIに画像や文章を生成させるための命令文「プロンプト」が売買されているプラットフォーム。今はChatGPTへのプロンプトも多数販売されている。
ただ、個人的には「これからはプロンプトエンジニアリングの時代だ」などとする一部の主張には懐疑的。あくまで過渡的に必要とされているもので、中身のモデルが変わればプロンプトも容易に変わる。そのエンジニアリングを仕事にするほどのめり込んではいけない、楽しく遊ぶくらいの距離感がちょうど良いと思う。
ChatGPTを英文校正に使うユースケースが知られているが、Paperpalは学術英語の校正に特化している。翻訳も可能で、WordのAdd-Inも用意されている。こういった「XX英語」の校正に特化するユースケースはまだ出てきそう。
AI生成キャラのポーズを“棒人間アバター”で指定 「ControlNet」にVRを応用するユーザー登場
画像生成系のニュースも1つ。Stable Diffusionなどの画像生成AIで画像を出力する際、棒人間のような3Dモデル「ボーン」によってポーズを指定する「ControlNet」の活用例。
これも面白いのだが、こちらはMagicPoserでポーズ作成 ・ControlNetに入力・Realistic Visionモデルを使用することで、モデルとなる人物について指定したポーズを取らせることも可能になってきている例。一部おかしな箇所も見られるが、なかなかすごい。
Digital shielding enables rail repairs without service stoppage
ニュージーランドのKiwiRail社とSitech社がTrimbleの重機コントロールプラットフォーム「EarthWorks」を拡張して、デジタルツイン上の現場に稼働領域を設定するDigital Shieldを開発。重機が領域外に出ると自動で停止にすることができる。3DCADで遠隔からも設定できるとのこと。
Technology
Introducing LLaMA: A foundational, 65-billion-parameter large language model
OpenAI、Googleに続き、MetaがLLM(大規模言語モデル) LLaMAを発表。パラメータ数は最大で650億個だが、最小では70億個のものも提供しており、小規模なモデルを提供することで研究者がアクセス可能なインフラ上でも扱えることを目指している。
Editor Picks
ChatGPTに、会話しながら自分の感情の状態を5段階評価で出力させるようにプロンプトで指定して、会話した結果。
質問に正しく回答していることを伝えると喜びが4になり、(なぜか)プロポーズすると困惑が4になり、嘘を言って騙してみると怒りが4になるあたり、なんだか愛着が湧いてきます。
実態として感情は持っていないとはいえ、実態として感情を持っているかどうかの区別は表面的にはできないことを考えると、感情豊かに対話を楽しむ用途ではすでに十分成立している気がします。
既に読まれた方も多いと思いますが、松尾先生・安宅先生の発表が必読。
松尾先生の資料には、研究者・技術者の皆さんもChatGPTでこんなことまでできるのかと驚いたとあります。ChatGPTを真にイノベーション足らしめたのは、チャットという馴染み深いUIとどんな質問もそれなりに対応できる守備範囲の広さで、多数の非エンジニアを巻き込んで潜在能力を引き出す実験が日々できていることのように思います。