Nishika AI News Letter - Issue #40
OpenAIが続々とPluginを発表し、「テキストを入れたらテキストが返ってくる」という基本形を超えたところまでChatGPTの用途が広がっています。Bing Image Creatorは利用のハードルが著しく低い生成AIサービスで、ChatGPTが流行った条件を1つ満たしておりサービスとして気になります。翻ってプログラミングにおいては、Pythonの良さを活かしたまま「35000倍」の処理速度を実現する新たな言語「Mojo」が注目を浴びています。ビジネス目線では、対話型AIの業務利用におけるMIXIの社内ルールの設計が「ちょうど良い妥協点」に近づいており、参考になりそうです。
Promotion
ChatGPTの使い方について、とても追いきれないほどの速さで日々報告がされる中、結局ビジネスで使える使い方は何なのか?とお考えの企業の皆様向けに、ChatGPT研修を提供することとしました!
ChatGPTの基本原理から、有用性だけではなく把握しておくべき危険性、業務で効果を生み出す活用方法までお伝えした上で、ワークショップ形式でお客様自身にとって有益なChatGPTの使い方を編み出すプログラムです。
弊社が実際に日々行なっている活用方法をお伝えしたり、コンペを通じて蓄積した危険性に関する知見をお伝えするなど、弊社独自の実践的コンテンツとなっております。
ご関心あれば、是非お声がけください!
AI News Letterでは各社の提供する最先端AIをご紹介し続けていますが、News Letter中でも何度か取り上げている、音声認識AI OpenAI Whisperを搭載したソフトウェア “SecureMemo” をリリースいたしました!
Whisperを搭載・チューニングし、名実ともに世界最高水準の精度を示しながら、オンプレミス・オフライン環境で利用可能でありセキュアな用途に有用な点が特徴です。
Application
GPT-4 is old news: ChatGPT Code Interpreter plugin is redefining AI tech
OpenAIが新たなPlugin「Code Interpreter」を発表。データをアップロードし、テキストで指示を行うだけで、可視化などデータ分析者が行う基本的な仕事をChatGPTが行ってくれる。
予想された通り「テキストで指示を出し、テキストでアウトプットが返ってくる」というこれまでの基本形を超えたところまで用途が広がっている。
入力したテキストから画像を生成するBing Image Creatorが日本語に対応。OpenAIの提供するDALL・E2を使用。画像生成AI自体は新しくない(と言うほど時間は経っていませんが。。。)が、「MSアカウントさえあれば誰でも使える」というのがChatGPTが非エンジニア含め爆発的に利用されるようになった条件と同一で、気になるニュース。
米国共和党が、AIの生成画像のみで構成された選挙広告の動画を公開。2024年にバイデン氏が再選した場合に何が起こるかの架空のニュースを読み上げるという構成で、AIによる架空画像の生成がマッチした用途になっている。
小さく「Built entirely with AI imagery」と書いてはあるが、如何にも実際のニュースのような見せ方になっており、問題視されそうにも見える。
Futuri Launches RadioGPT™, The World’s First AI-Driven Localized Radio Content
100%AIが提供するラジオ、RadioGPT。TopicPulseというシステムでローカル市場で話題となっているトピックをpickupした後、GPT-4がラジオスクリプトを生成。Text2SpeechのAIがラジオパーソナリティの音声を生成。
Googleが秘密裏に進めているAI検索「マギ」(Project MAGI)って何もの?(Google特別対策室)
New York Timesが、Google検索にGPT-4 likeの機能を追加するプロジェクトProject MAGIの内容のリークを報道。それによると、Googleの提供する対話AIはユーザーの入力に対してChatGPTと同様に回答を生成しつつ、広告も同時に表示する設計を考えているとのこと。
マイクロソフトはBingによる検索と対話AIを統合して提供しているが、Googleはこれまでのところ個別に提供しており、「検索とチャットは異なるものである」という思想もありつつ、広告収入への影響も慎重に見極めて運用しているように思われます。
個人的には対話AIの登場によって明らかに答えに辿り着くまでの距離が短くなるので、広告への影響は免られないと思います。検索とチャットを個別運用すべきかは分かりませんが、広告収入という足枷のないマイクロソフトの方がUX最適化に向けた障壁がないのは間違いないです。
Technology
Shap-E: Generating Conditional 3D Implicit Functions
OpenAIがテキストから3Dモデルを生成する研究「Shap-E」を公開。テキストのインプットで3Dプリンターで造形する世界もそう遠くなさそう。
ChatGPTの登場もありさらに脚光を浴びている印象のPythonですが、プログラム言語の中では実は圧倒的に処理が遅いという弱点があります。一方でとても書きやすい・分かりやすいという利点があることを踏まえ、Pythonの利点を活かしつつ処理速度の弱点を克服することを目指した新しいプログラミング言語「Mojo」が発表されました。「Pythonの35000倍早い」というフレーズでバズっています。まだクラウドで利用できるのみの状態ですが、開発者がiOSアプリ開発で使われる言語Swiftの開発者ということもあり、新たなスタンダードとなるのではないかと期待が高まっています。
Editor Picks
ChatGPTはじめ対話型AIを業務で利用する際は「機密情報は入力しないように」とされることがほとんどですが、実際のところどこからどこまでが機密情報なのか?判断が難しく実質的な利用に踏み切れないケースも多いです。
MIXIは「個人情報や発表前の決算情報はNG。それ以外の契約書や組織図などは社外秘であってもOK」を社内ルールとしたとのこと。もちろんAzureを利用する、利用前に関係部門に相談するといった仕組みが前提ですが、業務革新の波に乗り遅れないための解の1つであろうかと思います。
Stack Overflow Will Charge AI Giants for Training Data
プログラマー向けQAサイトのStack Overflowが、自社のデータが大規模言語モデルの学習に使用されることを受けて、APIアクセスへの課金を発表。同様の発表をソーシャル掲示板サイトRedditも行っている。
データの価値が益々上がっているという事実でもあるが、これにより一層大手AI開発企業のみが参入できる市場となっていくことも想定される。