Nishika AI News Letter - Issue #53
OpenAI DevDayは、ChatGPT自体の大幅なUpdateも当然注目であったものの、ChatGPTのときと同様にGPTsによってXのタイムラインが埋め尽くされているのをみると、「非エンジニアも巻き込むことで局所的でない熱狂を巻き起こす」という現象を再現していて、OpenAIの事業拡大の上手さにも感心してしまいました。
一部職種(ライター・エディター)では仕事の量・収入共にBefore/After ChatGPTで減少したという研究も出てきており、「生成AIが仕事を奪う」も現実になっています。
ChatGPTのスマホ版アプリを使った外国語学習も、是非やってみてください。「もうこれで良いじゃん」となるのではないでしょうか。
Promotion
弊社ではオンプレミスAIソフトウェア “SecureMemo” を提供していますが、SecureMemoの音声認識・話者特定の精度の高さをご評価いただくお客様の声が多いことから、SecureMemoのクラウド版と言える “SecureMemoCloud” のリリースを決定し、無償トライアル版を公開いたしました!
単なるSecureMemoのクラウド移植版ではなく、会議録の特性に特化したAI要約機能も付加している点も特徴です。
無償でお試しいただけますので、こちらで是非その精度を体感ください!
Nishikaは、世界最高水準の精度94.7%のAIを搭載しつつ、オフライン環境で処理が完結するAI文字起こしソフトウェア “SecureMemo” を提供しております!
「精度の圧倒的な高さ」「オフライン完結」の2つを両立しているサービスは他になく、医療機関・警察・民間企業の経営企画・IR部門様といったところから引き合いをいただいています。
音声認識AIとしてOpenAI Whisperを搭載、オリジナルWhisper由来のバグ修正など実用可能な水準に改修した上でご提供しています。
さらに、独自開発した完全自動の話者特定AIも搭載しています。
ご関心あれば、是非お声がけください!
ChatGPTの使い方について、とても追いきれないほどの速さで日々報告がされる中、結局ビジネスで使える使い方は何なのか?とお考えの企業の皆様向けに、ChatGPT研修を提供することとしました!
ChatGPTの基本原理から、有用性だけではなく把握しておくべき危険性、業務で効果を生み出す活用方法までお伝えした上で、ワークショップ形式でお客様自身にとって有益なChatGPTの使い方を編み出すプログラムです。
弊社が実際に日々行なっている活用方法をお伝えしたり、コンペを通じて蓄積した危険性に関する知見をお伝えするなど、弊社独自の実践的コンテンツとなっております。
ご関心あれば、是非お声がけください!
Nishikaがデータ分析コンペティションを通じて蓄積した画像検索AIに関する知見をもとに開発した、最高水準の精度を誇るEC向け画像検索AI「Nishika Image Finder」をリリースいたしました!
約50万件の商品をお持ちのあるEC事業者様のデータを活用した検証にて、MRR (Mean Reciprocal Rank), Recallのいずれの指標でも、GoogleのVision API Product Searchの水準を10ポイント近く上回りました。
Application
既に各所で話題になっていますが、OpenAIが初めて開催したカンファレンス、OpenAI DevDayにていくつものインパクトのあるUpdateが発表。
128k tokens(PDF約300ページに相当)もの長大な文章を受け取れるGPT-4 Turbo
GPT-4 Turboの入出力tokenあたり料金はGPT-4の2-3倍安い金額に。GPT-3.5 Turboも同様
GPT-4 Turboが画像を入力として受け取れるGPT-4 Vision
GPT-4のナレッジカットオフ(最新の学習時点)が2023年4月に拡張
個人がカスタマイズ可能なGPTをノーコードで作ることのできるGPTs
etc
など、ここには書ききれないほどの注目したい発表がありました。
GPTsは様々なものがXのタイムライン上には流れており、是非一度作ってみることをおすすめします。作り方はこちら。
ちょっと目線を高くすると、OpenAIの戦略にも注目したいです。ChatGPT自体も非エンジニアでも簡単に使えるアプリとして公開したことで爆発的に利用が伸びたように、JSONモードであったり、GPTsであったり、これまでもエンジニアであればできていたことのUXを圧倒的に改善して、従来とは桁の違う人に客層を広げることでデファクトスタンダードをとっていく、という戦略の妥当性には感心するばかりです。
商用利用可能な日本語画像言語モデル「Japanese Stable VLM」をリリースしました
Stability AIが、日本語画像言語モデルを発表。入力した画像に対して文字で説明を生成できる画像キャプショニング機能に加え、画像に関する質問にも回答。どうしてもOpenAIの発表に目が行きがちだが、このように商用利用可能でオンプレでの活用可能性がある動きにも要注目。
1点だけ惜しむらくは、HuggingFaceに上がっているだけでエンジニアとしては全く問題ないものの、利用の波を生むには非エンジニア層にリーチすることも非常に重要なので、ChatGPTのようなインターフェースも用意されていると尚良いところ。
楽天、企業向けAIプラットフォーム「Rakuten AI for Business」--OpenAIと協力
OpenAIが、楽天のAI分野における戦略パートナーとして参画。
OpenAIの目線で言うと、法人ビジネスが苦戦しているという話もあった中で、自社の技術をアプリケーションに落とし込んでくれて、企業と話せる窓口もいろいろ持っているパートナーが欲しかったということだと推測します。後者の観点ではリクルートさんの方がより良いパートナーな気がしますが、自社LLM開発の道を行っているということで、楽天になったと言う感じでしょうか。
従って楽天からOpenAIへのデータ的・技術的なフィードバックがどこまであるか未知数ですが、個人的にはWeb上だけでは見つからない日本のデータがよりChatGPTに反映されると嬉しいところです。
Technology
Pressure Testing GPT-4-128K With Long Context Recall
Twitterの投稿ですが、非常に面白い分析だったのでPick。
GPT-4が128k tokenととても長大な文章を受け取れるようになったが、内容を本当に覚えているのか、を実験。結果、
GPT-4の記憶は73k tokensを超えると悪化し始める
ドキュメントの深さで言えば、7-50%の位置にある情報は忘れられやすい傾向にある
ドキュメントの序盤にある情報は、ドキュメントの長さによらず覚えている
などと、非常に面白いFactが発見された。
Editor Picks
Here’s what we know about generative AI’s impact on white-collar work
ライター・エディターの仕事の数・収入がBefore/After ChatGPTで大幅に減少したという研究。「生成AIが仕事を奪う」が現実になっている。次の記事も含めて、ChatGPTによる既存の仕事の代替がどんどん始まっている。
【英会話に革命】ChatGPTついに喋る。ネイティブ英会話以上のメリットも!?音声英会話が可能になったChatGPTで色々検証してみた
少し前にUpdateされていた機能ですが、ChatGPTのスマホ版では音声対話が可能になっています。この機能を使うと、外国語学習に有用、という話。
例えば「英会話を学習したいけど、英語は下手なのでわからないところは日本語で教えて」と言えば、2つの言語を使って教えてくれます。
実際に使ってみると、私の拙い英語で話していると、ちょっと間が空くと向こうが喋り出してしまうので、上手な人向けだなと言う感じ。
学習者のレベルに合わせて、ないし学習者の表情(まだ喋ろうとしているか)に合わせて会話ができるようになると、完全に従来の英会話学習アプリの代替になるなという感じがします。
松尾豊が語る「和製AIが世界で勝つ」方法 カギを握る企業特化型LLM
松尾先生が度々語っている、AIの領域で日本が世界で勝つためには、という発表。
領域特化型LLMは海外勢もやってくるので、その中で日本の勝ち目があるとすれば世界に冠たる産業でやること、つまり自動車など製造領域なのかと思います(金融や医療は勝てる理由がないのではと思います)。
後は、日本人の細部を突き詰めるのが得意な特性を踏まえて、やはりアプリで勝負する方向か、どちらかではないでしょうか。
生成AIの導入はGoogle検索広告とカニバるのでは?なんて言われていたけれど、売上的にはまだ全然インパクトはない、という内容。
確かに、要約は要約で見たいが、欲しい情報は人によって異なるので、結局1つの要約では情報を充足しきれていない感覚はある。