Nishika AI News Letter - Issue #54
ChatGPT, DALLE, Whisperなど、圧倒的に高性能なAIが容易に利用できるようになってきている中で、自前AIをなぜ開発するのか、その価値はどこまで持続するのか、AIではないところでどう価値を出していけば良いのか、といった点に回答しているLayerXさんの記事が良記事でした。
自前AIの価値はいずれ代替されるが、AI単体ではないサービス全体としてのUX構築や、新たに生まれたAIを素早く性能検証しデプロイする体制の構築、また汎用AIとの差を生み出す独自データの蓄積など、今後AIを全く使っていないサービスというのはなくなっていくであろう中で、何をサービスの価値とすべきかのエッセンスが並べられています。
Promotion
弊社ではオンプレミスAIソフトウェア “SecureMemo” を提供していますが、SecureMemoの音声認識・話者特定の精度の高さをご評価いただくお客様の声が多いことから、SecureMemoのクラウド版と言える “SecureMemoCloud” のリリースを決定し、無償トライアル版を公開いたしました!
単なるSecureMemoのクラウド移植版ではなく、会議録の特性に特化したAI要約機能も付加している点も特徴です。
無償でお試しいただけますので、こちらで是非その精度を体感ください!
Nishikaは、世界最高水準の精度94.7%のAIを搭載しつつ、オフライン環境で処理が完結するAI文字起こしソフトウェア “SecureMemo” を提供しております!
「精度の圧倒的な高さ」「オフライン完結」の2つを両立しているサービスは他になく、医療機関・警察・民間企業の経営企画/IR/人事部門様といったところから引き合いをいただいています。
音声認識AIとしてOpenAI Whisperを搭載、オリジナルWhisper由来のバグ修正など実用可能な水準に改修した上でご提供しています。
さらに、独自開発した完全自動の話者特定AIも搭載しています。
ご関心あれば、是非お声がけください!
ChatGPTの使い方について、とても追いきれないほどの速さで日々報告がされる中、結局ビジネスで使える使い方は何なのか?とお考えの企業の皆様向けに、ChatGPT研修を提供することとしました!
ChatGPTの基本原理から、有用性だけではなく把握しておくべき危険性、業務で効果を生み出す活用方法までお伝えした上で、ワークショップ形式でお客様自身にとって有益なChatGPTの使い方を編み出すプログラムです。
弊社が実際に日々行なっている活用方法をお伝えしたり、コンペを通じて蓄積した危険性に関する知見をお伝えするなど、弊社独自の実践的コンテンツとなっております。
ご関心あれば、是非お声がけください!
Nishikaがデータ分析コンペティションを通じて蓄積した画像検索AIに関する知見をもとに開発した、最高水準の精度を誇るEC向け画像検索AI「Nishika Image Finder」をリリースいたしました!
約50万件の商品をお持ちのあるEC事業者様のデータを活用した検証にて、MRR (Mean Reciprocal Rank), Recallのいずれの指標でも、GoogleのVision API Product Searchの水準を10ポイント近く上回りました。
Application
生成AI活用により9万6,000時間/月、国内パートナー数の10%にあたる600人月相当の業務時間を創出
ランディングページのペルソナ設定や構成案の作成で生成AIを使い、効率化したというユースケースが面白い。
こういうのは「AIより俺のほうができる」というプライドがある人もいるので、素直に生成AIを使い価値を認められていることにも注目したいです。
「お~いお茶 カテキン緑茶」のパッケージをAIが作成--開発したプラグが語る「ダメ出し」に強い理由
画像生成AIをパッケージデザインに作成した話。
- 1つ1つのデザインの完成度は低くてもデザインの幅が稼げる
- 初回提案のリードタイムが減るのでちゃぶ台ひっくり返しのようなことが減る
- AIが作ったものなので人が作ったものに比べてダメ出しがしやすくなる
といったメリットがあるとのこと。
特に3点目は、メンタルヘルスの世界でAIに対しては色々話しやすいのと同じように、AIを介すことのメリットが人間心理的に出ている好例ですね。
Technology
GPT-4でコードを生成するなら“日本語”と“英語”どっちがいい? 日立製作所が検証
> 日本語と英語のプロンプトを用いた場合のコードの安全性にはほとんど差がないことが分かった。しかし、Pythonにおいては日本語のプロンプトの方が英語よりも安全なコードを生成する傾向を示した。
という事実を確認したという報告。
表面的に見れば、コード生成タスクは教師データの量が桁違いで、かつプロンプトとコードの対応関係も明示的なので、英語でなくとも性能があまり変わらないということ。
一方で画像生成タスクなどでは、英語/日本語で全く性能が変わるので、やはりタスクによる差は大きいとみています。
リアルタイムテキスト画像生成モデル、SDXL Turboのご紹介
リアルタイムでのテキスト画像生成。Pikaのデモと合わせて、ちょっとした映像を作る程度であれば近いうちに実現可能か。
Editor Picks
AIの民主化が進む時代におけるバクラクのAI-OCR機能の開発戦略 #LayerXテックアドカレ
LayerXで提供されているAI-OCR機能は自前で作られていますが、今やChatGPTはじめとした技術で代替できるのでは?という問いに対しての回答。内製AIをコア機能としたサービスを展開している人にとっては必読の内容です。
寂しい気持ちはありつつも、いずれ外部AIによって自前AIを置き換えるべきときはくると考え、そのときに備えてAIに限らないサービス全体としてのUXを磨く、MLOpsを整備する、自前データセットを貯めておく、といった点は弊社も全く同意するところであり、今のうちから動いておきたいところです。
現状、実用可能な水準の生成AIはクラウドサービスを使うしかない状況ですが、国内のクラウド環境で処理を完結させることがPRになっています。良いか悪いかは置いておいて、これがニュースバリューがあるというのが実態。