Nishika AI News Letter - Issue #57
あけましておめでとうございます。2024年初回のNishika AI News Letterとなります。本年もよろしくお願いいたします。
新年早々に北陸大地震、羽田滑走路事故と痛ましい出来事が飛び込んできました。個人的にも1/1午前まで帰省で富山にいましたので他人事ではありませんでした。自然災害やヒューマンエラーに対してAIは基本的に無力ですが、震災・津波防災ガイドをGPTsで作成した例など、技術の進捗とともにやれることは広がってきています。また直接的な支援でなくても、災害や事故に巻き込まれていない我々が、苦しんでいる人たちの分も一層活力を持って日々活動することも重要だと思います。
2024年も、AIを活用した働き方のアップデートについて、最新の動向をお知らせしていきます。ぜひ様々なご意見をお寄せください!
Promotion
弊社ではオンプレミスAIソフトウェア “SecureMemo” を提供していますが、SecureMemoの音声認識・話者特定の精度の高さをご評価いただくお客様の声が多いことから、SecureMemoのクラウド版と言える “SecureMemoCloud” のリリースを決定し、無償トライアル版を公開いたしました!
単なるSecureMemoのクラウド移植版ではなく、会議録の特性に特化したAI要約機能も付加している点も特徴です。
無償でお試しいただけますので、こちらで是非その精度を体感ください!
Nishikaは、世界最高水準の精度94.7%のAIを搭載しつつ、オフライン環境で処理が完結するAI文字起こしソフトウェア “SecureMemo” を提供しております!
「精度の圧倒的な高さ」「オフライン完結」の2つを両立しているサービスは他になく、医療機関・警察・民間企業の経営企画/IR/人事部門様といったところから引き合いをいただいています。
音声認識AIとしてOpenAI Whisperを搭載、オリジナルWhisper由来のバグ修正など実用可能な水準に改修した上でご提供しています。
さらに、独自開発した完全自動の話者特定AIも搭載しています。
ご関心あれば、是非お声がけください!
ChatGPTの使い方について、とても追いきれないほどの速さで日々報告がされる中、結局ビジネスで使える使い方は何なのか?とお考えの企業の皆様向けに、ChatGPT研修を提供することとしました!
ChatGPTの基本原理から、有用性だけではなく把握しておくべき危険性、業務で効果を生み出す活用方法までお伝えした上で、ワークショップ形式でお客様自身にとって有益なChatGPTの使い方を編み出すプログラムです。
弊社が実際に日々行なっている活用方法をお伝えしたり、コンペを通じて蓄積した危険性に関する知見をお伝えするなど、弊社独自の実践的コンテンツとなっております。
ご関心あれば、是非お声がけください!
Nishikaがデータ分析コンペティションを通じて蓄積した画像検索AIに関する知見をもとに開発した、最高水準の精度を誇るEC向け画像検索AI「Nishika Image Finder」をリリースいたしました!
約50万件の商品をお持ちのあるEC事業者様のデータを活用した検証にて、MRR (Mean Reciprocal Rank), Recallのいずれの指標でも、GoogleのVision API Product Searchの水準を10ポイント近く上回りました。
Application
「CES 2024」では、AIを搭載した製品が“主役”になる
生成AIによるマルチモーダルな処理が期待されるところですが、まだ出始めたばかりでハードへの組み込みが本格化するのは来年な気がします。会話できるデバイスというだけでは(技術的には大きな進歩でも)がっかりされてしまいそうです。
一番の注目はエッジ側での処理性能の向上ですかね。オフラインで処理が完結できるのは速度、セキュリティ、ネットワーク環境に依存しないといった点で従来通り注目度が高いです。
OpenAI、「GPT Store」を今週開設へ--独自の「GPTs」を公開可能に
各人がカスタムChatGPTを公開できるGPTsを、AppleのApp Storeのような形で公開し収益化できる「GPT Store」をOpenAIがまもなく公開するとのこと。
GPTsの例はこちらやこちらにある通りで、誰でも簡単に作ることができることから既に大いに流行っているが、収益化も可能になることで作成が加速化しそう。OpenAIはその技術力もさることながらプラットフォームを握りに行くビジネス感覚も非常に長けている。
Technology
DOCLLM: A LAYOUT-AWARE GENERATIVE LANGUAGE MODEL FOR MULTIMODAL DOCUMENT UNDERSTANDING
JPMorganの発表したDocLLM。レイアウト情報も活用してLLMによる文書理解を行う。元来のLLMはテキスト情報の処理に特化していて空間的情報は捨象してしまう点の改善を試みている。ほぼ同タイミングでDocGraphLLMという研究も発表。投資銀行の研究ということで実務で扱う機会の多い文書理解の高度化に力を入れている模様。
Editor Picks
OpenAI、New York Timesによる著作権侵害提訴は「法的根拠なし」と公式ブログで反論
著作権侵害をせずに大規模言語モデルをトレーニングするのは事実上不可能となると、訴訟リスクを背負ってLLM開発に挑めるのも体力のある一握りの企業になるということで、こんな側面でもLLM開発に中小企業が挑む障壁を感じます。
今日の著作権は、ブログ投稿、写真、フォーラムの投稿、ソフトウェアコードの断片、政府文書など、事実上あらゆる種類の人間の表現を対象としているため、著作権で保護された素材を使用せずにAIモデルをトレーニングすることは不可能
AI訓練の熱で部屋を暖め、収入も得られる 米スタートアップの電気ヒーター
コンピューティングパワーをAIのトレーニングに貸し出すことで、月額28USDの報酬が得られる暖房。今は1000USD近い値段だが確実に下がりそう。