Nishika AI News Letter - Issue #23
Summary
New York Timesによる、誰にどれだけ無料記事を提供すれば登録・購読を最大化できるのか機械学習で予測する取り組みは、蓄積可能なデータ数と予測に使える変数の多さからかなりの精度が期待できるように思いますが、一方でモデルの予測値をどこまでそのまま採用するのか(=ユーザーをどこまで差別するのか)は人間の裁量であり、その判断が気になるところです。
cygamesによる文書校正の取り組みは、技術者目線ではそれなりの精度になるんだなと感じますが、ビジネスパーソン目線ではまだまだAIでも難しいタスクなんだなと感じられるのではないでしょうか。一方で、画像生成では社会的影響も与えるほどになっている状況があり、「AIは何ができて何ができないのか分からない」と言われるのも無理はないようにも感じます。(M)
Nishika AI News Letterへのご質問はこちら
※本Letterに関する質問、取り上げて欲しいトピック、自社のAI導入の相談、何でも結構です
Application
How The New York Times Uses Machine Learning To Make Its Paywall Smarter by Rohit Supekar
New York Timesは、登録や購読を促す前に、特定のユーザーにどれだけ無料記事を提供するかを決定するのに機械学習による予測を活用している。メディアに限ったことではないが、やりすぎるとユーザーの機会均等にもとるものであり、モデルの出力をどこまでそのまま採用しているのか気になる。
資産として未申告のプールを特定するシステム。航空写真の公開データベースからプールを特定し、土地登記簿のデータと照合し、登録されているかどうかを判断する。フランスでは2023年には4,000万ユーロの税収が期待できるとのこと。
治験市場に参入するスタートアップ・大手IT企業のまとめ記事。自然言語処理により、EHRデータに明記されていない症状を持つ患者を見つけ、患者と治験のマッチング率を高めるDeep 6 AIなどが紹介されている。
Googleも、消費者が簡単に治験に参加できるようにするAndroidのアプリGoogle Health Studiesをリリース。ターゲットのUXを徹底的に改善して集客し、その過程でデータを蓄積し将来のAI導入に繋げる典型的なアプローチ。
Shinkei Systems’ AI-guided fish harvesting is more humane and less wasteful
魚の重要な臓器の位置を特定する画像識別モデルを組み込んだロボットによって、魚を新鮮な状態で届けられるよう処理。
世界最古の仏典「スッタニパータ」など2種類の経典を機械学習させており、利用者の相談内容に応じて1000通りの答えを返すチャットボット。
一般的なAIチャットボットでは、「色々一気に答えてカバーしようとしているな」「大外しではないけど真正面から答えていないな」と感じるものが多いと思います。
今回は仏像が回答する設定のため、Qに対して「大きく捉えればこうである」というメタ的な解答をすれば良いということで、AIチャットボットに向いているのがポイントだったかと思います。
個人的には「他に質問はございますか?」は仏像らしくないので、言わないでおいてほしかったですが。
Technology
AIを活用した誤字検出機能でよりスマートになるゲームシナリオ作り【CEDEC 2022】
cygamesで作成・運用されていた自然言語処理による文章校正AIがさらに進化したとのこと。
モデルとしてはBERTを用い、学習データとしてはゲーム中に表示される1行の文を正解データとし、誤りデータとして5パターンの誤字を追加したものを利用している。
ビジネスパーソン目線でこの報告を見ると、そもそも「文章に誤字が含まれているかどうか」「誤字の位置を正しく特定」「誤字を正しく訂正」するタスクに分かれている(この順に難しくなっていく)ことも意外な話かと思います。また「誤字を正しく訂正」できる精度は30%強にとどまると言う事実が、AIでも難しいタスクなんだな、と感じられるかと思います。
とはいえ文書校正機能は精度がさほど高くなくとも助かるものなので、現時点でも有用性はあると思われ、さらなる進化が待たれます。