Geminiの熱狂とその後の「がっかり」もその一端かもしれませんが、AIの開発陣が追いかけるベンチマークの評価の進捗と、ビジネス的な進捗の乖離がHotな問題です。 何か指標がないと技術進捗したというコンセンサスが得られない、一方でその指標の改善のみを持ってニュースにすると実際に使ってみたときの「がっかり」が増すという「上げて落とす」サイクルが繰り返されます。 オープンドメインなタスクに対応できる生成AIは、AIの適切な評価という観点でも、これまでの考え方を揺るがしてきています。 Promotion
Nishika AI News Letter - Issue #55
Nishika AI News Letter - Issue #55
Nishika AI News Letter - Issue #55
Geminiの熱狂とその後の「がっかり」もその一端かもしれませんが、AIの開発陣が追いかけるベンチマークの評価の進捗と、ビジネス的な進捗の乖離がHotな問題です。 何か指標がないと技術進捗したというコンセンサスが得られない、一方でその指標の改善のみを持ってニュースにすると実際に使ってみたときの「がっかり」が増すという「上げて落とす」サイクルが繰り返されます。 オープンドメインなタスクに対応できる生成AIは、AIの適切な評価という観点でも、これまでの考え方を揺るがしてきています。 Promotion