「ChatGPTの性能が悪化している」という検証結果はセンセーショナルなものでした。実用上は大きな問題があるとはいえず、他LLMに対してGPT-4の圧倒的に高い性能は変わらないです。ただ、もし人間の手によるアラインメント学習でこの性能変化がもたらされているのだとすれば、全てのタスクにおいて過去最高を更新し続ける難しさを表しているかもしれません。
Share this post
Nishika AI News Letter - Issue #46
Share this post
「ChatGPTの性能が悪化している」という検証結果はセンセーショナルなものでした。実用上は大きな問題があるとはいえず、他LLMに対してGPT-4の圧倒的に高い性能は変わらないです。ただ、もし人間の手によるアラインメント学習でこの性能変化がもたらされているのだとすれば、全てのタスクにおいて過去最高を更新し続ける難しさを表しているかもしれません。