たとえば、大規模モデルって実際にはあまり出来の良いデータセットを持っていないことが分かってます。だから、重複も手抜きもなく、質の高い文章でぎっしり詰まったローカルモデルを想像してみてください。何かクラウドソーシングでその作業を集められないのでしょうか?
でも、たぶん問題は、みんなが「良い」と思うものの基準がそれぞれ違うってことなんだと思います。紫がかった散文(パープル・プローズ)を好きだっていう人を見たことがあります!
本当の解決策は、私がただGPUをレンタルしてクソみたいなものを学習させることなのかもですね(笑)
[link] [comments]