自分の投稿から感じたことなんだけど、要するに全部AIの話なので:-
今は、ほとんどの人がただGPUを借りて、いろんなAIツールを開いて、別のAIを使ってAIを学習しようとしているように感じます。人によっては、データの中身を実際に確認せずに、AIを使って自分の代わりにデータセットを探したりもします。
そして、ランダムなデータセットをそのまま学習に放り込んで、計算資金(compute)にお金を燃やしながら、結果がひどいのはなぜだろうと不思議がるんです。多くの人はまずデータを理解することよりも、ランダムなネットのゴミで学習したモデルから素早い答えが欲しいだけなんです。
いちばんおもしろいのは、データセットを見つけるのを手伝ってくれるAIが、自身でその完全なデータセットを適切に読み取ったり理解できなかったりする点です。トークン制限、アクセス制限、あるいは不完全な文脈のせいでそうなるのに、それでも人々はそれを盲目的に信じて、学習用に何でもかんでも突っ込み続けます。つまり、投入されるデータの品質を誰も実際に見ていないせいで、有用なものを作る代わりに、ただランダムな無意味なものを生成して終わってしまうんです。
[link] [comments]


