エージェントは素晴らしい。ハーネスはかっこいい。でも、データサイエンティストの根本的な役割は、既存のワークフローに一般化モデルを使うことではありません。それはまったく別の分野です。
AIエンジニアリングは車体です。一方で、それを動かす実際の脳/エンジンは、データサイエンティストの遊び場です。
私は、この気づきの中でひとりではないように感じています。つまり、自分の役割が、なぜか静かにAIエンジニアのそれへと変わっていってしまい、そのエンジン(中身)の開発が完全に後回しになっているように思えるのです。業界の要件や進行中の研究に基づくと、大部分の作業は、エンジンを作ることから、それを取り囲む車体部分を磨くことへと、静かに移ってしまいました。
経済的にはそれは理にかなっています。LLMやその他のディープラーニングモデルで作業するのは資本集約的で、誰もがそれを賄えるわけではないからです。しかし、役割のアイデンティティのほとんどがほとんど維持されていないという事実は、気がかりです。
データサイエンティストと話すとき、ほとんどの場合、返ってくる中心的な答えは「自分たちは“筋肉”を保つためにモデルを微調整している」ということです。でも、微調整はデータサイエンティストの役割の中ではごく一部です。いや、ある時点を過ぎると、それすら最も重要な部分ではありません。微調整はツールです。理解することが、役割の土台になるべきだと私は考えています。
「transformers」以外にも何があるのかを理解し、それらが全体の中でどこに収まるのかを見つけること。そして、彼らのシステムにとってデータがどれほど重要かを理解できていない点については、語り始めたくないくらいです。
データサイエンティストの主要な役割は、モデルそのものではありません。モデルを開発すること、手元にあるデータ品質、適切な問題設定、効率面の懸念、アーキテクチャに関するリテラシー、評価設計、そして誤り分析のことです。AIブームの渦中で、多くの人が「その役割のかなりの部分が静的であり、重要だと見なされていない」ことを見落としてきました。
AIエンジニアリングは素晴らしい分野です。モデルで素晴らしいことをするのが好きな人たちは、いつも私を刺激してくれます。しかし、どういうわけか、現在の業界では、データとモデリングの土台となる科学的な側面に対して、同じ注意と敬意がもう払われなくなってしまっています。もちろんいつも白黒はつけられるわけではないと分かっていますが、それでも面白いのは、このグレーが日を追うごとに少しずつ暗くなっていくように見えることです。
あなたも同じ気持ちですか?それとも、ただ私自身の内なる危機の鐘が、不要に鳴っているだけなのでしょうか?
この変化を認識した方々は、キャリアをどうやって扱っていますか?エンジニアリング/システム側に寄せて、従来のモデル開発を手放しているのでしょうか?それとも、いまだに(データ品質、アーキテクチャのリテラシー、統計的な厳密さといった)根本的なデータサイエンティストの役割を価値あるものとしているニッチな職種や企業を見つけましたか?あなたがどのように適応しているのか、ぜひ聞かせてください
[link] [comments]




