「3年前の自分」への懐かしさ…

Reddit r/LocalLLaMA / 2026/4/22

💬 オピニオンSignals & Early TrendsIdeas & Deep Analysis

要点

  • 著者はここ約3年でのAIの急速な進歩を振り返り、初期のChatGPT体験、APIキー入手後の試行、そしてGPT-4やGPT-3.5-turboの時代の“覇者”感などを挙げています。
  • それらのモデルを取り巻くエコシステムとして、限られた無料のGPT-4メッセージを提供するサービスや、DALL·E 3の初期連携などの動きが触れられています。
  • 当時はまだモデル能力が十分でなく、BabyAGIのような「エージェント的」な試みがうまくいかないことも多かったと回想しています。
  • 文章だけでなく、音声クローンや音声デモの高度化(ElevenLabsなど)、画像に基づく位置特定、そしてメディア/写真トレンドの変化といった幅広い進展にも言及があります。
  • 結論として、AIの進化が短期間に“複数の時代”が圧縮されたように感じられるほどの速さで進んでいる、という点が要旨です。

私だけですかね、それとも最近AIを振り返っていて感じたような気持ちを、ほかの人も同じように経験していますか?初期のChatGPTページ、初めてAPIキーを取ってOpen Interpreterを試したときのこと、そしてその当時はGPT-4が頂点だったことを覚えています。いわゆる古いgpt-3.5-turbo、最初のChatGPT。あと当時はいくつか別のモデルもあって、text-davinci-003とかそんなやつもありました。あ、その前にGeminiシリーズが出る前、GoogleはPalm-2ってありましたっけ?Geckoは覚えていますか?正直、これについてはそれ以上あまり聞きませんでした。とはいえ、公平に言うとGoogleはそもそもそういうことをすでにやっていましたね。オープンソースのエッジモデルを出して。 当時、BabyAGIのようなプロジェクトでAPIを使ってエージェント的な行動を試みて、モデルがその時点ではそれをこなせるほどの能力がなかったせいで99%の確率で失敗した、そういうプロジェクトがたくさんありました。誤解しないでほしいんですが、Open Interpreterと3.5 turboではかなりのことを達成できました。でもBabyAGIのようなプロジェクトは何も実りませんでした。 それからGPT-4。そう、GPT-4です。クォータは限られていたけど(当時は)素晴らしい回答が返ってきた。クォータがリセットされるときのために、難しいプロンプトを全部保存しておく。GPT-4のメッセージを提供してくれる外部サービスを通じてアカウントを作成する。 「無料でGPT-4メッセージをx分だけもらえる!」みたいな、そういうアプリやWebサイトが大量にあって、価値のあるコードを手に入れるためだけにサインアップする人が多かった。APIは、OpenAI経由で直接サインアップすると$5のクレジットがもらえるだけでした。Dall-E 3の最初期も、外部プラットフォームで提供されていた頃は素晴らしかったです。MicrosoftがそれをBingに追加して、日次のポイントが尽きるまで、そこで無料の画像を大量に生成できるようにした。Elevenlabsは、恐ろしく正確な音声モデルや、さらにはクローンまでリリースしました。次に進んだ音声では、デモで見せつけるように披露して、明らかなHerのパクリだと分かる感じでした。画像に基づくロケーション特定。写真のトレンド。 そして最近はMythos。とにかく、ありとあらゆることが起きました。本音を言えば、たくさん省いていますが、全部書いたら一日中ここにいられるでしょう。要点は、どれだけのことが起きたかが本当にすごいということです。もちろん、これはムーアの法則とコンピュータ、そしてAI開発の当然の帰結だとは分かっていますが、それでも目で見て体験するのは驚異的です。個人的に、これらを振り返ると、文字通り懐かしい気持ちになってしまうんです。まるで何年も前のことのような…でも、たった3年しか経っていない。

TL;DR:

AIはとんでもない速さで進化した—(初期のChatGPT、GPT-3.5、GPT-4の制限、BabyAGI、DALL·E、音声クローンなど)まるで1つの大きな時代全部みたいに感じる出来事が、たった約3年で全部起きていて、しかももう懐かしく感じてしまう。

submitted by /u/Dion-AI
[link] [comments]