実験の一環として、心理療法のデータセットでDPOを使ってGemma 3 4Bを微調整し、(はい、これは絶対に医療アドバイスやセラピストになることを意図したものではありません)仲間として振る舞えるローカルのチャットボットを作ろうとしました。
QLoRaとPeFTを発明した誰かに感謝しなければなりません。おかげで、私のRTX 3050Ti搭載のノートPCで微調整を実行できました。遅かったし、ノートPCは熱を持ちました――でも最終的にはうまくいきました :D
私の微調整済みモデルの、"ストック"のGemma 3モデルに対する改善(あるいは改善がないこと)を評価するために、RTX 3050Ti 4GBの環境でローカルにどんなテストベンチを実行できますか?
[リンク] [コメント]



