みなさんこんにちは、
現在、ヒューマノイドロボットのためのAIセキュリティに関する修士論文を作成しており、VLM/VLAに対する敵対的攻撃に焦点を当てています。これまでにLLMのジェイルブレイクについて多少触れたことはありますが、VLMやVLAとなると、正直まだかなり新しく、どうやって適切に始めればよいのかよく分かっていません。
今のところ、NVIDIA Jetson Thorにアクセスできていて、レッドチーミングの目的でまずはアラインされていないモデルから始め、その後に防御の構築へ進むことを考えています。また、出発点としてNVIDIA Cosmos Reason 2を使うことも検討しています。
この段階では、いくつか大まかなアイデアはあるものの、まだ明確な方向性はありません。この分野での経験がある方や、良い始め方、論文、ツール、あるいは一般的な手順などを提案していただける方がいれば、とてもありがたいです。
事前にありがとうございます!
[リンク] [コメント]



