皆さん、こんにちは。私は最近 arXiv にワーキングペーパーを投稿したばかりで、フィードバックをいただけると幸いです。
このワーキングペーパーは、現代のニューラルネットワークが学習する能力における潜在的な構造的制限を検討しています。ほとんどのネットワークは、新しい経験に対する更新を重みの変化を通じて行うため、学習した行動はネットワークのパラメータ空間と密接に結びついています。
この論文は、継続学習の問題、行動制御、そして安全性の問題のいくつかが、モデルを訓練するための手法自体ではなく、重み中心の学習構造自体の性質に起因するものかもしれないかを検討します。
概念的な貢献として、私は Reversible Behavioral Learning(可逆的行動学習)と呼ぶ概念を探求します。学習された行動は、基盤となるモデルに影響を与えずに、追加または削除できるモジュール化された行動として捉えることができる、という考え方です。
これは非常に初期の研究概念であり、フィードバックや見逃している関連研究をぜひ教えてください。
[link] [comments]



