
新しいベンチマークでは、主要な言語モデルを、販売におけるデータの悪用から腫瘍学におけるプロトコル違反まで、日常の倫理的シナリオ100件に通します。その結果の背後には、より大きな問いがあります。つまり、AIに何を許可するかを誰が決めるのか、そしてそれは誰の倫理に従うのか、ということです。
この記事 Same prompt, different morals: how frontier AI models diverge on ethical dilemmas は The Decoder に最初に掲載されました。




