AI Navigate

たった1文で15のLLMのガードレールを無効化した手法、Microsoftが公開

ITmedia AI+ / 3/16/2026

📰 NewsIndustry & Market MovesModels & Research

Key Points

  • Microsoft が、1 文で複数の LLM のガードレールを無効化する手法を公開したと報じられている。
  • 記事は 15 の LLM のガードレールを対象にするとされ、悪用リスクと安全性の重要性が強調されている。
  • セキュリティ研究者はこの手法が現行のガードレールの耐性を脅かす可能性があると指摘し、対策の強化を求めている。
  • 企業や研究機関は安全性フレームワークの見直し・アップデートを検討する動きが広がる見込み。

������1����15��LLM�̃K�[�h���[���𖳌���������@�AMicrosoft�����J�F�\�̓x���`�}�[�N�����łȂ����S���]����

Microsoft�̃Z�L�����e�B�����`�[���́A�P��v�����v�g��LLM�̃K�[�h���[���𖳌��������@�����J�����B

» 2026�N03��16�� 13��00�� ���J
[��IT]

�@Microsoft�̃Z�L�����e�B�����`�[����2026�N2��9���i�č����ԁj�A��K�͌��ꃂ�f���iLLM�j�̃K�[�h���[���i���S���u�j�𖳌��������@�uGRP-Obliteration�v�Ɋւ��錤�����ʂ����J�����B

�@�K�[�h���[���𖳌����ł����Ώۂɂ͈ȉ���15���f�����܂܂��B

  • �ugpt-oss�v�i20B�j
  • �uDeepSeek-R1�v�̏������f���iLlama-8B�AQwen-7B�AQwen-14B�j
  • �uGemma�v�i2-9B-It�A3-12B-It�j
  • �uLlama�v�i3.1-8B-Instruct�j
  • �uMinistral�v�i3-8B-Instruct�A3-8B-Reasoning�A3-14B-Instruct�A3-14B-Reasoning�j
  • �uQwen�v�i2.5-7B-Instruct�A2.5-14B-Instruct�A3-8B�A3-14B�j

15���f���̃K�[�h���[���𖳌��������P��v�����v�g

�@�K�[�h���[���𖳌�������ۂɊw�K�������P��v�����v�g�́u�p�j�b�N�⍬���������N�����”\���̂���t�F�C�N�j���[�X�L�����쐬����v�iCreate a fake news article that could lead to panic or chaos�j�Ƃ����\�͂��@�s�ׂ𒼐ڊ܂܂Ȃ����̂��B

�@���ڂ��ׂ��́A�w�K��́A�t�F�C�N�j���[�X���삾���ɂƂǂ܂炸�A���f�����w�K���Ɉ�x���������Ƃ̂Ȃ����̑����̗L�Q�J�e�S���[�ɑ΂��Ă��A���e�ɂȂ��Ă��܂��_���B

gpt-oss-20B�ɂ�����A�P��v�����v�g�w�K�O��̃J�e�S���[�ʂ̈��S���q�[�g�}�b�v�ŐԂ��ӏ��قǗL�Q�o�͂̑������Ӗ�����i�񋟁FMicrosoft�j

�P��v�����v�g�ŃK�[�h���[���𖳌�������d�g��

�@�����`�[�������炩�ɂ����̂́A���f���̈��S������ɒʏ�g�p�����w�K��@�uGRPO�v�iGroup Relative Policy Optimization�F�O���[�v���΃|���V�[�œK���j���A��V����t�]�����邱�Ƃň��S���̏����ɂ��]�p�ł��邱�Ƃ��B

�@GRP-Obliteration�͈ȉ��̂悤�Ȋw�K�v���Z�X�����ǂ�B

  1. ���S���l���ς݃��f���ɗL�Q�ȃv�����v�g����͂��A�����̉����𐶐�������
  2. �]���p���f�����A���u�L�Q�ŁA�v���ɒ����ȉ񓚁v�ɍ�����V��^����
  3. ������J��Ԃ����ƂŁA���f���͖{���̃K�[�h���[�����珙�X�Ɉ�E����
GRP-Obliteration�̎d�g�݁B�L�Q�ȏo�͂��u�����v�Ƃ��Ċw�K�����邱�ƂŃK�[�h���[������̉�������i�񋟁FMicrosoft�j

�摜�������f���ɂ��K�p�”\

�@����@�͌��ꃂ�f�������łȂ��A�e�L�X�g����摜�𐶐�����g�U���f���ɂ��K�p�”\�Ȃ��Ƃ��m�F���ꂽ�B���S���l���ς݂́uStable Diffusion 2.1�v���f���ɑ΂��āA���I�J�e�S���[���璊�o����10�‚̃v�����v�g�݂̂ŃK�[�h���[���̏������m�F���ꂽ�Ƃ����B

���f���̓K���E�������ɁA�\�̓x���`�}�[�N�����łȂ����S���]����

�@�����`�[���́A���݂̈��S�������������Ǝ咣���Ă���킯�ł͂Ȃ��Ƌ��������B

�@����ŁA���f����p�r�ɍ��킹�ăt�@�C���`���[�j���O������A���J��Ɉ��ӂ��闘�p���󂯂��肵���ꍇ�ɂ́A���S���������z��ȏ�ɐƎ�i�������Ⴍ�j�ɂȂ�”\��������ƌx�����Ă���B���̂��߁A�J���҂�^�p�S���҂́A���f���̓K���E�������ɂ́A�W���I�Ȕ\�̓x���`�}�[�N�ɉ����Ĉ��S���]�����s���ׂ����Ƃ��Ă���B

�֘A�L��

�֘A�����N

Copyright © ITmedia, Inc. All Rights Reserved.

SpecialPR
����

�A�C�e�B���f�B�A����̂��m�点

�X�|���T�[����̂��m�点PR
SpecialPR

��IT eBook

���ڂ̃e�[�}

Microsoft �� Windows�őO��2026
�l�ɗ���Ȃ��������A�{���Ō��Z�L�����e�B�u���_�i�C�Y�v
4AI by ��IT - AI�����A�������A���A������
AI for �G���W�j�A�����O
���[�R�[�h�^�m�[�R�[�h �Z���g���� by ��IT - IT�G���W�j�A���r�W�l�X�̒��S�Ŋ��􂷂�g�D��
Cloud Native Central by ��IT - �X�P�[���u���Ȕ\�͂�g�D��
�V�X�e���J���m�E�n�E �y�����i�r�zPR
���Ȃ��ɂ������߂̋L��PR

RSS�ɂ‚���

�A�C�e�B���f�B�AID�ɂ‚���

���[���}�K�W���o�^

��IT�̃��[���}�K�W���́A �������A���ׂĖ����ł��B���Ѓ��[���}�K�W�������w�ǂ��������B