Anthropic 공식 채널의 새 소식을 AI가 분석·정리한 글입니다. 정확한 내용과 맥락은 반드시 하단 원문에서 확인해 주세요.
Claude Fable 5 재배포
🤖 AI 분석 (Claude)
미국 정부가 6월 12일 Claude Fable 5와 Claude Mythos 5에 수출 규제를 적용했고, Anthropic은 국적 실시간 검증 방법이 없어 모든 사용자에게 두 모델의 접근을 일시 중단했다. Amazon 연구팀이 Fable 5의 안전장치를 우회하는 방법을 발견했으며, 이 기술을 통해 소프트웨어 취약점과 그 악용 방법을 식별할 수 있었다.
Anthropic의 테스트 결과 Claude Opus 4.8, GPT-5.5, Kimi K2.7 등 훨씬 덜 강력한 모델들도 같은 취약점을 찾아낼 수 있었고, 취약점 악용 방법은 테스트한 모든 모델이 동일하게 생성했다. 보고된 기법은 Mythos 수준의 사이버 능력을 노출하지 않았으며, 방어적 사이버보안 작업만 포함했다.
Anthropic은 정부와 협력해 개선된 안전 분류기를 훈련했고, 차단된 요청은 Opus 4.8로 리다이렉트된다. 동사는 Amazon, Microsoft, Google과 함께 AI 탈옥의 심각도를 평가하고 개발사의 대응 방식을 표준화하는 합의 프레임워크 개발에 착수했다.
왜 중요한가
강력한 AI 모델의 사이버보안 능력이 악의적으로 악용될 위험에 대응하기 위해 Anthropic은 안전장치를 강화하고 차단된 기능을 더 약한 모델로 대체함으로써 사용자 경험 저하를 감수했다. 더 중요하게는, 업계 전반에 적용할 수 있는 탈옥 심각도 판단 기준을 마련해 앞으로 더 강력한 AI 모델들을 더 안전하게 배포할 수 있는 체계적 방식을 만들려 한다.
⚠️ AI가 원문을 바탕으로 생성한 분석입니다. 사실 확인은 아래 원문에서 해 주세요.
Anthropic is redeploying Claude Fable 5 starting July 1 following the lifting of export controls, with updated cybersecurity safeguards and a new industry jailbreak framework.
출처: https://www.anthropic.com/news/redeploying-fable-5