Anthropic 공식 채널의 새 소식입니다. usingclaude.com이 자동으로 수집하여 공유하며, 본문 전체와 정확한 맥락은 원문에서 확인해 주세요.
Automated Alignment Researchers: Using large language models to scale scalable oversight
Anthropic is an AI safety and research company that's working to build reliable, interpretable, and steerable AI systems.
발행: 2026-06-05T15:19:26.000Z
출처: https://www.anthropic.com/research/automated-alignment-researchers