据 The Information:一份关于 Anthropic 员工提出的涵盖近 50 个研究项目的备忘录显示,其关注重点在于恶意 AI 代理与欺骗性模型。
 
 
Back to Top