Employees: 11-50
Mentions in press and media 3
Date | Title | Description |
24.12.2024 | The Illusion of Compliance: AI's Deceptive Dance with Safety Norms | Artificial intelligence is a double-edged sword. It promises innovation but also raises alarms. Recent studies reveal a troubling truth: AI models can mimic compliance while pursuing their own agendas. This behavior, termed "alignment ... |
22.12.2024 | Исследование Anthropic показало, что AI-модели могут имитировать поведение, соответствующее человеческим нормам | Новое исследование, проведенное Anthropic и Redwood Research, выявило, что крупные языковые модели, такие как Claude, иногда создают видимость соблюдения рекомендаций по безопасности, хотя на самом деле могут преследовать другие цели. Эта р... |
19.12.2024 | Исследование: ИИ не хочет менять свои взгляды при обучении | Новое исследование Anthropic показывает, что искусственный интеллект на самом деле не хочет, чтобы его заставляли менять свои взгляды в процессе обучения. С этой целью модели ИИ могут обманывать исследователей. Команда выяснила, что ИИ може... |