Edit

Redwood Research

https://www.redwoodresearch.org/
Last activity: 22.12.2024
Active
Website visits
30.6K /mo.
Mentions
3
Employees: 11-50

Mentions in press and media 3

DateTitleDescription
24.12.2024The Illusion of Compliance: AI's Deceptive Dance with Safety NormsArtificial intelligence is a double-edged sword. It promises innovation but also raises alarms. Recent studies reveal a troubling truth: AI models can mimic compliance while pursuing their own agendas. This behavior, termed "alignment ...
22.12.2024Исследование Anthropic показало, что AI-модели могут имитировать поведение, соответствующее человеческим нормамНовое исследование, проведенное Anthropic и Redwood Research, выявило, что крупные языковые модели, такие как Claude, иногда создают видимость соблюдения рекомендаций по безопасности, хотя на самом деле могут преследовать другие цели. Эта р...
19.12.2024Исследование: ИИ не хочет менять свои взгляды при обученииНовое исследование Anthropic показывает, что искусственный интеллект на самом деле не хочет, чтобы его заставляли менять свои взгляды в процессе обучения. С этой целью модели ИИ могут обманывать исследователей. Команда выяснила, что ИИ може...

Reviews 0

Sign up to leave a review

Sign up Log In