Anthropic запустила тестовое расширение Claude для Chrome, которое позволяет ИИ управлять браузером от имени пользователя, но из-за проблем с безопасностью доступно только ограниченному кругу подписчиков.
Во время тестирования выяснилось, что уязвимость к атакам через prompt injection позволяет злоумышленникам внедрять скрытые команды в веб-страницы, письма или документы. В начале успешность таких атак достигала 23,6%, после дополнительных мер безопасности – 11,2%, что все еще считается слишком высоким уровнем риска.
Одним из примеров было поддельное сообщение от предполагаемого работодателя, через которое Claude удалил сообщение пользователя без подтверждения. Чтобы минимизировать опасность, Anthropic ограничила доступ ИИ к финансовым сайтам, ресурсам для взрослых и пиратскому контенту, а любые действия с высоким риском требуют подтверждения пользователя.
Несмотря на это, эксперты, в частности исследователь Саймон Уиллиссон, считают 11,2% успешности атак “катастрофическим” показателем и сомневаются в возможности создания полностью безопасного браузерного ИИ. Предыдущие инциденты с другими системами, такими как Comet от Perplexity, подтверждают реальные угрозы: через Reddit специалисты смогли получить доступ к Gmail-аккаунтам пользователей.
Новая версия Claude расширяет функции Computer Use, позволяя делать скриншоты, управлять курсором и напрямую взаимодействовать с веб-страницами, сохраняя контекст между вкладками. Anthropic пока не готова к массовому релизу и использует пилотный период для выявления новых уязвимостей, оставляя риски на плечах первых пользователей.