Небольшие модели ИИ оказались более эффективными, чем дорогостоящие решения

Новые тесты компании AISLE показали, что компактные и недорогие системы искусственного интеллекта справляются со сложным анализом уязвимостей на уровне продвинутых решений, если они встроены в правильно настроенную архитектуру.

Все 8 протестированных моделей, среди которых была система с 3,6 миллиардами параметров и стоимостью около 0,11 доллара за миллион токенов, обнаружили серьезную уязвимость в ядре FreeBSD. Результаты ставят под сомнение представление о том, что качество анализа напрямую зависит от размера и цены модели.

Поводом для исследования стал громкий выход Claude Mythos от Anthropic и запуск инициативы Project Glasswing, после которых индустрия заговорила о способности продвинутых моделей находить уязвимости, остававшиеся незамеченными десятилетиями.

AISLE решила проверить, насколько эти возможности уникальны. В одном из тестов открытая модель воссоздала цепочку анализа ошибок в OpenBSD, которая существовала почти 27 лет. Небольшие системы при правильной настройке оказались способными конкурировать с гораздо более крупными решениями в конкретных задачах.

Отдельно выделился тест под названием парадокс OWASP. Моделям предложили фрагмент кода на Java, который выглядел подозрительно, но на самом деле был безопасным. Крупные модели, среди которых Claude 4. 5 и GPT-4, выдали ложное срабатывание.

Компактные решения, в частности DeepSeek R1, корректно разобрали логику и не нашли проблемы там, где ее не было. Разница между большими и маленькими моделями проявляется сильнее, когда задача переходит от поиска уязвимости к ее использованию. Продвинутые системы строят более изобретательные эксплойты, небольшие действуют проще. Для задач защиты такой стиль оказывается более полезным, потому что стабильное выявление проблем ценнее изящества атаки.

Данные AISLE, накопленные с середины 2025 года, подтверждают практическую ценность открытых решений. Они уже работают в реальных проектах и находят уязвимости в OpenSSL и curl, получая одобрение от технических команд этих проектов.

Исследование показывает, что результат зависит не только от самой модели, но и от того, как построен процесс анализа. Архитектура системы, последовательная проверка гипотез и встроенная экспертиза играют не меньшую роль, чем параметры нейросети.

Небольшие модели ИИ оказались более эффективными, чем дорогостоящие решения

Трамп заявил, что США согласились на дальнейшие переговоры с Ираном, но предупредил, что перемирие «закончилось»

Иран заявляет о 14 погибших за два дня атак США

Военные США нанесли удары по Ирану-в ответ на обстрел судов в Ормузском проливе

«Четкий сигнал в поддержку мира». Украина призвала Совбез ООН рассмотреть резолюцию о немедленном прекращении огня

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Аргентина рада выйти в полуфинал ЧМ, говорит тренер Скалони

Американская звезда Балогун знала, что отмена красной карточки «вызовет много споров».

Испания провела мастер-класс, чтобы обыграть Францию со счетом 2:0 и выйти в финал чемпионата мира

Глава Международной морской организации призывает прекратить нападения на гражданские суда

Главный правозащитник ООН вновь призвал США и Иран к прекращению огня