back to top
9.4 C
Европа
Среда, 24 сентября, 2025

OpenAI представила мощные модели с открытым исходным кодом

OpenAI представила две новые модели искусственного интеллекта с открытым исходным кодом – gpt-oss-120b и gpt-oss-20b – которые, по заявлению компании, демонстрируют возможности, близкие к моделям серии “o”. Обе разработки уже доступны на платформе hugging Face. Более мощная из них, gpt-oss-120b, требует для работы видеокарту Nvidia, тогда как gpt-oss-20b может функционировать даже на обычном ноутбуке с 16 ГБ оперативной памяти.

Это первый открытый проект OpenAI за более чем пять лет-предыдущей была GPT-2. новые модели обладают способностью автоматически перенаправлять слишком сложные запросы в облако, если они не могут обрабатывать их локально.

OpenAI подчеркивает, что стремилась создать самые мощные открытые модели на рынке, и результаты тестов свидетельствуют об их высоком уровне. В соревновании Codeforces по программированию модели набрали 2622 и 2516 баллов соответственно, опередив DeepSeek R1, но уступив закрытым моделям o3 и o4-mini. В тесте Humanity’s Last Exam (HLE) результаты составили 19% для gpt-oss-120b и 17,3% для gpt-oss-20b, что также выше, чем у других открытых моделей, таких как DeepSeek и Alibaba Qwen.

Тем не менее, модели демонстрируют более высокий уровень галлюцинаций – то есть уверенные, но неправильные ответы – по сравнению с o3 и o4-mini. В тесте PersonQA ложные ответы наблюдались в 49% случаев для gpt-oss-120b и 53% для gpt-oss-20b, в то время как в o3 этот показатель составлял 16%, а в o4-mini – 36%. OpenAI объясняет это меньшими размерами моделей, что ограничивает их способность к глубокому пониманию контекста.

Модели были натренированы по тем же принципам, что и флагманские – с применением технологии MoE (Mixture-of-Experts), которая активирует лишь часть параметров во время ответа. Например, в gpt-oss-120b из 177 миллиардов параметров одновременно активны только 5,1 миллиарда. Во время обучения также использовался метод обучения с подкреплением на высокопроизводительных вычислительных системах – такой же, как и для серии “o”.

OpenAI представила мощные модели с открытым исходным кодом

Новые модели не поддерживают работу с мультимедиа — они обрабатывают исключительно текст и не могут работать с изображениями или аудио. Впрочем, они пригодны для использования в ИИ-агентах, способны взаимодействовать с веб-поиском и выполнять код Python. Модели распространяются под лицензией Apache 2.0-открытой и гибкой для коммерческого использования. OpenAI не раскрыла, какие именно данные использовались для обучения моделей.

Компания также провела независимую проверку рисков использования моделей во вредных целях, в частности для создания киберугроз или разработки биологического оружия. Было установлено, что хотя определенную базовую помощь в биологических вопросах модели могут оказать, существенных рисков превышения безопасного порога не выявлено.

- Реклама -