Компания OpenAI анонсировала две новые модели ИИ-o3 и o4-mini, которые демонстрируют улучшенные возможности в сфере логики, математики, программирования и анализа изображений.
Флагманская модель o3 способна «делать паузу для размышлений» перед формированием ответа, что позволяет ей эффективнее решать сложные задачи. Она превосходит предыдущие модели OpenAI по результатам тестов в областях программирования, науки, распознавания изображений и решения проблем. В свою очередь, o4-mini — это более легкая и доступная версия, которая сочетает высокую производительность со скоростью и экономичностью.
Обе модели уже доступны пользователям ChatGPT с подписками Pro, Plus и Team, а также через API — интерфейсы Completions и Responses API.
Ключевые возможности моделей o3 и o4-mini:
- понимание и анализ изображений (даже размытых или низкого качества);
- выполнение кода Python прямо в окне ChatGPT (через Canvas);
- интегрированный поиск в Интернете для актуальных запросов;
- обработка изображений: масштабирование, вращение и т. д.;
- улучшенное понимание таблиц, графиков и формул.
Для задач, требующих максимальной точности, OpenAI предлагает вариант o4-mini — high-он работает медленнее, но тратит больше времени на тщательный анализ и формирование ответа.
Вскоре ожидается еще одна, более мощная версия — O3-pro, ориентированная на максимальное качество, которая станет доступной эксклюзивно для пользователей ChatGPT Pro.
Интересно, что сначала CEO OpenAI Сэм Альтман планировал интегрировать o3 сразу в GPT-5, не выпуская ее отдельно. Однако активная конкуренция со стороны Google, Anthropic, xAI и других игроков вынудила компанию изменить стратегию.
По словам OpenAI, модель o3 делает на 20% меньше ошибок, чем предыдущие разработки, и стала лидером в тестах Codeforces и SWE-bench.
Не исключено, что o3 и o4-mini — это последние «автономные» модели перед появлением GPT-5, которая объединит языковые возможности с логикой и мультимодальностью.