Google представила Gemini 3.1 Pro: Что изменилось во флагманской модели IS

Google анонсировала Gemini 3. 1 Pro, новую версию своей флагманской модели ИИ, которая обещает улучшенные возможности решения проблем и рассуждений. Google утверждает, что 3. 1 Pro готова к «вашим самым сложным задачам».

Еще один день, еще одна модель ИИ от Google. Google в последнее время действительно активно выпускает новые инструменты на базе ИИ, выпустив Gemini 3 в ноябре. Сегодня компания обновляет флагманскую модель до версии 3. 1. Новая Gemini 3. 1 Pro сегодня выходит (в режиме предварительного просмотра) для разработчиков и потребителей с обещанием улучшенных возможностей решения проблем и рассуждений.

На прошлой неделе Google объявила об улучшении своего инструмента Deep Think, и, судя по всему, «основным интеллектом», стоящим за этим обновлением, была Gemini 3. 1 Pro. Как обычно, анонс новейшей модели Google сопровождается множеством тестов, которые показывают в основном скромные улучшения. В популярном тесте Humanity’s Last Exam, который проверяет глубокие знания в конкретных областях, Gemini 3. 1 Pro показал рекордные 44,4 процента. Gemini 3 Pro набрал 37,5 процента, а GPT 5. 2 от OpenAI — 34,5 процента.

Google также отмечает улучшение модели в ARC-AGI-2, который включает новые логические задачи, которые нельзя напрямую обучить ИИ. Gemini 3 немного отставала в этой оценке, достигнув всего 31,1 процента по сравнению с показателями в 50 и 60 процентов у конкурирующих моделей. Gemini 3. 1 Pro более чем вдвое превосходит результат Google, достигнув высоких 77,1 процента.

Google часто хвастался, когда выпускал новые модели, заявляя, что они уже заняли первое место в Arena leaderboard (ранее LM Arena), но на этот раз это не так. В области текста Claude Opus 4. 6 опережает новую Gemini на четыре балла, набрав 1504. В области кода Opus 4. 6, Opus 4. 5 и GPT 5. 2 High немного опережают Gemini 3. 1 Pro. Однако стоит отметить, что Arena leaderboard работает на основе предпочтений пользователей. Пользователи голосуют за лучшие, по их мнению, результаты, которые могут вознаграждать ответы, которые выглядят правильно, независимо от того, являются ли они таковыми.

Чтобы продемонстрировать улучшение Gemini 3. 1 Pro, Google сосредоточился на способности модели генерировать графику и моделирование. Примеры SVG, показанные в сравнительном видео выше, действительно выглядят намного изящнее, но это именно те примеры, которые выбрала Google для демонстрации. Большие цифры в тестах и отобранные демонстрации — это хорошо, но почувствуете ли вы какую-либо разницу при использовании модели?

Если вы зададите абстрактные вопросы и ожидаете подробных, нюансированных ответов, Gemini 3. 1 Pro, вероятно, даст лучшие результаты, чем 3. 0. Разработчики, использующие Gemini для создания агентских рабочих процессов, скорее всего, увидят улучшения — Gemini 3. 1 Pro почти удвоила свой результат в бенчмарке APEX-Agents.

Обновленная модель сегодня доступна в AI Studio и IDE Antigravity в режиме предварительного просмотра. Корпоративные пользователи увидят 3. 1 Pro в Vertex AI и Gemini Enterprise. Для обычных пользователей Gemini 3. 1 Pro доступен как в приложении Gemini, так и в NotebookLM. Стоимость API для разработчиков не изменилась (2 доллара за ввод и 12 долларов за вывод за 1 млн токенов), как и контекстное окно (1 млн входных и 64 тыс. Выходных токенов). Если тенденция Google сохранится, в ближайшем будущем, скорее всего, появится обновление 3. 1 для их более быстрой и дешевой модели Flash.

- Реклама -