Google анонсировала Gemini 3. 1 Flash-Lite-самую быструю и эффективную модель в серии Gemini 3.она предназначена для больших объемов работы разработчиков и уже доступна для предварительного просмотра через Gemini API в Google AI Studio и Vertex AI для предприятий.
Цена модели составляет $0,25 за 1 млн входных токенов и $1,50 за 1 млн выходных токенов, что делает ее более доступной для тех, кто активно пользуется API. Согласно тестированию Artificial Analysis, Flash-Lite превосходит Gemini 2. 5 Flash по скорости: в 2,5 раза быстрее до первого токена и на 45% выше скорость вывода. Это делает модель идеальной для высокочастотных операций в реальном времени.
Gemini 3. 1 Flash-Lite подходит для больших задач, таких как перевод больших объемов, модерация контента, генерация интерфейсов, создание панелей и симуляций. Модель также поддерживает «уровни мышления», что позволяет разработчикам регулировать глубину обработки задач, балансируя стоимость, скорость и точность ответов.
В рейтингах Arena.ai Flash-Lite достигает Elo 1432, получает 86,9% на GPQA Diamond и 76,8% на MMMU Pro, превосходя более крупную модель Gemini 2. 5 Flash и некоторые модели конкурентов, включая OpenAI и Anthropic. Это делает его привлекательным для разработчиков, которым нужна быстрая и эффективная модель для производственных рабочих процессов.

