Google открыла публичный доступ к TranslateGemma-семейству компактных языковых моделей, которые специализируются исключительно на переводе. В отличие от универсальных ассистентов, эта система заточена под одно задание и делает его хорошо: 55 языков, работа офлайн, поддержка текста и изображений одновременно.
Публичный Google Translate-это облачный сервис. Каждый запрос поступает на серверы компании, там обрабатывается и возвращается обратно. Для частного использования это нормально. Но для бизнеса, медицины, юриспруденции или государственного сектора такая схема неприемлема: данные не должны покидать пределы компании. TranslateGemma решает эту проблему, поскольку модель полностью размещена на вашем оборудовании. Кроме того, облачные API стоят денег при больших объемах, а локальная модель — это одноразовая загрузка и никаких ограничений.
В основе лежит архитектура Gemma 3 — та же самая, которую Google использует в своих мультимодальных моделях. TranslateGemma донучили на 4,3 миллиарда токенов параллельных текстов: это пары «оригинал — перевод» на десятках языковых пар. Дополнительно модель прошла этап обучения с подкреплением на 10,2 миллиона токенов — это улучшает точность и естественность перевода.
Весит модель 4 миллиарда параметров, для сравнения: GPT-4-это примерно 1,8 триллиона параметров. TranslateGemma в 450 раз меньше, при этом в своей нише показывает результаты, сравнимые с гораздо более тяжелыми системами. Контекстное окно-2000 токенов. Это примерно 1500 слов за один запрос, чего хватит для большинства документов и сообщений.
https://itechua.com/wp-content/uploads/2026/03/Google-выпустила-бесплатный-ИИ-переводчик-360p.mp4
Модель реально умеет читать текст с изображений и сразу его переводить. Технически это работает так: изображение нормализуется до разрешения 896×896 пикселей и кодируется в 256 токенов, далее модель обрабатывает его наравне с текстом. На практике: сфотографировали меню в зарубежном ресторане, дорожный знак, иностранный контракт или интерфейс программы — получили перевод без промежуточного шага с распознаванием текста вручную.
Запустить можно локально через Python-библиотеку Transformers. Нужна видеокарта с поддержкой CUDA (подойдет большинство современных Nvidia) и несколько гигабайт VRAM. Или прямо в браузере через WebGPU и Transformers.js v4. Это означает, что модель может быть встроена в веб-приложение и будет работать на устройстве пользователя без сервера.
Для разработчиков модель доступна на HuggingFace. Лицензия Google разрешает коммерческое использование при соблюдении условий Gemma Terms of Use. Такой переводчик полезен, прежде всего, командам, которые работают с конфиденциальными текстами и не могут отправлять их в облако. Разработчикам, которые встраивают перевод в свои собственные продукты и хотят избежать зависимости от внешних API. Исследователям, которым нужен контроль над инфраструктурой. И всем, кто хочет работать с документами на 55 языках без ежемесячной подписки.

