28 Февраля Financial Times сообщила, что DeepSeek на следующей неделе выпустит новую мультимодальную модель большого языка V4 с собственной поддержкой генерации изображений, видео и текста. Это первое крупное обновление после запуска версии R1 в январе 2025 года, ориентированной на логические рассуждения, и оно должно удовлетворить спрос на недорогие модели с открытым исходным кодом в Китае.
Вместе с выпуском V4 DeepSeek опубликует краткое техническое объяснение, а подробный инженерный отчет ожидается примерно через месяц. Компания сотрудничает с Huawei и Cambricon для оптимизации аппаратной адаптации, что должно ускорить процессы инференса и повысить спрос на отечественные полупроводники.
В отличие от обычной практики, DeepSeek предоставляет ранний доступ в основном китайским поставщикам, включая Huawei, не выпуская тестовых версий для NVIDIA и AMD, с которыми он ранее тесно сотрудничал. Предыдущая версия V4 с кодовым названием «sealion-lite» прошла закрытое тестирование, поддерживая контекст до 1 миллиона токенов и мультимодальные возможности для анализа больших текстов и кодовых библиотек.
Ранняя информация предполагает, что V4 может стать мега-фундаментальной моделью с масштабом до триллиона параметров, обеспечивая глубокое понимание сложных входных данных и значительно расширяя возможности мультимодальных систем искусственного интеллекта.

