DeepSeek представила подход, позволяющий повысить результативность больших языковых моделей.

Китайская компания DeepSeek в 2025 году опубликовала исследование, в котором предложила новый подход к обучению базовых моделей искусственного интеллекта. Один из авторов работы – глава компании Лян Вэньфэн (Liang Wenfeng).

Метод называется «гиперсвязи с ограничением разнообразия» (mHC). Он помогает моделям работать более эффективно, сохраняя конкурентоспособность с американскими разработками, которые имеют больше вычислительных ресурсов. Статьи DeepSeek публикуются в открытом доступе, отражая культуру открытого обмена знаниями в Китае, и дают представление о технологиях, готовящихся к коммерческому использованию.

Метод mHC тестировали на моделях с 3, 9 и 27 млрд параметров. Он не увеличивает значительно вычислительную нагрузку по сравнению с обычными гиперсвязями (HC), которые ByteDance предложила еще в 2024 году в качестве модификации ResNet – популярной архитектуры глубокого обучения. ResNet помогает обучать очень глубокие сети, сохраняя ключевую информацию во всех слоях. Но стандартные гиперсвязи нагружают память и затрудняют масштабирование больших моделей.

Метод mHC решает эту проблему, сохраняя поток данных и эффективность, но без значительного увеличения нагрузки на память. Это открывает новые пути для развития архитектур нового поколения. По прогнозам, DeepSeek может представить новую крупную модель уже в середине февраля 2026 года.

Deep Seek продемонстрировала метод, который делает большие и-модели более эффективными

Совбез ООН соберется 12 января на заседание из-за применения Россией Орешника

Трамп пригрозил вице-президенту Венесуэлы, если она не будет выполнять требования США

Трамп пригласил в Белый дом президента Колумбии, которого ранее критиковал

Пекин призвал Вашингтон немедленно освободить Мадуро

ОСТАВЬТЕ КОММЕНТАРИЙ Отменить ответ

Аналитики прогнозируют резкий рост цен на SSD и HDD в 2026 году

Медведев победил Накашиму и выиграл трофей Брисбена перед Открытым чемпионатом Австралии по теннису

Почему люди, сделавшие инъекции для похудения, так быстро набирают вес?

В Иране продолжаются акции протеста: Трамп усиливает давление на Тегеран

В Иране угрожают атаковать военных США и Израиля в случае удара Вашингтона