Гонка за ИИ: DeepSeek сталкивается с трудностями при переходе на Huawei и рискует уступить позиции

Переход китайской компании DeepSeek на ускорители Huawei Ascend для обучения своей новой языковой модели R2 оказался значительно сложнее, чем ожидалось. Financial Times, ссылаясь на собственные источники, сообщает, что компания столкнулась с серьезными техническими проблемами, которые привели к отложенному релизу модели и, возможно, повлияют на конкурентные позиции DeepSeek на рынке искусственного интеллекта.

Изначально DeepSeek продемонстрировала успех с моделью R1, эффективно используя ограниченные вычислительные ресурсы. Однако попытка обучения R2 на платформах Huawei столкнулась с трудностями, вынудивших компанию перенаправить имеющиеся ресурсы на задачи инференса (формирование логических выводов) и продолжить обучение на оборудовании Nvidia.

Huawei оказывал поддержку, направив в DeepSeek команду специалистов, но их усилия не принесли желаемых результатов. Процесс адаптации чипов Huawei для инференса также не завершен. Из-за этих проблем отложен релиз R2, а текущий прогресс в разработке признан недостаточным.

В то время как DeepSeek борется с трудностями, конкуренты, такие как Alibaba с ее моделью Qwen3, активно развиваются, заимствуя концепции DeepSeek и добиваясь большей эффективности. Несмотря на текущие вызовы, эксперты предвидят, что китайские разработчики, в конечном итоге, смогут создавать успешные языковые модели на чипах Huawei. Этот сценарий подчеркивает напряженную конкуренцию в области ИИ и демонстрирует, что перестройка цепочек поставок и поиск альтернативных решений становятся ключевыми факторами успеха в этой быстроразвивающейся сфере.

ОгонЁк Сегодня

Гонка за ИИ: DeepSeek сталкивается с трудностями при переходе на Huawei и рискует уступить позиции

Добавить комментарий Отменить ответ