Переход китайской компании DeepSeek на ускорители Huawei Ascend для обучения своей новой языковой модели R2 оказался значительно сложнее, чем ожидалось. Financial Times, ссылаясь на собственные источники, сообщает, что компания столкнулась с серьезными техническими проблемами, которые привели к отложенному релизу модели и, возможно, повлияют на конкурентные позиции DeepSeek на рынке искусственного интеллекта.
Изначально DeepSeek продемонстрировала успех с моделью R1, эффективно используя ограниченные вычислительные ресурсы. Однако попытка обучения R2 на платформах Huawei столкнулась с трудностями, вынудивших компанию перенаправить имеющиеся ресурсы на задачи инференса (формирование логических выводов) и продолжить обучение на оборудовании Nvidia.
Huawei оказывал поддержку, направив в DeepSeek команду специалистов, но их усилия не принесли желаемых результатов. Процесс адаптации чипов Huawei для инференса также не завершен. Из-за этих проблем отложен релиз R2, а текущий прогресс в разработке признан недостаточным.
В то время как DeepSeek борется с трудностями, конкуренты, такие как Alibaba с ее моделью Qwen3, активно развиваются, заимствуя концепции DeepSeek и добиваясь большей эффективности. Несмотря на текущие вызовы, эксперты предвидят, что китайские разработчики, в конечном итоге, смогут создавать успешные языковые модели на чипах Huawei. Этот сценарий подчеркивает напряженную конкуренцию в области ИИ и демонстрирует, что перестройка цепочек поставок и поиск альтернативных решений становятся ключевыми факторами успеха в этой быстроразвивающейся сфере.
