Кейс китайского чат-бота DeepSeek, созданного в условиях ограниченных ресурсов и санкций, демонстрирует потенциальную возможность разработки конкурентоспособных решений на базе отечественных языковых моделей. Так считает Антон Колонин, кандидат технических наук и ведущий специалист Исследовательского центра в сфере искусственного интеллекта Новосибирского государственного университета (НГУ), пишет ТАСС.
20 января компания из Китая представила новую версию чат-бота R1, которая, по заявлениям разработчиков, превышает по возможностям передовую модель ChatGPT от OpenAI. При этом затраты на разработку DeepSeek были существенно ниже по сравнению с OpenAI. Рынки отреагировали на это событие с бурной динамикой: индекс Nasdaq в США упал более чем на 3%, а акции Nvidia, производителя чипов для OpenAI, снизились на 16,86%.
«Ограничения, накладываемые санкциями, сделали невозможным использование лучших графических карт для обучения крупных языковых моделей от Nvidia. Нашим компаниям их приобрести фактически невозможно. Успех китайских разработчиков заключается в том, что они заявляют, будто смогли достичь результатов без использования графических карт. Это более экономически эффективное решение воодушевляет, так как показывает, что даже с ограниченными вычислительными ресурсами можно справляться с задачами на соответствующем уровне точности», — подчеркнул Колонин.
По мнению эксперта, успех DeepSeek связан с увеличением инвестиций в научное развитие в Китае, что началось около 20-30 лет назад, а также с прогрессом в системе школьного образования. Дополнительно власти КНР целенаправленно стремились вернуть ученых, которые ранее уехали за границу. По словам Колонина, в Китае сложилась наука, ориентированная на внутренний рынок, а не на Запад. «Существуют несколько независимых национальных IT-проектов, таких как AliBaba, Baidu и Tencent. Ранее они конкурировали с США, а теперь начинают занимать лидирующие позиции. У них действительно есть чему поучиться», – добавил он.

Ученый отметил, что в России существует потенциал для собственного развития моделей искусственного интеллекта, однако на данный момент отечественные компании в основном применяют западные технологии. Кроме этого, в стране недостаточно вычислительных ресурсов. «Все это взаимосвязано: для привлечения инвестиций необходимо показывать результаты от уже вложенных средств. Для этого должны быть области применения нейронных сетей, где ИИ способен реально изменить производственные процессы. Бизнес, в свою очередь, должен быть готов к таким изменениям», — резюмировал Колонин.