Китайский чат-бот DeepSeek: что о нем известно и ждать ли российского конкурента

Ажиотаж, связанный с чат-ботом от китайской компании DeepSeek, вызван тем, что разработчикам удалось создать дешевую и мощную альтернативу американскому ChatGPT. Об этом RTVI заявил гендиректор компании Sistemma, автор книги «Сунь Цзы. Искусство продаж» Сергей Зубарев.

«И китайские специалисты затратили на это примерно в 200 раз меньше финансов, и команда у них тоже в несколько раз меньше. То есть, условно, при одних и тех же показателях затраты несоизмеримо меньше. Это обвалило рынок вчера — все началось с падения акций Nvidia, самого большого падения одной акции за день за всю историю Уолл-стрит, и потянуло за собой остальные смежные, включая Microsoft, так как Microsoft является одним из совладельцев этой компании», — сказал эксперт.

Чем уникален DeepSeek

Китайский чат-бот представляет собой серьезного конкурента для западных продуктов, добавил Зубарев.

«Дело в том, что это не чистая модель в том понимании, как это могло представляться, например, год назад. Условно, специалисты разных компаний нащупали некий потолок, который обусловлен недостаточной одновременной мощностью, которая могла бы обрабатывать какое-то количество данных», — объяснил он.

По его словам, ранее такие попытки предпринимали компании Илона Маска, Марка Цукерберга, OpenAI и другие, используя «несколько сотен тысяч видеокарт», но все они «получали примерно одинаковый результат».

«И пока не будет найден новый алгоритм, который кардинально отличается от существующих, этот условный рубеж преодолеть будет очень сложно, потому что нужно будет строить несколько атомных станций для того, чтобы все эти мощности сопровождать. И в принципе, с точки зрения математики, текущий алгоритм достаточно сложен по энергоэффективности — нужно много-много раз какое-то количество данных переводить с одного в другое место», — добавил Зубарев.

Китайские разработчики, как пояснил эксперт, фактически сделали более эффективным подход компании OpenAI, когда «используется не одна обученная модель, а сетка моделей внутри одного чата».

В этом чате одна модель, например, отвечает за входящий запрос, а вторая назначает «старшего» из имеющейся у нее сетки моделей и так далее, рассказал Зубарев.

Andy Wong / AP

«И они сделали вот эту связку более эффективной за счет того, что главная модель могла проверять на адекватность эти нарезанные виды сегментированных моделей, они были дообучены каждая в своем сегменте: отдельно — математическая модель, отдельно — модель кодинга, отдельно — модель, которая отвечает на какие-то логические вопросы. В связке это дало эффект более мощный, более сильный с точки зрения ресурсов и времени», — сообщил собеседник RTVI.

Чат-бот китайской компании DeepSeek является бесплатным и доступен для россиян. Доступ к языковой модели DeepSeek V3 был открыт в ноябре 2024 года. Разработчики утверждают, что их проект может привести к созданию «сверхразумной» нейросети, а сейчас он может конкурировать с популярной ChatGPT. Чат-бот способен анализировать тексты, делать переводы, писать статьи и создавать код. Затраты на проект составили примерно $5,5 млн (на ChatGPT — почти $80 млн).

Что будет с DeepSeek

Говорить о будущем китайской нейросети сейчас сложно, хотя команда, которая за ней стоит, очень сильная, подчеркнул Зубарев. При этом собеседник RTVI уточнил, что в Китае сейчас выходит научных публикаций на тему искусственного интеллекта больше, чем во всех остальных странах вместе взятых.

«Очень сильная математическая школа, очень сильная вовлеченность государства в развитие искусственного интеллекта. Они, по-моему, на пять лет остановили всякие регуляции искусственного интеллекта для того, чтобы дать ему развиться, а потом уже смотреть, какие угрозы он будет предоставлять обществу. Государство, со своей стороны, делает все для доступности, открывается», — добавил он.

Cfoto / Imago / TASS

В развитии искусственного интеллекта самое сложное — это обучение из-за нехватки технических мощностей, рассказал Зубарев.

«Начиная от частных компаний, заканчивая государственным уровнем, все предоставляют лабораториям доступ к серверным мощностям, и это выглядит так, что китайские коллеги поставили в качестве высокого приоритета развитие искусственного интеллекта. Я думаю, что в части массового внедрения и развития Китай сильно опережает США в этом плане», — считает эксперт.

Дальше уже будет поиск оптимизации и «более изысканных решений в использовании связки моделей внутри одного чата», уточнил эксперт, потому что уже сейчас виден «предел в одной модели» на примерах разных компаний, которые «смогли достичь потолка».

«То есть какого-то кардинального прорыва именно в обучении одной отдельной модели пока в ближайшем будущем не предвидится. В отличие от их использования вместе, в качестве некоего сообщества моделей, где каждая отвечает за свое, и они обмениваются контекстом между собой для решения какого-то конкретного вопроса», — сказал Зубарев.

По словам эксперта, те, кто сможет эффективно использовать симбиоз, использованный разработчиками DeepSeek, могут создать «еще более эффективную модель».

Китайский ИИ DeepSeek обрушил стоимость Nvidia на $600 млрд

Глава OpenAI Сэм Альтман уже сообщил, что его компания ускорит выпуск продуктов и представит гораздо более совершенные модели ИИ. Он прокомментировал недавний выпуск ИИ-модели R1 китайской DeepSeek, назвав ее «впечатляющей, особенно с точки зрения того, что они могли сделать за эту цену».

О российском аналоге чат-бота DeepSeek

Зубарев не исключил, что в России может появиться достойный конкурент продукта DeepSeek, потому что очень сильных специалистов в стране хватает, пусть нередко это и «энтузиасты, которые на своих домашних компьютерах какие-то опыты ставят, либо совместно покупают или арендуют какие-то мощности».

Архивное фото
Марина Молдавская / Коммерсантъ

«Но этого недостаточно. Необходимо, думаю, разрешение со стороны государства, чтобы любые результаты на ближайшие несколько лет, которые будут достигнуты с помощью искусственного интеллекта, не преследовались, так как регуляция в части вывода — того, что искусственный интеллект может выдать, может попадать под какие-то ограничительные запреты, которые сейчас действуют», — пояснил он.

Из-за того, что исследователи начинают думать о действующих запретах и о том, как бы под них не попасть, работа в России в этом направлении замедляется, заявил Зубарев.

«Думаю, это просто вопрос государственной воли. Не какое-то точечное финансовое влияние на какие-то компании, хотя это тоже правильно, а именно общее, сознательное решение о том, что туда нужно идти. И второе — это, конечно, доступ к мощностям. В России их пока не так много, как у наших коллег, но то, что есть, мы могли бы использовать. Однако доступ к этим мощностям не все могут себе позволить. Только достаточно крупные компании», — сказал он.

Для того, чтобы Россия могла конкурировать на рынке, необходимо стремиться к китайской модели, когда «в любой школе любой школьник, любой студент в техническом университете может получить доступ и вечером после занятий этим заниматься», резюмировал эксперт.

Борис Шибанов

Связаться с автором