Китайский стартап DeepSeek, специализирующийся на разработке искусственного интеллекта, совершил настоящий прорыв в мире технологий. Его одноименный чат-бот взлетел на вершину чартов магазина приложений Apple в США, сместив с пьедестала ChatGPT от OpenAI. Этот успех стал результатом уникального подхода компании к обучению моделей ИИ, который позволяет значительно снизить затраты и ресурсы.
Что сделало DeepSeek таким успешным?
Новый ИИ-помощник от DeepSeek работает на основе открытых моделей компании, которые, по заявлению разработчиков, могут быть обучены за гораздо меньшую стоимость и с использованием меньше чипов, чем у ведущих мировых моделей. Это особенно важно в условиях растущего спроса на передовые технологии ИИ, где стоимость обучения и эксплуатации моделей может достигать астрономических значений.
Загрузки приложения DeepSeek резко возросли после выпуска новой модели рассуждений R1 20 января. Эта модель предназначена для решения сложных задач и демонстрирует результаты, сопоставимые с моделью o1 от OpenAI, на определенных тестах. Модель R1 была построена на базе V3 LLM (Large Language Model) и выпущена в декабре. По утверждению компании, эта модель сравнима с GPT-4o и Claude 3.5 Sonnet от Anthropic, а разработка DeepSeek обошлась менее чем в 6 миллионов долларов.
Для сравнения, генеральный директор OpenAI Сэм Альтман заявил, что обучение модели GPT-4 стоило более 100 миллионов долларов. Эти цифры подчеркивают значительное преимущество DeepSeek в эффективности использования ресурсов.
Инновационные подходы
DeepSeek также утверждает, что для обучения модели V3 им потребовалось всего около 2000 специализированных чипов от NVIDIA, по сравнению с 16000 или более, необходимых для обучения ведущих моделей. Эти данные, хотя и не подтверждены официально, вызывают серьезные вопросы о целесообразности традиционного подхода к обучению ИИ, ориентированного на интенсивное использование вычислительных ресурсов.
Разработчики и инвесторы начинают задумываться о том, действительно ли такие крупномасштабные инвестиции в центры обработки данных для ИИ оправданы.
Например, проект Stargate, финансируемый компаниями NVIDIA, Microsoft, OpenAI и Meta, предполагает инвестиции в размере 500 миллиардов долларов, из которых 100 миллиардов предназначены для NVIDIA. Однако акции NVIDIA, Microsoft и других компаний, имеющих значительные доли в поддержании статус-кво в области ИИ, уже начали падать в ходе предварительных торгов, потеряв более 12 процентов стоимости.
Торговые ограничения и инновации
Согласно некоторым данным, DeepSeek был вынужден проявить изобретательность в условиях торговых ограничений, направленных на обеспечение доминирования США в области ИИ. Как итог, компания смогла добиться таких впечатляющих результатов при минимальных затратах и ограниченных ресурсах.
Генеральный директор OpenAI Сэм Альтман уже выразил обеспокоенность по поводу возможной потери лидерства на рынке ИИ. И неудивительно, ведь стоимость разработки конкурентного ИИ обошлась примерно в стоимость машины, на которой ездит глава OpenAI (Koenigsegg Regera продаётся по некоторым оценкам за 5 миллионов долларов США).
Если утверждения DeepSeek окажутся правдой, это может изменить правила игры в индустрии ИИ, заставив крупнейшие компании пересмотреть свои стратегии и методы работы.
Что в итоге
Успех DeepSeek показывает, что даже в условиях жесткой конкуренции и ограниченных ресурсов можно достичь впечатляющих результатов. Компания доказала, что эффективное использование ресурсов и инновационный подход могут обеспечить конкурентное преимущество на рынке ИИ. Будем следить за дальнейшим развитием событий и изменениями в индустрии искусственного интеллекта.
Подписывайтесь на наш телеграм канал, чтобы оставаться в курсе последних событий в мире высоких технологий!