Нейронка DeepSeek стала самым скачиваемым приложением в США

27 января китайская нейронка DeepSeek стала самым скачиваемым приложением в Америке. Она стала популярнее ChatGPT, соцсетей, маркетплейсов и прочих продуктов в App Store. В Google Play продукт уже скачали более миллиона раз. Такого результата DeepSeek достиг за три недели: приложение вышло 8 января. Подробности об этой нейронке читайте в материале CyberMeta.

1
ИИ DeepSeek стал топ-1 приложением в США

DeepSeek появилась на рынке искусственного интеллекта сравнительно недавно, однако уже сейчас обошла гигантов индустрии вроде ChatGPT. Это стало возможным благодаря ряду отличительных особенностей, которыми обладает китайская AI. В данный момент модель DeepSeek R1 считается лучшей нейронкой на всём рынке.

4
DeepSeek показывает один из лучших результатов на сторонних бенчмарках

Новая система расчётов. Если стандартные модели для этого используют 32-битные числа, то DeepSeek применяет 8-битное квантование. Таким образом объём используемой памяти сокращается на 75%.

Вице-президент Dropbox Морган Браун простым языком объяснил технологию китайской компании.

Традиционный ИИ — это как записать каждое число с 32 знаками после запятой. В DeepSeek подумали: “А что, если мы будем использовать только 8? Это все равно будет достаточно точно!” Бум — на 75% меньше памяти.

Морган Браун

Новый тип обработки текста. DeepSeek анализирует текст фразами, ускоряя процесс в 2 раза с сохранением точности в 90%. Этот тип архитектуры называется Multi-head Latent Attention (MLA) и является настоящим прорывом в индустрии. Другие нейронки последовательно анализируют каждый токен, из-за чего требуют больше времени и ресурсов.

Новая система работы параметров. DeepSeek держит в активном состоянии только малую часть параметров от общего числа, меняя их в зависимости от задачи. Обычные ИИ держат в активном состоянии все параметры сразу.

Морган Браун также прокомментировал инженерную идею компании.

<...> Это все равно что иметь огромную команду, но привлекать только тех специалистов, которые действительно нужны для каждой задачи.

Морган Браун

Суммарно эти три фактора снизили затраты на обучение нейросети и требуемое GPU в общей сложности в 20 раз. Интересно, что в мае 2024 года DeepSeek опубликовала цены на API. Стоимость миллиона токенов составила 0,14 долларов, что эквивалентно 14 рублям. У конкурентов цена миллиона токенов составляет около 2,5 долларов.

Технический специалист Арслан Урташев прокомментировал релиз, отметив, что DeepSeek произвёл переворот на рынке благодаря дешёвому обучению ИИ.

С 2022 года после выхода ChatGPT это первое событие, которое вызвало такой бурный ажиотаж. Представьте, основные игроки в индустрии думают, что нужно очень много денег, анонсируют stargate на 500млрд$. И тут оказывается, что можно сделать то же самое в 20 раз дешевле. <...> Ноу хау в том, что придумали как делать обучение с подкреплением по-другому.

Арслан Урташев

Совместимость с игровыми видеокартами вместо специализированных чипов. Так как DeepSeek работает без применения особого оборудования, она может быть масштабируемой. Кроме этого, благодаря совместимости нейросеть способна обходить экспортные ограничения США и работать в любой точке мира.

Американский журналист Хольгер Чепиц бьёт тревогу, поскольку многомиллиардные капиталовложения могут стать бесполезными.

Китайская компания DeepSeek может представлять самую большую угрозу для американских фондовых рынков, поскольку она, похоже, построила революционную ИИ-модель по чрезвычайно низкой цене и без доступа к передовым чипам, что ставит под сомнение полезность сотен миллиардов капиталовложений, вливаемых в эту отрасль

Хольгер Чепиц

AI-бот DeepSeek R1 сейчас считается лучшей нейронкой в мире: модель прошла тесты на бенчмарке «Humanity's Last Exam» (HLE) с 9,1% правильных ответов. Для сравнения, GPT-4o смогла правильно ответить лишь на 3,3% вопросов теста. DeepSeek оказалась настолько успешной разработкой, что после её выхода на рынок акции конкурентов по ИИ начали падать. Так, 27 января акции Nvidia снизились на 9%, а акции Microsoft – на 4% соответственно.

3
Показатели ИИ на бенчмарке HLE

DeepSeek способна писать код, отвечать на вопросы, анализировать информацию и работать с картинками. Ещё одной ключевой особенностью является то, что нейросеть работает полностью бесплатно, а воспользоваться ей может любой желающий. CyberMeta продолжает следить за новостями.

Комментарии
Нет комментариев. Будьте первым!