
Meta выплатит Трампу 25 миллионов долларов за блокировку аккаунтов
08.02.2025
Илон Маск раскритиковал OpenAI и SoftBank из-за ИИ-проекта Stargate
08.02.2025DeepSeek-R1: китайская альтернатива ChatGPT бросает вызов OpenAI, Google и Meta
Новая языковая модель с низкими затратами
DeepSeek-R1 — новейшая языковая модель, для разработки которой требуется меньше вычислительных и денежных ресурсов, чем для её аналогов. Это делает её конкурентом OpenAI, Google и Meta в сфере искусственного интеллекта. Одноимённая большая языковая модель (LLM) китайского ИИ-стартапа DeepSeek вызвала настоящий ажиотаж в Кремниевой долине, быстро став альтернативой ChatGPT от OpenAI. Как утверждают IT-специалисты, последняя версия под названием DeepSeek-R1, представленная в этом месяце, отличается высокой производительностью при низкой стоимости. По числу используемых чипов для разработки языковой модели китайская компания уже обходит таких гигантов, как OpenAI, Google и Meta. Это стало одной из причин падения акций крупнейшего производителя чипов Nvidia.Откуда взялась DeepSeek?
Компанию основал в июле 2023 года в Ханчжоу Лян Вэнфьэн — инженер-электронщик и информатик, выпускник Чжэцзянского университета. DeepSeek появилась в рамках инкубационной программы фонда High-Flyer, созданного Ляном в 2015 году. Как и другие ведущие компании отрасли, стартап стремится создать "универсальный искусственный интеллект", который сможет догнать или превзойти человека в решении различных задач. Финансирование DeepSeek основано на независимой модели, что позволяет компании избегать давления внешних инвесторов и сосредотачиваться на долгосрочных исследованиях и разработках. Команда DeepSeek состоит из молодых выпускников ведущих университетов Китая, а при подборе персонала приоритет отдаётся техническим навыкам, а не опыту работы.История развития DeepSeek
DeepSeek впервые заявила о себе в ноябре 2023 года, запустив DeepSeek Coder — модель с открытым исходным кодом для решения задач программирования. Затем появилась DeepSeek LLM, конкурирующая с другими крупными языковыми моделями. В мае 2024 года была выпущена DeepSeek-V2, завоевавшая популярность благодаря высокой производительности и низкой стоимости. Её появление вынудило китайских технологических гигантов ByteDance, Tencent, Baidu и Alibaba снизить цены на свои модели ИИ.Технические возможности DeepSeek
На смену DeepSeek-V2 пришла DeepSeek-Coder-V2 — более продвинутая модель с 236 миллиардами параметров. Она предназначена для сложных задач кодирования и поддерживает контекстное окно до 128 000 токенов. Контекстное окно — это максимальная длина входного текста, который модель может обработать единовременно. Позже DeepSeek выпустила DeepSeek-V3 и DeepSeek-R1. DeepSeek-V3, имеющая 671 000 параметров, требует меньше ресурсов по сравнению с аналогами, но показывает высокие результаты в тестах производительности. Последний релиз DeepSeek-R1 ориентирован на решение сложных задач логического мышления, программирования и математики, что делает его конкурентом одной из последних моделей ChatGPT — o1.Коммерческое будущее DeepSeek
Несмотря на успехи, DeepSeek сосредоточена на исследованиях и пока не планирует коммерциализацию своих технологий.Бесплатный доступ для пользователей
Одной из главных причин интереса к DeepSeek является отсутствие платы за использование. Это первая мощная ИИ-модель, доступная бесплатно. В отличие от неё, конкуренты, такие как ChatGPT o1 от OpenAI и Claude Sonnet, требуют платной подписки. Google Gemini тоже можно использовать бесплатно, но лишь в ограниченной версии. DeepSeek пока таких ограничений не вводила.Как пользоваться DeepSeek?
Пользователи могут получить доступ к чат-интерфейсу DeepSeek по адресу "chat.deepseek". Функция "глубокий анализ" позволяет получать развернутые ответы, а также осуществлять поиск по большему количеству источников. Однако, в отличие от ChatGPT, этот поиск может выдавать ложную информацию с небольших сайтов, поэтому рекомендуется проверять данные.Безопасность и открытый исходный код
DeepSeek требует ввода пользовательских данных, которые хранятся на серверах в Китае. Как и в случае с любыми LLM, пользователям не следует передавать конфиденциальную информацию. Поскольку DeepSeek имеет открытый исходный код, независимые IT-специалисты могут изучить его на предмет безопасности. Подробные отчёты о защите данных будут опубликованы в ближайшее время.Как DeepSeek обошла санкции США?
Несмотря на ограничения США на экспорт передовых чипов в Китай, DeepSeek сумела создать мощные модели. Компания наладила партнёрство с американской AMD, использовав её графические процессоры Instinct и программное обеспечение ROCM. По данным MIT Technology Review, Лян Вэнфьэн заранее закупил в больших количествах чипы Nvidia A100, поставки которых в Китай сейчас запрещены. По оценкам китайского издания 36Kr, на складах компании может находиться от 10 000 до 50 000 таких чипов. DeepSeek также разрабатывает энергоэффективные алгоритмы, позволяющие компенсировать недостаток мощных чипов. Считается, что ChatGPT использует около 10 000 графических процессоров Nvidia для обработки обучающих данных. В то же время DeepSeek достиг аналогичных результатов, используя всего 2 000 GPU.Реакция на появление DeepSeek
Александр Ванг, генеральный директор ScaleAI, поставляющей данные для OpenAI и Google, заявил на Всемирном экономическом форуме в Давосе, что DeepSeek оказывает "сокрушительное воздействие" на рынок. Западные аналитики также предупреждают о последствиях появления китайского конкурента в сфере ИИ.Источник новости: Euronews