Удивительно экономически эффективные ИИ модели ИИ бросают вызов гигантам отрасли. В то время как первоначально претендуя на стоимость обучения всего 6 миллионов долларов для своей мощной модели Deepseek V3, более пристальный взгляд показывает гораздо более существенные инвестиции.
Модель DeepSeek V3 может похвастаться инновационными технологиями: Multi-Token Preglice (MTP) , прогнозируя несколько слов одновременно; Смесь экспертов (MOE) , используя 256 нейронных сетей для расширенной обработки; и Многополосное скрытое внимание (MLA) , сосредоточенное на ключевых элементах предложения для повышения точности.
Изображение: Ensigame.com
Тем не менее, полуанализа обнаружил существенную инфраструктуру DeepSeek: приблизительно 50 000 графических процессоров Nvidia, включая H800, H100 и H20, распространяются по нескольким центрам обработки данных. Это составляет общие инвестиции в сервер в размере примерно 1,6 млрд. Долл. США, а эксплуатационные расходы примерно в 944 млн. Долл. США.
Изображение: Ensigame.com
Deepseek, дочерняя компания High-Flyer, китайского хедж-фонда, владеет своими центрами обработки данных, способствуя контролю и быстрым инновациям. Его самофинансируемая природа способствует ловкости и быстрому принятию решений. Компания привлекает лучших талантов, некоторые исследователи зарабатывают более 1,3 миллиона долларов в год, в основном из китайских университетов.
Изображение: Ensigame.com
Первоначальная цифра в 6 миллионов долларов США охватывает только предварительное использование графических процессоров, пропущение исследований, уточнения, обработки данных и инфраструктуры. Фактические инвестиции DeepSeek в области развития искусственного интеллекта превышают 500 миллионов долларов. Несмотря на это, его бережливая структура допускает эффективные инновации, в отличие от более крупных, более бюрократических конкурентов.
Изображение: Ensigame.com
В то время как успех Deepseek проистекает из значительных инвестиций, технологических достижений и квалифицированной команды, «Бюджетный» повествование вводит в заблуждение. Тем не менее, его затраты остаются значительно ниже, чем конкуренты; Например, модель Deepseek R1 стоила 5 миллионов долларов по сравнению с Catgpt4 100 миллионов долларов. Пример DeepSeek демонстрирует хорошо финансируемую независимую компанию по искусственному искусству, успешно конкурирующую с устоявшимися лидерами, хотя первоначальные требования затрат требуют тщательного толкования.