Deepseek est étonnamment rentable, le modèle d'IA défie les géants de l'industrie. Tout en réclamant initialement un coût de formation de 6 millions de dollars pour son puissant modèle V3 Deepseek, un examen plus approfondi révèle un investissement beaucoup plus substantiel.
Le modèle V3 de Deepseek possède des technologies innovantes: Prédiction multi-token (MTP) , prédisant plusieurs mots simultanément; Mélange d'experts (MOE) , en utilisant 256 réseaux de neurones pour un traitement amélioré; et Attention latente multi-tête (MLA) , en se concentrant sur les éléments clés de la phrase pour une précision améliorée.
Image: esigame.com
Cependant, la semianalyse a découvert l'infrastructure substantielle de Deepseek: environ 50 000 GPU Nvidia Hopper, y compris les unités H800, H100 et H20, se sont propagées sur plusieurs centres de données. Cela représente un investissement total de serveurs d'environ 1,6 milliard de dollars et les coûts opérationnels près de 944 millions de dollars.
Image: esigame.com
Deepseek, une filiale de High-Flyer, un fonds spéculatif chinois, possède ses centres de données, favorisant le contrôle et l'innovation rapide. Sa nature autofinancée contribue à l'agilité et à la prise de décision rapide. La société attire les meilleurs talents, certains chercheurs gagnant plus de 1,3 million de dollars par an, principalement des universités chinoises.
Image: esigame.com
Le chiffre initial de 6 millions de dollars ne couvre que l'utilisation du GPU avant la formation, l'omettant de la recherche, du raffinement, du traitement des données et des infrastructures. L'investissement réel du développement de l'IA de Deepseek dépasse 500 millions de dollars. Malgré cela, sa structure maigre permet une innovation efficace, contrairement aux concurrents plus grands et plus bureaucratiques.
Image: esigame.com
Alors que le succès de Deepseek découle de l'investissement substantiel, des progrès technologiques et d'une équipe qualifiée, le récit "favorable à un budget" est trompeur. Néanmoins, ses coûts restent considérablement inférieurs à ceux des concurrents; Par exemple, le modèle R1 de Deepseek a coûté 5 millions de dollars, par rapport aux 100 millions de dollars de ChatGPT4. L'exemple de Deepseek présente une entreprise d'IA indépendante bien financée en concurrence avec succès avec les dirigeants établis, bien que les réclamations de coûts initiales nécessitent une interprétation minutieuse.