Ang nakakagulat na cost-effective na modelo ng AI na hamon sa mga higanteng industriya ng AI. Habang sa una ay nag -aangkin ng isang $ 6 milyong gastos sa pagsasanay para sa malakas na modelo ng Deepseek V3, ang isang mas malapit na hitsura ay nagpapakita ng isang mas malaking pamumuhunan.
Ipinagmamalaki ng V3 Model ng Deepseek ang mga makabagong teknolohiya: Multi-Token Prediction (MTP) , hinuhulaan ang maraming mga salita nang sabay-sabay; pinaghalong mga eksperto (MOE) , paggamit ng 256 neural network para sa pinahusay na pagproseso; at multi-head latent na pansin (MLA) , na nakatuon sa mga pangunahing elemento ng pangungusap para sa pinahusay na kawastuhan.
Imahe: ensigame.com
Gayunpaman, ang semianalysis ay walang takip na imprastraktura ng Deepseek: humigit -kumulang 50,000 nvidia hopper GPUs, kabilang ang mga H800, H100, at H20 unit, na kumalat sa maraming mga sentro ng data. Ito ay kumakatawan sa isang kabuuang pamumuhunan ng server na humigit -kumulang na $ 1.6 bilyon at mga gastos sa pagpapatakbo na malapit sa $ 944 milyon.
Imahe: ensigame.com
Ang Deepseek, isang subsidiary ng high-flyer, isang pondo ng hedge ng Tsino, ay nagmamay-ari ng mga sentro ng data nito, pag-aalaga ng kontrol at mabilis na pagbabago. Ang kalikasan na pinondohan ng sarili ay nag-aambag sa liksi at mabilis na paggawa ng desisyon. Ang kumpanya ay umaakit sa nangungunang talento, na may ilang mga mananaliksik na kumikita ng higit sa $ 1.3 milyon taun -taon, lalo na mula sa mga unibersidad sa Tsino.
Imahe: ensigame.com
Ang paunang $ 6 milyong figure ay sumasaklaw lamang sa paggamit ng GPU ng pre-pagsasanay, pagtanggal ng pananaliksik, pagpipino, pagproseso ng data, at imprastraktura. Ang aktwal na pamumuhunan sa pag -unlad ng Deepseek ay higit sa $ 500 milyon. Sa kabila nito, ang sandalan na istraktura nito ay nagbibigay -daan para sa mahusay na pagbabago, hindi katulad ng mas malaki, mas maraming mga kakumpitensya sa burukrata.
Imahe: ensigame.com
Habang ang tagumpay ng Deepseek ay nagmula sa malaking pamumuhunan, pagsulong sa teknolohiya, at isang bihasang koponan, ang "badyet-friendly" na salaysay ay nakaliligaw. Gayunpaman, ang mga gastos nito ay mananatiling mas mababa kaysa sa mga kakumpitensya; Halimbawa, ang modelo ng R1 ng Deepseek ay nagkakahalaga ng $ 5 milyon, kumpara sa $ 100 milyon ng ChatGPT4. Ang halimbawa ng Deepseek ay nagpapakita ng isang mahusay na pinondohan na independiyenteng kumpanya ng AI na matagumpay na nakikipagkumpitensya sa mga naitatag na pinuno, bagaman ang paunang pag-angkin ng gastos ay nangangailangan ng maingat na interpretasyon.