De deepseek's verrassend kosteneffectieve AI-model daagt reuzen uit de industrie uit. Terwijl hij aanvankelijk op slechts $ 6 miljoen trainingskosten claimt voor zijn krachtige Deepseek V3 -model, onthult een nadere blik een veel meer substantiële investering.
Het V3-model van Deepseek heeft innovatieve technologieën: Multi-Token Prediction (MTP) , het tegelijkertijd voorspellen van meerdere woorden; Mix van experts (MOE) , met behulp van 256 neurale netwerken voor verbeterde verwerking; en multi-head latente aandacht (MLA) , gericht op belangrijke zinselementen voor verbeterde nauwkeurigheid.
afbeelding: ensigame.com
De semianyse ontdekte echter de substantiële infrastructuur van Deepseek: ongeveer 50.000 Nvidia Hopper GPU's, inclusief H800-, H100- en H20 -eenheden, verspreid over meerdere datacenters. Dit vertegenwoordigt een totale serverinvestering van ongeveer $ 1,6 miljard en operationele kosten van bijna $ 944 miljoen.
afbeelding: ensigame.com
Deepseek, een dochteronderneming van High-Flyer, een Chinees hedgefonds, bezit zijn datacenters, bevordert de controle en snelle innovatie. Zijn zelf gefinancierde aard draagt bij aan behendigheid en snelle besluitvorming. Het bedrijf trekt toptalent aan, met sommige onderzoekers die jaarlijks meer dan $ 1,3 miljoen verdienen, voornamelijk van Chinese universiteiten.
afbeelding: ensigame.com
Het aanvankelijke cijfer van $ 6 miljoen omvat alleen pre-training GPU-gebruik, het weglaten van onderzoek, verfijning, gegevensverwerking en infrastructuur. De werkelijke AI -ontwikkelingsinvestering van Deepseek overtreft $ 500 miljoen. Desondanks zorgt de magere structuur voor efficiënte innovatie, in tegenstelling tot grotere, meer bureaucratische concurrenten.
afbeelding: ensigame.com
Hoewel het succes van Deepseek voortkomt uit substantiële investeringen, technologische vooruitgang en een bekwaam team, is het "budgetvriendelijke" verhaal misleidend. Desalniettemin blijven de kosten aanzienlijk lager dan concurrenten; Het R1 -model van Deepseek kost bijvoorbeeld $ 5 miljoen, vergeleken met de $ 100 miljoen van Chatgpt4. Het voorbeeld van Deepseek toont een goed gefinancierd onafhankelijk AI-bedrijf dat met succes concurreert met gevestigde leiders, hoewel de initiële kostenclaims een zorgvuldige interpretatie vereisen.