Deepseeks überraschend kostengünstige KI-Modell stellt die Branchenriesen heraus. Während zunächst nur 6 -Millionen -Dollar -Schulungskosten für sein mächtiges Deepseek V3 -Modell beansprucht, zeigt ein genauerer Blick eine weitaus umfassendere Investition.
Das V3-Modell von Deepseek bietet innovative Technologien: Multi-Tooken-Vorhersage (MTP) , die mehrere Wörter gleichzeitig vorhersagen; Mischung von Experten (MOE) unter Verwendung von 256 neuronalen Netzwerken für eine verbesserte Verarbeitung; und Multi-Head Latent Achtung (MLA) , der sich auf wichtige Satzelemente für eine verbesserte Genauigkeit konzentriert.
Bild: Ensigame.com
Die semianalyse entdeckte jedoch Deepseeks erhebliche Infrastruktur: ungefähr 50.000 NVIDIA Hopper -GPUs, einschließlich H800-, H100- und H20 -Einheiten, verteilt über mehrere Rechenzentren. Dies entspricht einer gesamten Serverinvestition von rund 1,6 Milliarden US -Dollar und Betriebskosten in Höhe von 944 Millionen US -Dollar.
Bild: Ensigame.com
Deepseek, eine Tochtergesellschaft von High-Flyer, einem chinesischen Hedgefonds, besitzt seine Rechenzentren und fördert die Kontrolle und schnelle Innovation. Seine selbstfinanzierte Natur trägt zur Beweglichkeit und zur schnellen Entscheidungsfindung bei. Das Unternehmen zieht Top -Talente an, wobei einige Forscher jährlich über 1,3 Millionen US -Dollar verdienen, hauptsächlich von chinesischen Universitäten.
Bild: Ensigame.com
Die anfängliche Zahl von 6 Millionen US-Dollar deckt nur die Nutzung der GPU-Nutzung vor dem Training ab und lässt Forschung, Verfeinerung, Datenverarbeitung und Infrastruktur weg. Die tatsächliche KI -Entwicklungsinvestition von Deepseek übertrifft 500 Millionen US -Dollar. Trotzdem ermöglicht seine magere Struktur effiziente Innovation, im Gegensatz zu größeren, bürokratischeren Wettbewerbern.
Bild: Ensigame.com
Während Deepseeks Erfolg auf erhebliche Investitionen, technologische Fortschritte und ein qualifiziertes Team beruht, ist die "budgetfreundliche" Erzählung irreführend. Dennoch bleiben die Kosten deutlich niedriger als die Konkurrenten. Zum Beispiel kostete das R1 -Modell von Deepseek 5 Millionen US -Dollar im Vergleich zu den 100 Millionen US -Dollar von Chatgpt4. Das Beispiel von Deepseek zeigt ein gut finanziertes unabhängiges KI-Unternehmen, das erfolgreich mit etablierten Führungskräften konkurriert, obwohl die anfänglichen Kostenansprüche eine sorgfältige Auslegung erfordern.