Deepseek yang menghairankan model AI yang efektif mencabar gergasi industri. Walaupun pada mulanya menuntut kos latihan hanya $ 6 juta untuk model DeepSeek V3 yang kuat, penampilan yang lebih dekat mendedahkan pelaburan yang jauh lebih besar.
Model V3 DeepSeek menawarkan teknologi inovatif: Ramalan Multi-Token (MTP) , meramalkan beberapa perkataan secara serentak; Campuran Pakar (MOE) , menggunakan 256 rangkaian saraf untuk pemprosesan yang dipertingkatkan; dan Perhatian Laten Multi-Head (MLA) , memberi tumpuan kepada elemen kalimat utama untuk ketepatan yang lebih baik.
imej: ensigame.com
Walau bagaimanapun, semianalisis menemui infrastruktur besar DeepSeek: kira -kira 50,000 GPU NVIDIA Hopper, termasuk unit H800, H100, dan H20, tersebar di pelbagai pusat data. Ini mewakili jumlah pelaburan pelayan kira -kira $ 1.6 bilion dan kos operasi yang hampir $ 944 juta.
imej: ensigame.com
Deepseek, anak syarikat High-Flyer, dana lindung nilai Cina, memiliki pusat datanya, memupuk kawalan dan inovasi pesat. Sifat yang dibiayai sendiri menyumbang kepada ketangkasan dan membuat keputusan yang cepat. Syarikat itu menarik bakat terbaik, dengan beberapa penyelidik memperoleh lebih dari $ 1.3 juta setahun, terutamanya dari universiti -universiti China.
imej: ensigame.com
Angka awal $ 6 juta hanya meliputi penggunaan GPU pra-latihan, menghilangkan penyelidikan, penghalusan, pemprosesan data, dan infrastruktur. Pelaburan pembangunan AI sebenar Deepseek melebihi $ 500 juta. Walaupun demikian, struktur kurus membolehkan inovasi yang cekap, tidak seperti pesaing birokrasi yang lebih besar dan lebih besar.
imej: ensigame.com
Walaupun kejayaan DeepSeek berpunca dari pelaburan yang besar, kemajuan teknologi, dan pasukan mahir, naratif "mesra bajet" mengelirukan. Walau bagaimanapun, kosnya kekal jauh lebih rendah daripada pesaing; Sebagai contoh, model R1 DeepSeek berharga $ 5 juta, berbanding $ 100 juta ChatGPT4. Contoh DeepSeek mempamerkan syarikat AI bebas yang dibiayai dengan baik bersaing dengan pemimpin yang ditubuhkan, walaupun tuntutan kos awal memerlukan tafsiran yang teliti.