Il modello di intelligenza artificiale sorprendentemente conveniente di Deepseek sfida i giganti del settore. Pur sostenendo inizialmente un costo di formazione di soli 6 milioni di dollari per il suo potente modello DeepSeek V3, uno sguardo più attento rivela un investimento molto più sostanziale.
Il modello V3 di DeepSeek vanta tecnologie innovative: Previsione multi-token (MTP) , prevedendo contemporaneamente più parole; Miscela di esperti (MOE) , utilizzando 256 reti neurali per l'elaborazione avanzata; e Attenzione latente multi-testa (MLA) , concentrandosi su elementi della frase chiave per una migliore precisione.
Immagine: Ensigame.com
Tuttavia, la semianalisi ha scoperto la sostanziale infrastruttura di DeepSeek: circa 50.000 GPU della tramoggia Nvidia, tra cui unità H800, H100 e H20, diffuse su più data center. Ciò rappresenta un investimento totale di server di circa $ 1,6 miliardi e costi operativi vicino a $ 944 milioni.
Immagine: Ensigame.com
Deepseek, una consociata di High-Flyer, un hedge fund cinese, possiede i suoi data center, promuovendo il controllo e la rapida innovazione. La sua natura autofinanziata contribuisce all'agilità e al rapido processo decisionale. La società attira i migliori talenti, con alcuni ricercatori che guadagnano oltre $ 1,3 milioni all'anno, principalmente dalle università cinesi.
Immagine: Ensigame.com
La cifra iniziale da 6 milioni di dollari copre solo l'utilizzo della GPU pre-allenamento, la omettere la ricerca, il perfezionamento, l'elaborazione dei dati e l'infrastruttura. L'effettivo investimento di sviluppo AI di Deepseek supera $ 500 milioni. Nonostante ciò, la sua struttura snella consente un'innovazione efficiente, a differenza dei concorrenti più grandi e burocratici.
Immagine: Ensigame.com
Mentre il successo di Deepseek deriva da investimenti sostanziali, progressi tecnologici e una squadra qualificata, la narrazione "economica" è fuorviante. Tuttavia, i suoi costi rimangono significativamente inferiori rispetto ai concorrenti; Ad esempio, il modello R1 di Deepseek è costato $ 5 milioni, rispetto ai $ 100 milioni di CHATGPT4. L'esempio di DeepSeek mette in mostra una società di intelligenza artificiale indipendente ben finanziata con successo con i leader affermati, sebbene le richieste di costo iniziali richiedano un'attenta interpretazione.