Zaskakująco opłacalny model AI Deepseek wyzwala gigantów branżowych. Choć początkowo domagając się zaledwie 6 milionów dolarów kosztów szkolenia dla swojego potężnego modelu Deepseek V3, bliższe spojrzenie ujawnia znacznie bardziej znaczącą inwestycję.
Model V3 Deepseek oferuje innowacyjne technologie: Prognozowanie wielu tokenów (MTP) , przewidując wiele słów jednocześnie; Mieszanka ekspertów (MOE) , wykorzystując 256 sieci neuronowych do ulepszonego przetwarzania; oraz wielopłaska ukryta uwaga (MLA) , koncentrując się na kluczowych elementach zdania w celu lepszej dokładności.
Obraz: engame.com
Jednak semianaliza odkryła znaczną infrastrukturę Deepseek: około 50 000 GPU Nvidia Hopper, w tym jednostki H800, H100 i H20, rozprzestrzeniły się na wiele centrów danych. Stanowi to całkowita inwestycja serwerowa w wysokości około 1,6 miliarda USD, a koszty operacyjne zbliżone do 944 mln USD.
Obraz: engame.com
Deepseek, spółka zależna High-Flyer, chiński fundusz hedgingowy, jest właścicielem centrów danych, wspierania kontroli i szybkiej innowacji. Jego własna natura przyczynia się do zwinności i szybkiego podejmowania decyzji. Firma przyciąga najlepsze talenty, a niektórzy badacze zarabiają ponad 1,3 miliona dolarów rocznie, głównie z chińskich uniwersytetów.
Obraz: engame.com
Początkowa liczba 6 milionów USD obejmuje jedynie korzystanie z GPU przed treningiem, pomijając badania, udoskonalenie, przetwarzanie danych i infrastrukturę. Rzeczywista inwestycja Deepseeka w AI przekracza 500 milionów dolarów. Mimo to jego szczupła struktura pozwala na wydajne innowacje, w przeciwieństwie do większych, bardziej biurokratycznych konkurentów.
Obraz: engame.com
Podczas gdy sukces Deepseek wynika ze znacznych inwestycji, postępów technologicznych i wykwalifikowanego zespołu, narracja „przyjazna budżetowi” jest myląca. Niemniej jego koszty pozostają znacznie niższe niż konkurenci; Na przykład model R1 Deepseek kosztował 5 milionów dolarów, w porównaniu do 100 milionów dolarów CHATGPT4. Przykład Deepseek pokazuje dobrze finansowaną niezależną firmę AI z powodzeniem konkurującym z uznanymi liderami, chociaż początkowe roszczenia kosztów wymagają starannej interpretacji.