DeepSeek's Opkomst: Hoe een Chinese Startup de AI-industrie Hervormt

DeepSeek is een Chinese startup op het gebied van kunstmatige intelligentie (AI), opgericht in 2023 in Hangzhou door Liang Wenfeng, een voormalig hedgefondsmanager. Het bedrijf heeft snel internationale aandacht getrokken met de ontwikkeling van geavanceerde en kostenefficiënte AI-modellen die concurreren met toonaangevende Amerikaanse technologieën.

Achtergrond en Oprichting

Liang Wenfeng, geboren in 1985 in de provincie Guangdong, studeerde elektronica aan de Zhejiang Universiteit. Tijdens zijn studie raakte hij geïnteresseerd in computervisie en de automatisering van investeringen. In 2015 richtte hij High-Flyer Quant op, een hedgefonds dat succesvol gebruikmaakte van AI-algoritmen voor handelsstrategieën. Deze ervaring legde de basis voor de oprichting van DeepSeek in 2023, met als doel baanbrekende AI-technologieën te ontwikkelen.

Belangrijkste Ontwikkelingen en Modellen

DeepSeek-V2 (mei 2024): Dit model introduceerde een efficiënte Mixture-of-Experts (MoE) architectuur, waardoor sterke prestaties werden geleverd tegen lagere kosten. Het ondersteunt een contextlengte tot 128.000 tokens en maakt gebruik van innovatieve technieken zoals Multi-head Latent Attention (MLA) en DeepSeekMoE.
DeepSeek-V3 (december 2024): Met dit model werd een significante doorbraak bereikt in inferentiesnelheid en efficiëntie. DeepSeek-V3 overtrof andere open-source modellen en evenaarde de meest geavanceerde gesloten-source modellen wereldwijd. Het werd getraind op een meertalig corpus van 14,8 biljoen tokens en ondersteunde contextlengtes tot 128.000 tokens.
DeepSeek-R1 (januari 2025): Het meest recente model, R1, biedt prestaties die vergelijkbaar zijn met OpenAI's nieuwste modellen, maar tegen een fractie van de kosten. Het is open-source en beschikbaar via web, app en API.

Technologische Benadering

DeepSeek onderscheidt zich door het ontwikkelen van krachtige AI-modellen met beperkte middelen. Waar andere bedrijven duizenden geavanceerde chips gebruiken voor training, heeft DeepSeek zijn modellen getraind met ongeveer 2.000 Nvidia H800-chips in ongeveer 55 dagen, tegen een kostprijs van ongeveer $5,6 miljoen. Deze efficiënte benadering heeft de aandacht getrokken van de wereldwijde AI-gemeenschap en roept vragen op over de noodzaak van enorme investeringen in AI-infrastructuur.

Impact op de Markt

De introductie van DeepSeek's R1-model heeft geleid tot aanzienlijke onrust op de wereldwijde technologiemarkten. Belangrijke Amerikaanse technologieaandelen, zoals Nvidia, Microsoft en Alphabet (het moederbedrijf van Google), zagen significante dalingen in hun aandelenkoersen. Nvidia verloor bijvoorbeeld zijn positie als het meest waardevolle bedrijf in de VS na een daling van 17% in de aandelenkoers.

Controverse en Kritiek

Ondanks de technologische vooruitgang is er kritiek op DeepSeek vanwege ingebouwde censuurmechanismen. Het model weigert bijvoorbeeld vragen te beantwoorden over gevoelige onderwerpen zoals de protesten op het Tiananmen-plein in 1989 en mensenrechtenkwesties in China. Dit roept zorgen op over de invloed van de Chinese overheid op AI-technologieën en de mogelijke verspreiding van censuur via deze platforms.

Conclusie

DeepSeek heeft zich in korte tijd gevestigd als een invloedrijke speler in de AI-industrie, met geavanceerde en kostenefficiënte modellen die de concurrentie uitdagen. Hoewel het bedrijf lof oogst voor zijn technologische innovaties, zijn er ook zorgen over censuur en de bredere implicaties van de opkomst van Chinese AI-bedrijven op het wereldtoneel.

Blog | Qapitals

Zoeken in deze blog

DeepSeek's Opkomst: Hoe een Chinese Startup de AI-industrie Hervormt

Reacties

Een reactie posten

Populaire posts van deze blog

De 50/30/20-regel uitgelegd: zo verdeel je je inkomen slim

Tijd in de markt verslaat market timing. Altijd.

Persoonlijke inflatie: waarom jouw geld sneller verdwijnt dan je denkt