DeepSeek is een Chinese startup op het gebied van kunstmatige intelligentie (AI), opgericht in 2023 in Hangzhou door Liang Wenfeng, een voormalig hedgefondsmanager. Het bedrijf heeft snel internationale aandacht getrokken met de ontwikkeling van geavanceerde en kostenefficiënte AI-modellen die concurreren met toonaangevende Amerikaanse technologieën.
Achtergrond en Oprichting
Liang Wenfeng, geboren in 1985 in de provincie Guangdong, studeerde elektronica aan de Zhejiang Universiteit. Tijdens zijn studie raakte hij geïnteresseerd in computervisie en de automatisering van investeringen. In 2015 richtte hij High-Flyer Quant op, een hedgefonds dat succesvol gebruikmaakte van AI-algoritmen voor handelsstrategieën. Deze ervaring legde de basis voor de oprichting van DeepSeek in 2023, met als doel baanbrekende AI-technologieën te ontwikkelen.
Belangrijkste Ontwikkelingen en Modellen
DeepSeek-V2 (mei 2024): Dit model introduceerde een efficiënte Mixture-of-Experts (MoE) architectuur, waardoor sterke prestaties werden geleverd tegen lagere kosten. Het ondersteunt een contextlengte tot 128.000 tokens en maakt gebruik van innovatieve technieken zoals Multi-head Latent Attention (MLA) en DeepSeekMoE.
DeepSeek-V3 (december 2024): Met dit model werd een significante doorbraak bereikt in inferentiesnelheid en efficiëntie. DeepSeek-V3 overtrof andere open-source modellen en evenaarde de meest geavanceerde gesloten-source modellen wereldwijd. Het werd getraind op een meertalig corpus van 14,8 biljoen tokens en ondersteunde contextlengtes tot 128.000 tokens.
DeepSeek-R1 (januari 2025): Het meest recente model, R1, biedt prestaties die vergelijkbaar zijn met OpenAI's nieuwste modellen, maar tegen een fractie van de kosten. Het is open-source en beschikbaar via web, app en API.
Technologische Benadering
DeepSeek onderscheidt zich door het ontwikkelen van krachtige AI-modellen met beperkte middelen. Waar andere bedrijven duizenden geavanceerde chips gebruiken voor training, heeft DeepSeek zijn modellen getraind met ongeveer 2.000 Nvidia H800-chips in ongeveer 55 dagen, tegen een kostprijs van ongeveer $5,6 miljoen. Deze efficiënte benadering heeft de aandacht getrokken van de wereldwijde AI-gemeenschap en roept vragen op over de noodzaak van enorme investeringen in AI-infrastructuur.
Impact op de Markt
De introductie van DeepSeek's R1-model heeft geleid tot aanzienlijke onrust op de wereldwijde technologiemarkten. Belangrijke Amerikaanse technologieaandelen, zoals Nvidia, Microsoft en Alphabet (het moederbedrijf van Google), zagen significante dalingen in hun aandelenkoersen. Nvidia verloor bijvoorbeeld zijn positie als het meest waardevolle bedrijf in de VS na een daling van 17% in de aandelenkoers.
Controverse en Kritiek
Ondanks de technologische vooruitgang is er kritiek op DeepSeek vanwege ingebouwde censuurmechanismen. Het model weigert bijvoorbeeld vragen te beantwoorden over gevoelige onderwerpen zoals de protesten op het Tiananmen-plein in 1989 en mensenrechtenkwesties in China. Dit roept zorgen op over de invloed van de Chinese overheid op AI-technologieën en de mogelijke verspreiding van censuur via deze platforms.
Conclusie
DeepSeek heeft zich in korte tijd gevestigd als een invloedrijke speler in de AI-industrie, met geavanceerde en kostenefficiënte modellen die de concurrentie uitdagen. Hoewel het bedrijf lof oogst voor zijn technologische innovaties, zijn er ook zorgen over censuur en de bredere implicaties van de opkomst van Chinese AI-bedrijven op het wereldtoneel.
Reacties
Een reactie posten