Wat je moet weten over de Chinese AI DeepSeek

Artificial intelligence Artificial intelligence admin januari 29, 2025 0 Reacties

Wat je moet weten over de Chinese AI DeepSeek

Een nieuwe speler in AI-land

Een nieuwe speler heeft zijn intrede gedaan in de AI-wereld en zorgt voor flinke opschudding.
De Chinese AI-startup DeepSeek trok vorige week de aandacht door de volledige versie van R1 uit te brengen, het open-sourceredeneermodel van het bedrijf dat OpenAI’s o1 kan overtreffen. Afgelopen maandag overtrof het aantal downloads van DeepSeeks AI-assistent — draaiend op V3, een model dat DeepSeek in december lanceerde — in de App Store zelfs ChatGPT, tot dan toe de meest gedownloade gratis AI-app.

DeepSeek R1 heeft zich ook snel opgewerkt naar de derde plaats in HuggingFace’s Chatbot Arena, achter enkele Gemini-modellen en ChatGPT-4o. Vrijwel direct nadat het OpenAI van de troon stootte, begon DeepSeek met het beperken van nieuwe registraties vanwege een vermeende cyberaanval. Vervolgens deed het bedrijf er nog een schepje bovenop door een veelbelovend nieuw beeldmodel te presenteren.

Wat is DeepSeek?

DeepSeek, opgericht door Liang Wenfeng in mei 2023 (nog geen twee jaar geleden), daagt gevestigde AI-bedrijven uit met een open-source aanpak. Volgens Forbes zit DeepSeeks kracht in het feit dat het bedrijf uitsluitend wordt gefinancierd door High-Flyer, een hedgefonds dat ook onder leiding staat van Wenfeng. Daarmee heeft DeepSeek een financieringsmodel dat snelle groei en onderzoek bevordert.

Wat is DeepSeek R1?

De complete versie van R1, het vlaggenschip van DeepSeeks redeneermodellen, werd vorige week uitgebracht. Dit model presteert op of boven het niveau van OpenAI’s geprezen o1-model in diverse tests voor wiskunde, programmeren en redeneren. Wat R1 bijzonder maakt, is dat het — in tegenstelling tot andere vooraanstaande modellen van grote techbedrijven — open-source is. Iedereen kan het dus downloaden en gebruiken. DeepSeek heeft overigens geen details bekendgemaakt over de dataset waarop R1 is getraind. Tot nu toe zijn alle andere modellen van het bedrijf ook open-source. DeepSeek is bovendien goedkoper dan vergelijkbare Amerikaanse modellen.

Kostenclaims

DeepSeek beweert in een bedrijfsrapport dat de training van zijn V3-model 5,6 miljoen dollar heeft gekost. Dat bedrag circuleert (en wordt betwist) als de totale ontwikkelingskosten voor het model. Volgens de AP menen sommige experts echter dat dit alleen betrekking heeft op de laatste trainingsronde voor V3, niet op de volledige ontwikkelingskosten (die normaal gesproken veel hoger liggen, gezien wat techgiganten spenderen aan concurrerende modellen). Andere deskundigen stellen dat DeepSeeks kosten geen rekening houden met eerdere uitgaven voor infrastructuur, onderzoek, data en personeel.

Censuur

Een mogelijk nadeel voor DeepSeeks langetermijnconcurrentie met o1 en andere Amerikaanse modellen is censuur. Chinese modellen leggen vaak beperkingen op bij bepaalde onderwerpen, waardoor zij mogelijk geen antwoord geven op bepaalde vragen (bijvoorbeeld vragen over het Tiananmen-plein en Taiwan).

Al zijn dergelijke regels niet uniek voor Chinese modellen — alle populaire AI-modellen hebben hun eigen richtlijnen, moderatieprocessen en contentcontroles. Toch zijn Amerikaanse chatbots vooralsnog minder geneigd vragen over historische gebeurtenissen te weigeren.

Zorgen over privacy

De zorgen die rond TikTok bestaan op het gebied van gegevensprivacy — de deels verboden Chinese socialmedia-app in de VS — steken ook de kop op bij DeepSeek.

“De persoonlijke informatie die we van je verzamelen kan worden opgeslagen op een server buiten het land waar je woont,”
zo staat in DeepSeeks privacybeleid.
“We slaan de informatie die we verzamelen op in beveiligde servers in de Volksrepubliek China.”

Het beleid geeft aan dat DeepSeek allerlei gegevens verzamelt, waaronder maar niet beperkt tot:

IP-adres, unieke apparaat-ID’s en cookies
Geboortedatum (waar van toepassing), gebruikersnaam, e-mailadres en/of telefoonnummer, en wachtwoord
Tekst- of audio-invoer, prompts, geüploade bestanden, feedback, chatgeschiedenis of andere inhoud die je aan het model of de diensten verstrekt
Bewijs van identiteit of leeftijd, feedback of vragen over je gebruik van de dienst (als je contact opneemt met DeepSeek)

Verderop staat:

“Als wij persoonlijke informatie buiten het land waar je woont overdragen, onder andere voor een of meer van de doeleinden zoals in dit Beleid genoemd, doen wij dat in overeenstemming met de vereisten van de toepasselijke wet- en regelgeving over gegevensbescherming.”

Er wordt echter niets gezegd over naleving van de AVG (GDPR).

“Gebruikers moeten zich ervan bewust zijn dat data die zij met het platform delen, kunnen worden opgevraagd door de overheid volgens de Chinese cyberveiligheidswetten, die bedrijven verplichten data op verzoek beschikbaar te stellen,” zegt Adrianus Warmenhoven, lid van de veiligheidsadviesraad van NordVPN.

“DeepSeeks AI-model heeft te maken met toenemende kritiek wegens de weigering om bepaalde politieke onderwerpen te bespreken,” vervolgt hij. “Hierdoor zijn er zorgen over mogelijke vooringenomenheid en externe beïnvloeding van het moderatiebeleid van het platform.”

Volgens sommige waarnemers bevordert het feit dat R1 open-source is juist de transparantie, omdat gebruikers de broncode kunnen inzien en controleren op mogelijke privacykwesties. DeepSeek heeft bovendien kleinere versies van R1 uitgebracht, die lokaal gedraaid kunnen worden, zodat er geen data naar de servers van het bedrijf wordt gestuurd (in tegenstelling tot het online gebruik van de chatbot). Overigens verzamelen alle chatbots, dus ook ChatGPT, in zekere mate gebruikersgegevens zodra ze via een browser geraadpleegd worden.

Wat dit betekent voor AI in het algemeen

R1’s snelle opkomst wijst op een kentering in de AI-sector, waarin kleinere labs en onderzoekers in staat worden gesteld om concurrerende modellen te ontwikkelen en het totale aanbod te diversifiëren. Organisaties zonder de budgetten of personeelsomvang van OpenAI kunnen R1 bijvoorbeeld downloaden en finetunen om te concurreren met modellen zoals o1. Vlak voor de release van R1 ontwikkelden onderzoekers aan UC Berkeley een open-sourcemodel dat al in de buurt komt van o1-preview (een vroege versie van o1), in slechts 19 uur en voor zo’n 450 dollar.

Aangezien de investeringen in AI intussen de pan uit rijzen, speculeren velen dat deze ontwikkeling de “AI-bubbel” wel eens zou kunnen doorprikken. Meerdere berichten suggereren al dat de aandelenmarkt hierop in paniek reageert.

DeepSeeks opmars vindt plaats op een cruciaal moment voor de Chinees-Amerikaanse betrekkingen in de technologiesector, slechts enkele dagen nadat het langverwachte TikTok-verbod deels van kracht ging. Ironisch genoeg benoemt DeepSeek in duidelijke bewoordingen juist de veiligheidszorgen die de VS zo lastig kon onderbouwen in het langdurige proces naar het instellen van een verbod op TikTok.

Refurbished Apple Producten