Web

DeepSeek VS ChatGPT

DeepSeek vs ChatGPT

DeepSeek har fått mye oppmerksomhet den siste tiden, etter lansering av sin nye R1-modell som påstås å være på nivå med ChatGPT. Lanseringen skapte en storm i markedet, og store selskap som Nvidia og OpenAI stupte på aksjemarkedet. iOS applikasjonen til DeepSeek er nå også den mest nedlastede gratis-appen i USA, og har avsatt OpenAI sin app på topp.

Er DeepSeek-R1 egentlig bedre enn ChatGPT? Og ikke minst - er den flinkere til å kode?

Hvorfor skapte DeepSeek så stor uro i markedet?

Nvidia har dominert markedet innen kunstig intelligens (AI) chips og kontrollerer omtrent 80 % av markedet. Selskapet selger verdens dyreste AI-chips – eller grafikkprosessorer (GPU-er). For at Nvidia skal fortsette suksessen, må de forbli det prefererte valget for bedrifter sine AI-behov – og kundene må fortsette å investere i de nyeste og dyreste chipsene deres.

Men i slutten av januar skjedde noe som satte spørsmålstegn ved Nvidias evne til å opprettholde den kraftige inntektsveksten på lang sikt. DeepSeek kunngjorde at de hadde trent sin R1-modell på bare to måneder for under 6 millioner dollar. Til sammenligning har de største amerikanske teknologiselskapene brukt milliarder av dollar på Nvidia-brikker. Som følge av dette falt Nvidia-aksjen med 17 % på én handelsdag, noe som tilsvarte et verdifall på nesten 600 milliarder dollar.

Hva er DeepSeek og DeepSeek-R1?

DeepSeek er et kinesisk AI-selskap grunnlagt i 2023, som lager open-source store språkmodeller (LLMs). For deg som er ny til store språkmodeller, så er dette en type maskinlæringsmodell som trener på en veldig stor mengde med data i tekstformat. Dette resulterer i en modell som genererer eller forutser menneske-lik tekst.

DeepSeek-R1 er en AI-modell utviklet av DeepSeek, lansert i januar 2025. Modellen konkurrerer med, og overgår i noen tilfeller, resonneringsevnen til noen av verdens mest avanserte modeller, men til en brøkdel av driftskostnadene, ifølge selskapet selv. DeepSeek-R1 er også åpen kildekode under MIT-lisensen, noe som tillater fri kommersiell og akademisk bruk.

Hva har dette å si for AI-utvikling?

At DeepSeek-R1 har åpen kildekode betyr at allmennheten har fri tilgang til både modellen og kildekoden, noe som kan ha store implikasjoner for AI-utvikling fremover:

  1. Lavere kostander for utvikling - Nvidia-brikker har vært dyre og en stor utgiftspost for AI-utvikling. Med en åpen modell som DeepSeek-R1 kan utviklere trene og bruke avansert AI uten å være like avhengige av Nvidia sitt økosystem.

  2. Tilpasning og videreutvikling – Kildekoden og modellen er åpen, slik at utviklere kan finjustere modellen for spesifikke brukstilfeller, trene den videre med egen data eller optimalisere den for egne behov. Utviklere kan kjøre modellen på egne servere eller i skyen uten avhengighet til en tredjepartsleverandør, noe som gir bedre kontroll over data, ytelse og kostnader.

  3. Gjennomsiktighet – Siden koden og arkitekturen er åpen, kan utviklere forstå hvordan modellen fungerer, evaluere styrker og svakheter, samt identifisere potensielle bias eller sikkerhetsproblemer.

  4. Integrasjon med egne systemer – Åpen tilgang til modellen gjør det lettere å integrere den i eksisterende løsninger, API-er eller applikasjoner uten begrensninger fra kommersielle API-er.

Dette vil være spesielt viktig for Europa, da dette gir muligheten til å slenge seg på “AI-kappløpet”. Europa har lenge vært avhengig av AI-modeller fra amerikanske aktører som OpenAI, Google DeepMind og Meta med mer. Åpen kildekode-modeller gir europeiske selskaper og forskere mulighet til å bygge egne løsninger uten å være låst til amerikanske skytjenester.

Ved å fritt kunne bruke, tilpasse og hoste modellen selv, kan europeiske aktører sikre datasuverenitet, overholde strenge personvernkrav som GDPR og utvikle spesialtilpassede løsninger for flerspråklige og bransjespesifikke behov. Samtidig gir DeepSeek sitt API en betydelig billigere tilgang til avansert AI, noe som gjør det mulig for europeiske startups og bedrifter å konkurrere globalt uten de enorme kostnadene som ofte er knyttet til AI-utvikling.

Hvordan er DeepSeek sammenlignet med ChatGPT?

En av de største forskjellene mellom DeepSeek-R1 og ChatGPT er i forhold til fokus. ChatGPT er primært designet for konversasjon, og fokuserer på narrow AI (task-specific intelligence). På den andre siden så prøver DeepSeek å oppnå kunstig generell intelligens (AGI).

Kunstig generell intelligens (AGI) er en hypotetisk form for AI som kan forstå og lære enhver intellektuell oppgave på samme måte som et menneske. Målet er å etterligne de kognitive evnene til den menneskelige hjernen. Den nye modellen er utviklet for å løse komplekse intellektuelle oppgaver på et nivå som nærmer seg menneskelig kapasitet, med særlig fokus på forbedret resonneringsevne. Dette gjør den til et viktig bidrag i den pågående utviklingen av mer kraftige og fleksible AI-systemer.

Tidligere satte OpenAI en standard for resonneringsbasert AI med sin o1-modell, som bruker chain-of-thought-teknikker for å bryte ned problemer i flere trinn. Ved hjelp av forsterkende læring (RL) kan modellen forbedre sine strategier ved å justere seg basert på belønningssystemer, noe som hjelper den med å identifisere feil og teste alternative løsninger når det kreves.

DeepSeek-R1 bygger videre på denne tilnærmingen ved å kombinere forsterkende læring med veiledet finjustering, noe som gjør modellen spesielt godt egnet til krevende logiske og matematiske oppgaver. Testresultatene viser sterke prestasjoner, med 79,8 % på AIME 2024-matematikktesten, 97,3 % på MATH-500-benchmarken, og en Codeforces-rating på 2 029, der den overgår 96,3 % av menneskelige programmerere. Til sammenligning oppnådde OpenAIs o1–1217 79,2 % på AIME, 96,4 % på MATH-500 og 96,6 % på Codeforces.

Innen generell kunnskap presterte DeepSeek-R1 med 90,8 % nøyaktighet på MMLU-benchmarken, bare ett prosentpoeng bak o1 sin 91,8 %. Disse resultatene understreker at DeepSeek-R1 er en av de mest avanserte åpne AI-modellene på markedet og demonstrerer fremgang innen resonnering og problemløsning for utviklingen av AGI.

Forskjellige modeller

Videre er det også en differanse i arkitekturene til modellene. DeepSeek-R1 benytter en Mixture-of-Experts (MoE)-tilnærming, som kan sammenlignes med et team av spesialiserte eksperter der kun de mest relevante aktiveres for hver oppgave. Med totalt 671 milliarder parametere, aktiverer DeepSeek-R1 kun en delmengde av disse (37 milliarder) for hver forespørsel, noe som øker effektiviteten. Denne MoE-arkitekturen gjør at DeepSeek-R1 kan optimalisere både ytelse og ressursbruk ved dynamisk å tilpasse seg ulike typer spørsmål. Til sammenligning bruker ChatGPT en tradisjonell transformer-modell, der alle parametere aktiveres for hver oppgave – noe som gir konsistente resultater, men potensielt med lavere effektivitet.

Ulike styrker

Hver modell har sine styrker på ulike områder. DeepSeek-R1 utmerker seg spesielt i tekniske oppgaver, med imponerende resultater innen matematikk for eksempel. Dette gjør den spesielt verdifull for oppgaver som krever presise tekniske løsninger. ChatGPT, derimot, har en sterkere evne til å forstå kontekst og levere mer nyanserte svar på et bredere spekter av emner.

  1. Skriving
    Begge modeller kan bistå med dokumentasjon og innholdsproduksjon, men de har en relativt ulik tilnærming. ChatGPT er dyktig til å skape engasjerende, samtale-lignende innhold med bred kontekst, noe som gjør den ideell for å forklare komplekse data-konsepter til ikke-tekniske interessenter.

    DeepSeek derimot, utmerker seg i tekniske skriveoppgaver, hvor den produserer presis og formell dokumentasjon. Dette gjør den spesielt verdifull for tekniske spesifikasjoner og dokumentasjon av datarelaterte prosjekter.

  2. Kreativitet og løsningsforslag
    ChatGPT er utmerket til å foreslå flere varierte løsninger, noe som gir et bredt spekter av analytiske muligheter å utforske. DeepSeek, derimot, fokuserer ofte på færre, men mer gjennomarbeidede løsninger, og går i dybden på én tilnærming. Dette gjør den spesielt nyttig når man trenger en detaljert og grundig utformet datastrategi.

  3. Research og læring
    ChatGPT tilbyr mer veiledningsbaserte forklaringer som egner seg godt for å lære nye konsepter. Den er spesielt god på å bryte ned komplekse temaer i forståelige deler. DeepSeek, derimot, prioriterer presisjon og kortfattethet, noe som gjør den nyttig for raske oppslag og for eksempel faktasjekking. Eksempelvis så er den særlig verdifull når man undersøker spesifikke metoder eller algoritmer, eller andre tekniske problemstillinger.

Er DeekSeek egentlig et bedre utviklingsverktøy?

For programmerere er valg av riktig AI-verktøy avgjørende. ChatGPT tilbyr omfattende kodehjelp med detaljerte forklaringer, noe som gjør det til et utmerket læringsverktøy. DeepSeek-R1, derimot, fokuserer på raskere kodegenerering og mer presise svar, noe som er spesielt nyttig for raske og effektive løsninger på spesifikke programmeringsutfordringer.

ChatGPT gir nok fortsatt bedre svar når du ønsker å forstå komplekse implementasjoner, men DeepSeek klarer å løse de vanskeligere oppgavene mer presist da den legger mer fokus på én løsning fremfor et utdypende svar med mye kontekst og forklaring. ChatGPT kommer gjerne med flere forskjellige forslag til problemet, noe som kan være både positivt og negativt avhengig av situasjonen.

Konklusjon

DeepSeek-R1 er fortsatt relativt ny, og har både fordeler og ulemper til sin fremgangsmåte. I testingen har vi opplevd at serverne svært ofte er utilgjengelige, noe som har vært en ulempe. Med litt modning tror vi at DeepSeek kan bli en ordentlig konkurrent til GPT.

DeepSeek er fortsatt gratis, samt har åpen kildekode - noe som kan gi utviklere muligheten til å lage egne tilpassede modeller. API tilgang er også mye billigere enn hos konkurrenten OpenAI.

DeepSeek

DeepSeek R1 er spesielt designet for tekniske og strukturerte oppgaver. Den håndterer koding, matematisk resonnering og logikkbaserte spørsmål med høy effektivitet, noe som gjør den til et godt valg for mange utviklere og forskere. Hvis du søker presise og direkte svar uten unødvendige detaljer, leverer DeepSeek R1 dette effektivt.

ChatGPT

ChatGPT o1, derimot, er mer fleksibel. Den presterer godt innen kreativ skriving, idémyldring og åpne diskusjoner, noe som gjør den ideell for innholdsproduksjon, forskning og uformelle samtaler. Selv om den kan håndtere tekniske emner, har den en tendens til å gi mer detaljerte forklaringer, noe som kan være nyttig for brukere som foretrekker mer kontekst.

Andre artikler

Coockiebanner