Hva er forskjellen på AI-trening og AI-inferens?

Trening er den tunge engangsjobben med å lære opp en modell på store datamengder, og krever fleksible, kraftige brikker der Nvidias GPU-er dominerer. Inferens er hver gang modellen brukes — hvert svar, hver kodefullføring, hvert bilde — i kolossalt volum døgnet rundt. Fordi inferens er mer repetitiv, kan den kjøres billigere på spesialtilpassede brikker, og utgjør i 2026 to tredjedeler av all AI-databehandling.

Slår Google, Amazon og Microsoft ut Nvidia i 2026?

Nei. Nvidia holder fortsatt rundt 80 prosent av markedet for AI-trening og er referansen på toppen med Vera Rubin-plattformen. Men hyperskalernes egne spesialbrikker — Googles TPU, Amazons Trainium, Microsofts Maia og Metas MTIA — vokser raskere og gir 40 til 65 prosent lavere totalkostnad for inferens i stor skala. Markedet deler seg snarere enn at noen erstatter Nvidia.

Hvordan påvirker brikkekrigen prisen på AI for bedrifter?

Positivt. De fleste norske bedrifter kjøper AI som skytjeneste per token eller kall, og den prisen henger direkte sammen med leverandørens inferens-kostnad. Når hyperskalerne bygger egne brikker som senker denne kostnaden, presses prisene nedover over tid. Det er en hovedgrunn til at AI-API-priser har falt kraftig. Bedrifter bør måle kostnad per oppgave og unngå hard innlåsing til én leverandør.

AI-brikker 2026 — Nvidia Rubin møter hyperskalernes egne sjetonger

I 2026 lanserte Nvidia sin Vera Rubin-plattform og holder fortsatt rundt 80 prosent av markedet for AI-treningsbrikker. Men under overflaten skjer et skifte: Google, Amazon, Microsoft og Meta bygger sine egne spesialbrikker, og disse vokser raskere enn Nvidias GPU-er. Drivkraften er inferens — den daglige kjøringen av AI-modeller — som nå utgjør to tredjedeler av all AI-databehandling.

Trening mot inferens — den viktigste forskjellen

For å forstå brikkekrigen må man skille to faser. *Trening* er den tunge, engangsjobben med å lære opp en modell på enorme datamengder. Det krever fleksible, kraftige brikker, og her er Nvidias GPU-er med sin programmerbarhet nesten enerådende.

*Inferens* er noe annet: det er hver gang modellen faktisk brukes — hvert svar fra en chatbot, hver kodefullføring, hvert bilde som genereres. Inferens er enklere og mer repetitiv, men skjer i kolossalt volum, døgnet rundt. Og fordi oppgaven er mer forutsigbar, kan den kjøres billigere på spesialtilpassede brikker enn på dyre generelle GPU-er. Det er denne innsikten som driver hele bølgen av egenutviklet silisium i 2026.

Det som faktisk skjedde i 2026

Nvidias Vera Rubin er fortsatt referansen på toppen, med svært høy ytelse og store mengder rask HBM4-minne, og plattformen bunter flere samdesignede brikker i én arkitektur. Analytikere venter at Rubin utvider Nvidias ledelse i trening snarere enn å svekke den.

Samtidig akselererte hyperskalerne sine egne brikker kraftig. Google kjører nye generasjoner av sin TPU, Amazon utvider Trainium-familien, Microsoft har sin Maia, og Meta sin MTIA. Disse spesialbrikkene (ASIC-er) er anslått å vokse langt raskere enn GPU-markedet, og de gir 40 til 65 prosent lavere totalkostnad i stor skala for inferens-oppgaver. Bak kulissene står Broadcom og Marvell, som sammen kontrollerer mesteparten av co-design-markedet og oversetter hyperskalernes spesifikasjoner til faktisk produserbare brikker.

Poenget er ikke at noen «slår» Nvidia. Poenget er at markedet deler seg: Nvidia på toppen for trening og krevende, fleksible oppgaver, og en voksende skog av spesialbrikker for det enorme inferens-volumet.

Hvorfor dette betyr noe for prisen på AI

For norske bedrifter er dette ikke en abstrakt maskinvare-diskusjon. Det handler om hva AI koster å bruke. De aller fleste norske virksomheter kjøper AI som en skytjeneste — per token, per kall, per måned. Den prisen henger direkte sammen med hva det koster leverandøren å kjøre inferens.

Når hyperskalerne bygger egne brikker som senker inferens-kostnaden, presser det prisene nedover over tid. Det er en av grunnene til at prisen på AI-API-er har falt kraftig de siste årene. Konkurransen i brikkelaget er altså god nyheter for den som kjøper AI på toppen.

Hva det betyr for norske virksomheter

Det praktiske rådet er å bry seg om resultatet, ikke merket på brikken. Hvilken silisium som ligger under tjenesten du bruker, er sjelden noe du velger eller bør bekymre deg for. Det du bør følge med på, er kostnad per oppgave, hastighet og pålitelighet.

To ting er likevel verdt å merke seg. For det første gjør konkurransen i brikkelaget det risikabelt å låse seg for hardt til én leverandør, fordi pris- og ytelsesbildet endrer seg raskt. For det andre er strøm den egentlige flaskehalsen: kraftigere brikker betyr mer effektiv databehandling per watt, men også voksende totalt strømforbruk i datasentrene — noe som er særlig relevant i en norsk kraftdebatt der datasentre konkurrerer om strømmen.

Slik forholder du deg til det

Mål kostnad per oppgave, ikke brikkemerke. Det relevante er hva en typisk AI-jobb koster og hvor raskt den går — ikke hvilken GPU eller ASIC som kjører den.
Unngå hard innlåsing. Pris og ytelse i AI-tjenester endrer seg raskt når brikkekonkurransen øker. Hold løsningene dine flyttbare der det er mulig.
Følg strøm- og kostnadstrenden. Fallende inferens-kostnad er bra for kjøpere, men datasentrenes strømforbruk er en reell begrensning, særlig i Norge.

«Nvidia kommanderer rundt 80 prosent av markedet for AI-treningsakseleratorer i 2026, mens hyperskalernes spesialbrikker vokser langt raskere og målretter inferens-oppgavene som nå utgjør to tredjedeler av all AI-databehandling.» — Bransjeanalyse av AI-databehandling, 2026

AI-brikker 2026 Nvidia Rubin møter hyperskalernes egne sjetonger