AI-brikker 2026 Nvidia Rubin møter hyperskalernes egne sjetonger
Nvidia dominerer fortsatt AI-trening i 2026, men hyperskalernes egne brikker vokser raskere — og det handler om inferens, kostnad og hvor mye du betaler for AI.
AI-brikker 2026 — Nvidia Rubin møter hyperskalernes egne sjetonger
I 2026 lanserte Nvidia sin Vera Rubin-plattform og holder fortsatt rundt 80 prosent av markedet for AI-treningsbrikker. Men under overflaten skjer et skifte: Google, Amazon, Microsoft og Meta bygger sine egne spesialbrikker, og disse vokser raskere enn Nvidias GPU-er. Drivkraften er inferens — den daglige kjøringen av AI-modeller — som nå utgjør to tredjedeler av all AI-databehandling.
Trening mot inferens — den viktigste forskjellen
For å forstå brikkekrigen må man skille to faser. *Trening* er den tunge, engangsjobben med å lære opp en modell på enorme datamengder. Det krever fleksible, kraftige brikker, og her er Nvidias GPU-er med sin programmerbarhet nesten enerådende.
*Inferens* er noe annet: det er hver gang modellen faktisk brukes — hvert svar fra en chatbot, hver kodefullføring, hvert bilde som genereres. Inferens er enklere og mer repetitiv, men skjer i kolossalt volum, døgnet rundt. Og fordi oppgaven er mer forutsigbar, kan den kjøres billigere på spesialtilpassede brikker enn på dyre generelle GPU-er. Det er denne innsikten som driver hele bølgen av egenutviklet silisium i 2026.
Det som faktisk skjedde i 2026
Nvidias Vera Rubin er fortsatt referansen på toppen, med svært høy ytelse og store mengder rask HBM4-minne, og plattformen bunter flere samdesignede brikker i én arkitektur. Analytikere venter at Rubin utvider Nvidias ledelse i trening snarere enn å svekke den.
Samtidig akselererte hyperskalerne sine egne brikker kraftig. Google kjører nye generasjoner av sin TPU, Amazon utvider Trainium-familien, Microsoft har sin Maia, og Meta sin MTIA. Disse spesialbrikkene (ASIC-er) er anslått å vokse langt raskere enn GPU-markedet, og de gir 40 til 65 prosent lavere totalkostnad i stor skala for inferens-oppgaver. Bak kulissene står Broadcom og Marvell, som sammen kontrollerer mesteparten av co-design-markedet og oversetter hyperskalernes spesifikasjoner til faktisk produserbare brikker.
Poenget er ikke at noen «slår» Nvidia. Poenget er at markedet deler seg: Nvidia på toppen for trening og krevende, fleksible oppgaver, og en voksende skog av spesialbrikker for det enorme inferens-volumet.
Hvorfor dette betyr noe for prisen på AI
For norske bedrifter er dette ikke en abstrakt maskinvare-diskusjon. Det handler om hva AI koster å bruke. De aller fleste norske virksomheter kjøper AI som en skytjeneste — per token, per kall, per måned. Den prisen henger direkte sammen med hva det koster leverandøren å kjøre inferens.
Når hyperskalerne bygger egne brikker som senker inferens-kostnaden, presser det prisene nedover over tid. Det er en av grunnene til at prisen på AI-API-er har falt kraftig de siste årene. Konkurransen i brikkelaget er altså god nyheter for den som kjøper AI på toppen.
Hva det betyr for norske virksomheter
Det praktiske rådet er å bry seg om resultatet, ikke merket på brikken. Hvilken silisium som ligger under tjenesten du bruker, er sjelden noe du velger eller bør bekymre deg for. Det du bør følge med på, er kostnad per oppgave, hastighet og pålitelighet.
To ting er likevel verdt å merke seg. For det første gjør konkurransen i brikkelaget det risikabelt å låse seg for hardt til én leverandør, fordi pris- og ytelsesbildet endrer seg raskt. For det andre er strøm den egentlige flaskehalsen: kraftigere brikker betyr mer effektiv databehandling per watt, men også voksende totalt strømforbruk i datasentrene — noe som er særlig relevant i en norsk kraftdebatt der datasentre konkurrerer om strømmen.
Slik forholder du deg til det
- Mål kostnad per oppgave, ikke brikkemerke. Det relevante er hva en typisk AI-jobb koster og hvor raskt den går — ikke hvilken GPU eller ASIC som kjører den.
- Unngå hard innlåsing. Pris og ytelse i AI-tjenester endrer seg raskt når brikkekonkurransen øker. Hold løsningene dine flyttbare der det er mulig.
- Følg strøm- og kostnadstrenden. Fallende inferens-kostnad er bra for kjøpere, men datasentrenes strømforbruk er en reell begrensning, særlig i Norge.
«Nvidia kommanderer rundt 80 prosent av markedet for AI-treningsakseleratorer i 2026, mens hyperskalernes spesialbrikker vokser langt raskere og målretter inferens-oppgavene som nå utgjør to tredjedeler av all AI-databehandling.» — Bransjeanalyse av AI-databehandling, 2026
Slik vurderer vi
Vi baserer innholdet på offisielle priser, leverandørenes egne sider og uavhengige kilder, oppdatert løpende. Vi tjener provisjon på enkelte lenker, men det påvirker ikke vurderingen.