Hva er on-device AI eller edge AI?

On-device AI betyr at en AI-modell kjører direkte på enheten — telefon, nettbrett eller lokal maskin — uten å sende data til en ekstern server. Edge AI er et bredere begrep som inkluderer lokal prosessering også på industrienheter, kameraer og sensorer nær der dataen oppstår.

Hvilke AI-modeller kan kjøre på en vanlig smarttelefon?

Per 2026 er Microsofts Phi-3 Mini, Googles Gemma 2B og Metas Llama 3 i 1B- og 3B-varianter de mest brukte. De er designet for å kjøre på enhet med begrenset minne og regnekraft. Apple integrerer egne modeller i iOS, og Google har Gemini Nano innebygd i Android.

Er on-device AI tryggere enn skybasert AI fra et personvernperspektiv?

I prinsippet ja, fordi data ikke forlater enheten. Men det er ikke automatisk tryggere: enheten kan fortsatt kompromitteres, og modellen i seg selv kan inneholde svakheter. On-device AI gjør det imidlertid enklere å overholde krav om at visse datatyper ikke skal overføres til tredjepart.

Hva er ulempene med AI som kjører på enhet?

Kapasiteten er vesentlig lavere enn store skymodeller. Komplekse oppgaver, lange dokumenter og sammensatte resonneringer håndteres dårligere. Modellene krever vedlikehold og oppdateringer, og utrulling i organisasjoner krever planlegging. On-device AI er et supplement til, ikke en erstatning for, skybaserte løsninger.

AI-modeller på mobil og edge 2026 — smarttelefonen som gjør jobben uten skyen

Kompakte AI-modeller som kjører direkte på enheten — uten å sende data til en ekstern server — er ikke lenger et laboratoriefenomen. I 2026 er det reelt mulig å kjøre brukbare språkmodeller på en moderne smarttelefon, et nettbrett eller en liten dedikert edge-enhet. Det endrer hvilke bruksscenarioer som er praktiske.

Hva som har skjedd teknisk

To parallelle utviklinger har gjort on-device AI mer aktuelt.

Den første er at modellene er blitt langt mer effektive. Microsofts Phi-serie, Googles Gemma og metas Llama-3 finnes i varianter ned mot én til tre milliarder parametere som gir god nok kvalitet for avgrensede oppgaver — klassifisering, ekstraktering, svargenerering fra strukturert kontekst — uten at man trenger et serverbygg med GPU-klynger.

Den andre er at mobilchipene har fått dedikerte nevralenheter. Apple sin Neural Engine, Qualcomm sine Hexagon NPU-er og Googles Tensor-chip i Pixel-serien er alle bygget for å kjøre matrisemultiplikasjon effektivt — nøyaktig det en språkmodell trenger. En moderne toppmodell-telefon fra 2024 eller 2025 har nok regnekraft til å kjøre en liten modell med akseptabel hastighet.

Hvilke bruksscenarioer gir mening

On-device AI er ikke et alternativ til skymodeller for alle formål. Den er best i scenarier der nettilgang ikke er garantert, der latenstid er kritisk, eller der dataene av juridiske eller sikkerhetsmessige grunner ikke bør forlate enheten.

Felt og industri: Teknikere som inspiserer utstyr i oljebransjen, på offshore-installasjoner eller i vanskelig tilgjengelig terreng, kan bruke en modell som tolker sjekklister, identifiserer avvik i bildedata eller genererer rapportutkast — uten nettilgang.

Helse og omsorg: En pleier som dokumenterer observasjoner via tale på en håndholdt enhet kan få transkripsjon og forslag til notat-struktur uten at lydopptak eller tekst sendes til en ekstern tjeneste. Det er et personvernargument i tillegg til et praktisk argument.

Lager og logistikk: Skanning, klassifisering og priotering av plukkjobber kan delvis håndteres lokalt på en enhet uten å vente på respons fra en sentral plattform.

Retail og kasse: Produktgjenkjenning og raske kundespørsmål kan besvares lokalt på kasseterminal uten avhengighet til internettforbindelsen.

Apple opplyser at Apples Neural Engine i A17 Pro-chipen kan utføre 35 billioner operasjoner per sekund. Qualcomm anslår at Snapdragon X Elite kan kjøre Llama 3-8B med opptil 20 tokens per sekund på enhet. Disse tallene er fra produsentenes tekniske dokumentasjon og er ikke uavhengig verifisert i reell norsk bruk.

Begrensninger

Modellene som kjører på enhet er vesentlig svakere enn store skymodeller. De kan løse avgrensede oppgaver godt, men generell resonnering, lange dokumenter og komplekse flertrinnsoppgaver krever fremdeles sky. Minnebegrensningene på en telefon setter et tak på kontekstlengde — typisk noen få tusen tokens.

Det er heller ikke gratis å rulle ut on-device AI i en organisasjon. Modellene må velges, tilpasses og vedlikeholdes. Sikkerhetsgjennomgang av hva som kjører på ansattes enheter er nødvendig. Og brukerne trenger opplæring i hva modellen er god for og hva den ikke er.

Hva norske virksomheter bør vurdere

For de fleste norske bedrifter er on-device AI ikke noe de trenger å planlegge i dag. Men for virksomheter med felt-arbeidere, streng dataklassifisering eller oppgaver med lav latenstid er det verdt å følge med. Teknologien modnes raskt, og det å ha et bevisst forhold til hva som kan kjøres lokalt kan gi et fortrinn om ett til to år.

Et naturlig første steg er å kartlegge hvilke arbeidsoppgaver der nettavhengighet eller dataeksponering i dag er en barriere for å ta AI i bruk. De scenariene er kandidatene for on-device eksperimenter.

AI-modeller på mobil og edge 2026 smarttelefonen som gjør jobben uten skyen