AI-modeller på mobil og edge 2026 smarttelefonen som gjør jobben uten skyen
Modeller som Phi-3, Gemma og Llama-3 finnes nå i varianter som kjører lokalt på vanlig mobilhardware. For norske virksomheter åpner det for bruk i felt, på lager og i helsevesenet — der data ikke bør sendes til skyen.
AI-modeller på mobil og edge 2026 — smarttelefonen som gjør jobben uten skyen
Kompakte AI-modeller som kjører direkte på enheten — uten å sende data til en ekstern server — er ikke lenger et laboratoriefenomen. I 2026 er det reelt mulig å kjøre brukbare språkmodeller på en moderne smarttelefon, et nettbrett eller en liten dedikert edge-enhet. Det endrer hvilke bruksscenarioer som er praktiske.
Hva som har skjedd teknisk
To parallelle utviklinger har gjort on-device AI mer aktuelt.
Den første er at modellene er blitt langt mer effektive. Microsofts Phi-serie, Googles Gemma og metas Llama-3 finnes i varianter ned mot én til tre milliarder parametere som gir god nok kvalitet for avgrensede oppgaver — klassifisering, ekstraktering, svargenerering fra strukturert kontekst — uten at man trenger et serverbygg med GPU-klynger.
Den andre er at mobilchipene har fått dedikerte nevralenheter. Apple sin Neural Engine, Qualcomm sine Hexagon NPU-er og Googles Tensor-chip i Pixel-serien er alle bygget for å kjøre matrisemultiplikasjon effektivt — nøyaktig det en språkmodell trenger. En moderne toppmodell-telefon fra 2024 eller 2025 har nok regnekraft til å kjøre en liten modell med akseptabel hastighet.
Hvilke bruksscenarioer gir mening
On-device AI er ikke et alternativ til skymodeller for alle formål. Den er best i scenarier der nettilgang ikke er garantert, der latenstid er kritisk, eller der dataene av juridiske eller sikkerhetsmessige grunner ikke bør forlate enheten.
Felt og industri: Teknikere som inspiserer utstyr i oljebransjen, på offshore-installasjoner eller i vanskelig tilgjengelig terreng, kan bruke en modell som tolker sjekklister, identifiserer avvik i bildedata eller genererer rapportutkast — uten nettilgang.
Helse og omsorg: En pleier som dokumenterer observasjoner via tale på en håndholdt enhet kan få transkripsjon og forslag til notat-struktur uten at lydopptak eller tekst sendes til en ekstern tjeneste. Det er et personvernargument i tillegg til et praktisk argument.
Lager og logistikk: Skanning, klassifisering og priotering av plukkjobber kan delvis håndteres lokalt på en enhet uten å vente på respons fra en sentral plattform.
Retail og kasse: Produktgjenkjenning og raske kundespørsmål kan besvares lokalt på kasseterminal uten avhengighet til internettforbindelsen.
Apple opplyser at Apples Neural Engine i A17 Pro-chipen kan utføre 35 billioner operasjoner per sekund. Qualcomm anslår at Snapdragon X Elite kan kjøre Llama 3-8B med opptil 20 tokens per sekund på enhet. Disse tallene er fra produsentenes tekniske dokumentasjon og er ikke uavhengig verifisert i reell norsk bruk.
Begrensninger
Modellene som kjører på enhet er vesentlig svakere enn store skymodeller. De kan løse avgrensede oppgaver godt, men generell resonnering, lange dokumenter og komplekse flertrinnsoppgaver krever fremdeles sky. Minnebegrensningene på en telefon setter et tak på kontekstlengde — typisk noen få tusen tokens.
Det er heller ikke gratis å rulle ut on-device AI i en organisasjon. Modellene må velges, tilpasses og vedlikeholdes. Sikkerhetsgjennomgang av hva som kjører på ansattes enheter er nødvendig. Og brukerne trenger opplæring i hva modellen er god for og hva den ikke er.
Hva norske virksomheter bør vurdere
For de fleste norske bedrifter er on-device AI ikke noe de trenger å planlegge i dag. Men for virksomheter med felt-arbeidere, streng dataklassifisering eller oppgaver med lav latenstid er det verdt å følge med. Teknologien modnes raskt, og det å ha et bevisst forhold til hva som kan kjøres lokalt kan gi et fortrinn om ett til to år.
Et naturlig første steg er å kartlegge hvilke arbeidsoppgaver der nettavhengighet eller dataeksponering i dag er en barriere for å ta AI i bruk. De scenariene er kandidatene for on-device eksperimenter.
Vanlige spørsmål
Slik vurderer vi
Vi baserer innholdet på offisielle priser, leverandørenes egne sider og uavhengige kilder, oppdatert løpende. Vi tjener provisjon på enkelte lenker, men det påvirker ikke vurderingen.