Hjem · Nyheter · AI-modeller på mobil og edge 2026 — smarttelefonen som gjør jobben uten skyen
Nyhet

AI-modeller på mobil og edge 2026 smarttelefonen som gjør jobben uten skyen

Modeller som Phi-3, Gemma og Llama-3 finnes nå i varianter som kjører lokalt på vanlig mobilhardware. For norske virksomheter åpner det for bruk i felt, på lager og i helsevesenet — der data ikke bør sendes til skyen.

AI-modeller på mobil og edge 2026 — smarttelefonen som gjør jobben uten skyen

Kompakte AI-modeller som kjører direkte på enheten — uten å sende data til en ekstern server — er ikke lenger et laboratoriefenomen. I 2026 er det reelt mulig å kjøre brukbare språkmodeller på en moderne smarttelefon, et nettbrett eller en liten dedikert edge-enhet. Det endrer hvilke bruksscenarioer som er praktiske.

Hva som har skjedd teknisk

To parallelle utviklinger har gjort on-device AI mer aktuelt.

Den første er at modellene er blitt langt mer effektive. Microsofts Phi-serie, Googles Gemma og metas Llama-3 finnes i varianter ned mot én til tre milliarder parametere som gir god nok kvalitet for avgrensede oppgaver — klassifisering, ekstraktering, svargenerering fra strukturert kontekst — uten at man trenger et serverbygg med GPU-klynger.

Den andre er at mobilchipene har fått dedikerte nevralenheter. Apple sin Neural Engine, Qualcomm sine Hexagon NPU-er og Googles Tensor-chip i Pixel-serien er alle bygget for å kjøre matrisemultiplikasjon effektivt — nøyaktig det en språkmodell trenger. En moderne toppmodell-telefon fra 2024 eller 2025 har nok regnekraft til å kjøre en liten modell med akseptabel hastighet.

Hvilke bruksscenarioer gir mening

On-device AI er ikke et alternativ til skymodeller for alle formål. Den er best i scenarier der nettilgang ikke er garantert, der latenstid er kritisk, eller der dataene av juridiske eller sikkerhetsmessige grunner ikke bør forlate enheten.

Felt og industri: Teknikere som inspiserer utstyr i oljebransjen, på offshore-installasjoner eller i vanskelig tilgjengelig terreng, kan bruke en modell som tolker sjekklister, identifiserer avvik i bildedata eller genererer rapportutkast — uten nettilgang.

Helse og omsorg: En pleier som dokumenterer observasjoner via tale på en håndholdt enhet kan få transkripsjon og forslag til notat-struktur uten at lydopptak eller tekst sendes til en ekstern tjeneste. Det er et personvernargument i tillegg til et praktisk argument.

Lager og logistikk: Skanning, klassifisering og priotering av plukkjobber kan delvis håndteres lokalt på en enhet uten å vente på respons fra en sentral plattform.

Retail og kasse: Produktgjenkjenning og raske kundespørsmål kan besvares lokalt på kasseterminal uten avhengighet til internettforbindelsen.

Apple opplyser at Apples Neural Engine i A17 Pro-chipen kan utføre 35 billioner operasjoner per sekund. Qualcomm anslår at Snapdragon X Elite kan kjøre Llama 3-8B med opptil 20 tokens per sekund på enhet. Disse tallene er fra produsentenes tekniske dokumentasjon og er ikke uavhengig verifisert i reell norsk bruk.

Begrensninger

Modellene som kjører på enhet er vesentlig svakere enn store skymodeller. De kan løse avgrensede oppgaver godt, men generell resonnering, lange dokumenter og komplekse flertrinnsoppgaver krever fremdeles sky. Minnebegrensningene på en telefon setter et tak på kontekstlengde — typisk noen få tusen tokens.

Det er heller ikke gratis å rulle ut on-device AI i en organisasjon. Modellene må velges, tilpasses og vedlikeholdes. Sikkerhetsgjennomgang av hva som kjører på ansattes enheter er nødvendig. Og brukerne trenger opplæring i hva modellen er god for og hva den ikke er.

Hva norske virksomheter bør vurdere

For de fleste norske bedrifter er on-device AI ikke noe de trenger å planlegge i dag. Men for virksomheter med felt-arbeidere, streng dataklassifisering eller oppgaver med lav latenstid er det verdt å følge med. Teknologien modnes raskt, og det å ha et bevisst forhold til hva som kan kjøres lokalt kan gi et fortrinn om ett til to år.

Et naturlig første steg er å kartlegge hvilke arbeidsoppgaver der nettavhengighet eller dataeksponering i dag er en barriere for å ta AI i bruk. De scenariene er kandidatene for on-device eksperimenter.

Vanlige spørsmål

Slik vurderer vi

Vi baserer innholdet på offisielle priser, leverandørenes egne sider og uavhengige kilder, oppdatert løpende. Vi tjener provisjon på enkelte lenker, men det påvirker ikke vurderingen.

Ansvarlig redaktør
Ingar

Ingar er ansvarlig redaktør i altai og jobber til daglig med AI-rådgivning og digitale tjenester for norske virksomheter. altai er hans uavhengige oversikt over AI-verktøy for et norsk publikum.

← Alle nyheter