Hjem · Guider · Beste AI for datamerking 2026 — 9 verktøy for data labeling og annotering testet
Guide

Beste AI for datamerking 2026 9 verktøy for data labeling og annotering testet

Gode AI-modeller krever godt merkede data. Vi har testet ni verktøy for datamerking og annotering — med AI-assistert auto-merking — og ekte priser fra juni 2026.

Beste AI for datamerking 2026: 9 verktøy for data labeling og annotering testet

Det beste verktøyet for datamerking avhenger av om du vil gjøre jobben selv eller sette den bort. For team som vil merke data selv med AI-hjelp, er Label Studio det mest fleksible åpen kildekode-valget, mens Labelbox og SuperAnnotate leder blant de kommersielle plattformene. Trenger du noen andre til å gjøre jobben i stor skala, leverer Scale AI ferdig merkede datasett. For bilde- og videoprosjekter er Roboflow og CVAT sterkest. Her er full gjennomgang, ekte priser og en klar anbefaling.


Hva datamerking faktisk er

Datamerking – på engelsk «data labeling» eller «annotation» – er å gi rådata en fasit som en maskinlæringsmodell kan lære av. Du tegner en boks rundt hver bil i et bilde og skriver «bil», du markerer hvilke setninger i en tekst som er positive eller negative, du merker hvilket ord en lydopptak inneholder. Modellen lærer av disse eksemplene, så kvaliteten på merkingen avgjør kvaliteten på modellen. «Søppel inn, søppel ut» gjelder dobbelt i maskinlæring.

Det som har endret kategorien i 2026 er at AI nå hjelper til med selve merkingen. Auto-merking lar en grunnmodell foreslå etikettene, så et menneske bare bekrefter eller retter – ofte ti ganger raskere enn å merke alt for hånd. Aktiv læring velger ut nettopp de eksemplene modellen er mest usikker på, så du merker det som gir mest verdi først. Resultatet er at små team nå kan produsere treningsdata det før krevde en hær for å lage.

Datamerking deler seg etter datatype: bilde og video (bokser, segmentering, nøkkelpunkter), tekst (klassifisering, entiteter), lyd (transkripsjon, hendelser), og de nye RLHF-oppgavene der mennesker rangerer svar fra språkmodeller. Verktøyene nedenfor dekker ulike kombinasjoner av disse.


Slik har vi vurdert verktøyene

Vi har brukt seks dimensjoner: hvilke datatyper verktøyet støtter, kvaliteten på AI-assistert auto-merking, verktøy for kvalitetskontroll og samarbeid mellom flere merkere, om det kan selvhostes for full datakontroll, datalagring og personvern (særlig EU), og pris. Alle priser er verifisert fra offisielle priskilder i juni 2026.

To avveiinger styrer valget. Den første er gjør-det-selv kontra sett-det-bort: plattformer som Label Studio og Labelbox gir teamet ditt verktøyene til å merke selv, mens tjenester som Scale AI leverer ferdig merkede data med egne arbeidsstyrker. Den andre er selvhostet kontra sky – avgjørende når dataene er sensitive (helsebilder, personopplysninger, intern dokumentasjon), der selvhostede verktøy som CVAT og Label Studio holder alt på din egen infrastruktur.


1. Label Studio — best fleksibel og selvhostet

Hva er det?

Label Studio er det mest brukte åpen kildekode-verktøyet for datamerking, og dekker så å si alle datatyper: bilde, video, tekst, lyd, tidsserier og til og med RLHF-oppgaver. Du kan kjøre det helt på egen infrastruktur, koble på egne grunnmodeller for auto-merking, og bruke aktiv læring til å prioritere de mest verdifulle eksemplene. Den betalte Enterprise-versjonen legger til samarbeid, kvalitetskontroll og analyse.

Pris

PlanPris
Community (open source)Gratis (selvhostet)
Starter Cloudfra ca. 99 $/mnd
EnterpriseTilbud

Norsk-vurdering

Svært god for personvern. Selvhostet Label Studio lar deg holde all data i Norge eller EU, og merke norsk tekst og lyd uten at noe sendes til en ekstern tjeneste.

Anbefaling

Beste valg for team som vil merke et bredt spekter av datatyper selv, med full kontroll og uten lisenskostnad på kjernen. Fleksibiliteten er uovertruffen. Ulempen er at samarbeids- og kvalitetsfunksjonene for større team ligger bak Enterprise-versjonen.


2. Labelbox — best komplett plattform

Hva er det?

Labelbox er en moden, kommersiell datamerkingsplattform for hele løpet: merking, kvalitetskontroll, modell-evaluering og arbeidsstyringsflyt. Den har sterk AI-assistert auto-merking, innebygde verktøy for å måle og forbedre merkekvalitet, og en markedsplass for å koble på merke-tjenester når du trenger ekstra hender. Den dekker bilde, video, tekst og LLM-data.

Pris

PlanPris
FreeGratis nivå (begrenset volum)
Starterfra ca. 0,10 $/merket enhet
EnterpriseTilbud

Norsk-vurdering

God. Labelbox tilbyr enterprise-avtaler med datalokasjon i EU og brukes av flere AI-team i Norden.

Anbefaling

Beste valg for organisasjoner som vil ha en gjennomarbeidet plattform med kvalitetskontroll og evaluering innebygd, ikke bare et merkeverktøy. Helheten er styrken. Ulempen er prisen ved store volumer og at full verdi forutsetter at du tar i bruk hele plattformen.


3. Scale AI — best for å sette bort jobben

Hva er det?

Scale AI er den ledende tjenesten for å levere ferdig merkede data i stor skala. I stedet for at teamet ditt merker selv, sender du dataene til Scale, som kombinerer egen arbeidsstyrke med AI for å returnere kvalitetssikret merking. De er kjent for store, kompliserte prosjekter innen selvkjørende biler, robotikk og RLHF for de store språkmodellene.

Pris

Tilbudsbasert, prising per merket enhet etter kompleksitet og volum. Selvbetjent Scale Rapid finnes for mindre prosjekter. Sjekk scale.com for gjeldende pris.

Norsk-vurdering

OK. Scale er en global tjeneste der data hovedsakelig prosesseres utenfor EU, så GDPR-vurdering kreves for sensitive norske data.

Anbefaling

Beste valg når du har store volumer å merke og ikke vil bygge en egen merke-operasjon. Skala og kvalitet er styrken. Ulempen er at du gir dataene til en tredjepart, og at det er den dyreste tilnærmingen for små prosjekter sammenlignet med å merke selv.


4. SuperAnnotate — best for ende-til-ende kvalitet

Hva er det?

SuperAnnotate kombinerer et kraftig merkeverktøy med arbeidsstyring, kvalitetskontroll og en markedsplass for merke-tjenester. Den dekker bilde, video, tekst, lyd og LLM-data, har sterk auto-merking, og legger vekt på en stram kvalitetsprosess der hver merking kan gjennomgås og godkjennes i flere ledd.

Pris

PlanPris
StarterGratis nivå
ProTilbudsbasert
EnterpriseTilbud

Norsk-vurdering

God. SuperAnnotate tilbyr enterprise-datalokasjon og selvhostingsalternativer for sensitive data.

Anbefaling

Beste valg for team som setter kvalitet og kontrollert arbeidsflyt høyest – der hver etikett må gjennom flere godkjenningsledd. Kvalitetsverktøyene er sterke. Ulempen er at plattformen kan føles tung for enkle, små merkeprosjekter.


5. Roboflow — best for datasyn (computer vision)

Hva er det?

Roboflow er bygget spesifikt for datasyn – bilde og video. Den dekker hele løpet fra merking via auto-merking og datasettforvaltning til trening og utrulling av modeller. Auto Label bruker grunnmodeller til å merke bildene dine automatisk, og plattformen er populær fordi den gjør det raskt å gå fra rå bilder til en kjørende modell.

Pris

PlanPris
Public (gratis)Gratis for offentlige prosjekter
Starterfra 249 $/mnd
EnterpriseTilbud

Norsk-vurdering

OK. Roboflow er en skytjeneste; for sensitive bilder bør datalokasjon avklares. Enterprise-avtaler gir mer kontroll.

Anbefaling

Beste valg for team som jobber med bilde- og videomodeller og vil ha merking, datasett og trening i én strøm. Auto Label sparer enormt med tid på datasyn. Ulempen er at den er smal – ren computer vision, ikke tekst eller lyd – og at gratis-nivået gjør prosjektene offentlige.


6. CVAT — best gratis for datasyn

Hva er det?

CVAT (Computer Vision Annotation Tool) er det ledende åpen kildekode-verktøyet for bilde- og videomerking, opprinnelig laget av Intel. Det dekker bokser, polygoner, segmentering, nøkkelpunkter og sporing av objekter gjennom video, har AI-assistert auto-merking, og kan kjøres helt på egen server uten kostnad.

Pris

PlanPris
Self-hosted (open source)Gratis
CVAT Online FreeGratis nivå
CVAT Online Profra 33 $/mnd

Norsk-vurdering

Svært god for personvern via selvhosting. CVAT lar deg merke sensitive bilder og video på egen infrastruktur, der dataene aldri forlater maskinen.

Anbefaling

Beste valg for datasyn-prosjekter der du vil ha et kraftig, gratis verktøy med full datakontroll. Video-sporingen er spesielt sterk. Ulempen er at grensesnittet er mer teknisk enn Roboflows, og at du selv står for drift ved selvhosting.


7. Prodigy — best for tekst og NLP

Hva er det?

Prodigy fra spaCy-skaperne Explosion er et scriptbart merkeverktøy bygget for aktiv læring og tekst. Det er laget for at en utvikler eller forsker skal merke effektivt selv, der modellen i sløyfen foreslår etiketter og lærer mens du merker. Det kjøper du som en engangslisens og kjører helt lokalt.

Pris

LisensPris
Personal390 $ engang
Company490 $ engang per bruker
EnterpriseTilbud

Norsk-vurdering

Svært god for personvern – Prodigy kjører lokalt, og du kan merke norsk tekst uten å sende noe til skyen. Spiller godt sammen med norske spaCy- og NB-modeller.

Anbefaling

Beste valg for utviklere og NLP-forskere som vil merke tekst effektivt med aktiv læring, eie verktøyet med en engangslisens, og holde alt lokalt. Ulempen er at det er scriptbasert og rettet mot teknikere – ikke en visuell plattform for store merke-team.


8. Amazon SageMaker Ground Truth — best for AWS-brukere

Hva er det?

Ground Truth er Amazons datamerkingstjeneste, integrert i SageMaker. Den dekker bilde, tekst og video, tilbyr automatisk merking som reduserer manuell innsats, og lar deg velge mellom å bruke ditt eget team, en tredjeparts leverandør eller Amazons Mechanical Turk-arbeidsstyrke. Alt kobler rett inn i resten av AWS-ML-stacken.

Pris

KomponentPris
Merking (per objekt)fra 0,08 $/objekt
Automatisk merkingrabatt på automatisk merkede objekter

Pluss arbeidsstyrke-kostnad hvis du bruker Amazons arbeidere.

Norsk-vurdering

God for AWS-brukere. Tjenesten kan kjøres i EU-regioner (inkludert eu-north-1 i Stockholm), som holder data i Europa.

Anbefaling

Beste valg for team som allerede bygger på AWS og vil ha merking integrert med trening og utrulling. Den automatiske merkingen kutter kostnad på store datasett. Ulempen er at det er låst til AWS-økosystemet og krever litt oppsett.


9. doccano — gratis-alternativet (åpen kildekode)

Hva er det?

doccano er et lett, gratis åpen kildekode-verktøy fokusert på tekstmerking – klassifisering, navngitte entiteter, sekvensmerking og oversettelse. Det er enkelt å sette opp, har et rent grensesnitt for samarbeid mellom flere merkere, og kjører på din egen server.

Pris

AlternativPris
doccanoGratis (åpen kildekode, MIT)

Norsk-vurdering

Svært god for personvern. Selvhostet doccano lar deg merke norsk tekst på egen infrastruktur uten kostnad.

Anbefaling

Beste valg for team og forskere som trenger enkel, gratis tekstmerking uten avansert auto-merking eller mange datatyper. Lett å komme i gang med. Ulempen er at det mangler den AI-assisterte auto-merkingen og kvalitetsverktøyene de kommersielle plattformene har.


Sammenligningstabell

VerktøyDatatyperSelvhostetGratis nivåStartprisEU-dataBeste for
Label StudioAlleJaJa (open source)Gratis / 99 $/mndJaFleksibel selvhosting
LabelboxBilde, video, tekst, LLMDelvisJa0,10 $/enhetJaKomplett plattform
Scale AIAlle (tjeneste)NeiDemoTilbudNei (US)Sette bort jobben
SuperAnnotateAlleDelvisJaTilbudJaEnde-til-ende kvalitet
RoboflowBilde, videoNeiJa (offentlig)249 $/mndDelvisDatasyn
CVATBilde, videoJaJaGratis / 33 $/mndJaGratis datasyn
ProdigyTekst, NLPJaNei390 $ engangJaTekst og aktiv læring
SageMaker Ground TruthBilde, tekst, videoNeiBetal-per-bruk0,08 $/objektJa (eu-north-1)AWS-brukere
doccanoTekstJaGratisGratisJaEnkel gratis tekstmerking

Hvilket verktøy bør du velge?

Merke selv, alle datatyper: Label Studio for fleksibilitet og selvhosting gratis, Labelbox eller SuperAnnotate for en komplett kommersiell plattform med kvalitetskontroll.

Sette bort jobben i stor skala: Scale AI, som leverer kvalitetssikret merking med egen arbeidsstyrke.

Bilde og video (datasyn): Roboflow for hele løpet til en kjørende modell, CVAT hvis du vil ha det gratis og selvhostet.

Tekst og NLP: Prodigy for utviklere som vil ha aktiv læring og engangslisens, doccano for enkel gratis tekstmerking.

Allerede på AWS: SageMaker Ground Truth, integrert med trening og utrulling.

Maksimalt personvern: Selvhostet Label Studio, CVAT, Prodigy eller doccano – alle holder dataene på din egen infrastruktur.


Nøkkelstatistikk

Datamerking er den ufeirede halvparten av maskinlæring: modellen får all æren, men merkingen avgjorde utfallet. AI har snudd kategorien på hodet ved å la modeller hjelpe til med å merke dataene som trener neste modell. Det riktige valget for norske team handler om hvor mye du vil merke selv – og om de sensitive dataene dine får bli på din egen server.

Kilder


Ofte stilte spørsmål (FAQ)

Hva er det beste verktøyet for datamerking? Det avhenger av behovet. Label Studio er best for fleksibel selvhosting, Labelbox for en komplett plattform, Scale AI for å sette bort jobben, og Roboflow eller CVAT for bilde og video. For ren tekst er Prodigy eller doccano gode valg. Mange velger ut fra datatype og om dataene er sensitive.

Hva betyr auto-merking, og kan jeg stole på den? Auto-merking betyr at en AI-modell foreslår etikettene, og et menneske bekrefter eller retter. Den sparer mye tid, men bør alltid kvalitetssikres av en person – særlig på kritiske eller kompliserte data – fordi modellen arver sine egne feil hvis ingen kontrollerer den.

Kan jeg merke norske data uten å sende dem til skyen? Ja. Selvhostede verktøy som Label Studio, CVAT, Prodigy og doccano kjører på din egen infrastruktur, så norsk tekst, lyd og bilder forlater aldri maskinen. Det er den tryggeste tilnærmingen for sensitive data under GDPR.

Finnes det gratis verktøy for datamerking? Ja. Label Studio (Community), CVAT, doccano og SageMaker Ground Truths gratis prøvebruk er alle tilgjengelige uten lisenskostnad. De selvhostede er helt gratis, men krever at du selv står for drift og oppsett.

Bør jeg merke selv eller sette bort jobben? Merk selv hvis du har et lite til middels datasett, sensitive data, eller domenekunnskap som er vanskelig å overføre. Sett bort til en tjeneste som Scale AI hvis volumet er stort, oppgaven er standardisert, og du ikke vil bygge en egen merke-operasjon. Mange kombinerer ved å merke det vanskeligste selv.

Hvorfor er datamerking så viktig for AI-modeller? Fordi en modell bare blir så god som dataene den lærer av. Feilaktige eller inkonsistente etiketter gir en modell som tar feil på samme måte. God merking – riktig, konsistent og dekkende – er ofte det som skiller en modell som fungerer fra en som ikke gjør det.

Slik vurderer vi

Vi baserer innholdet på offisielle priser, leverandørenes egne sider og uavhengige kilder, oppdatert løpende. Vi tjener provisjon på enkelte lenker, men det påvirker ikke vurderingen.

Ansvarlig redaktør
Ingar

Ingar er ansvarlig redaktør i altai og jobber til daglig med AI-rådgivning og digitale tjenester for norske virksomheter. altai er hans uavhengige oversikt over AI-verktøy for et norsk publikum.

← Alle guider