Beste AI for datamerking 2026 9 verktøy for data labeling og annotering testet
Gode AI-modeller krever godt merkede data. Vi har testet ni verktøy for datamerking og annotering — med AI-assistert auto-merking — og ekte priser fra juni 2026.
Beste AI for datamerking 2026: 9 verktøy for data labeling og annotering testet
Det beste verktøyet for datamerking avhenger av om du vil gjøre jobben selv eller sette den bort. For team som vil merke data selv med AI-hjelp, er Label Studio det mest fleksible åpen kildekode-valget, mens Labelbox og SuperAnnotate leder blant de kommersielle plattformene. Trenger du noen andre til å gjøre jobben i stor skala, leverer Scale AI ferdig merkede datasett. For bilde- og videoprosjekter er Roboflow og CVAT sterkest. Her er full gjennomgang, ekte priser og en klar anbefaling.
Hva datamerking faktisk er
Datamerking – på engelsk «data labeling» eller «annotation» – er å gi rådata en fasit som en maskinlæringsmodell kan lære av. Du tegner en boks rundt hver bil i et bilde og skriver «bil», du markerer hvilke setninger i en tekst som er positive eller negative, du merker hvilket ord en lydopptak inneholder. Modellen lærer av disse eksemplene, så kvaliteten på merkingen avgjør kvaliteten på modellen. «Søppel inn, søppel ut» gjelder dobbelt i maskinlæring.
Det som har endret kategorien i 2026 er at AI nå hjelper til med selve merkingen. Auto-merking lar en grunnmodell foreslå etikettene, så et menneske bare bekrefter eller retter – ofte ti ganger raskere enn å merke alt for hånd. Aktiv læring velger ut nettopp de eksemplene modellen er mest usikker på, så du merker det som gir mest verdi først. Resultatet er at små team nå kan produsere treningsdata det før krevde en hær for å lage.
Datamerking deler seg etter datatype: bilde og video (bokser, segmentering, nøkkelpunkter), tekst (klassifisering, entiteter), lyd (transkripsjon, hendelser), og de nye RLHF-oppgavene der mennesker rangerer svar fra språkmodeller. Verktøyene nedenfor dekker ulike kombinasjoner av disse.
Slik har vi vurdert verktøyene
Vi har brukt seks dimensjoner: hvilke datatyper verktøyet støtter, kvaliteten på AI-assistert auto-merking, verktøy for kvalitetskontroll og samarbeid mellom flere merkere, om det kan selvhostes for full datakontroll, datalagring og personvern (særlig EU), og pris. Alle priser er verifisert fra offisielle priskilder i juni 2026.
To avveiinger styrer valget. Den første er gjør-det-selv kontra sett-det-bort: plattformer som Label Studio og Labelbox gir teamet ditt verktøyene til å merke selv, mens tjenester som Scale AI leverer ferdig merkede data med egne arbeidsstyrker. Den andre er selvhostet kontra sky – avgjørende når dataene er sensitive (helsebilder, personopplysninger, intern dokumentasjon), der selvhostede verktøy som CVAT og Label Studio holder alt på din egen infrastruktur.
1. Label Studio — best fleksibel og selvhostet
Hva er det?
Label Studio er det mest brukte åpen kildekode-verktøyet for datamerking, og dekker så å si alle datatyper: bilde, video, tekst, lyd, tidsserier og til og med RLHF-oppgaver. Du kan kjøre det helt på egen infrastruktur, koble på egne grunnmodeller for auto-merking, og bruke aktiv læring til å prioritere de mest verdifulle eksemplene. Den betalte Enterprise-versjonen legger til samarbeid, kvalitetskontroll og analyse.
Pris
| Plan | Pris |
|---|---|
| Community (open source) | Gratis (selvhostet) |
| Starter Cloud | fra ca. 99 $/mnd |
| Enterprise | Tilbud |
Norsk-vurdering
Svært god for personvern. Selvhostet Label Studio lar deg holde all data i Norge eller EU, og merke norsk tekst og lyd uten at noe sendes til en ekstern tjeneste.
Anbefaling
Beste valg for team som vil merke et bredt spekter av datatyper selv, med full kontroll og uten lisenskostnad på kjernen. Fleksibiliteten er uovertruffen. Ulempen er at samarbeids- og kvalitetsfunksjonene for større team ligger bak Enterprise-versjonen.
2. Labelbox — best komplett plattform
Hva er det?
Labelbox er en moden, kommersiell datamerkingsplattform for hele løpet: merking, kvalitetskontroll, modell-evaluering og arbeidsstyringsflyt. Den har sterk AI-assistert auto-merking, innebygde verktøy for å måle og forbedre merkekvalitet, og en markedsplass for å koble på merke-tjenester når du trenger ekstra hender. Den dekker bilde, video, tekst og LLM-data.
Pris
| Plan | Pris |
|---|---|
| Free | Gratis nivå (begrenset volum) |
| Starter | fra ca. 0,10 $/merket enhet |
| Enterprise | Tilbud |
Norsk-vurdering
God. Labelbox tilbyr enterprise-avtaler med datalokasjon i EU og brukes av flere AI-team i Norden.
Anbefaling
Beste valg for organisasjoner som vil ha en gjennomarbeidet plattform med kvalitetskontroll og evaluering innebygd, ikke bare et merkeverktøy. Helheten er styrken. Ulempen er prisen ved store volumer og at full verdi forutsetter at du tar i bruk hele plattformen.
3. Scale AI — best for å sette bort jobben
Hva er det?
Scale AI er den ledende tjenesten for å levere ferdig merkede data i stor skala. I stedet for at teamet ditt merker selv, sender du dataene til Scale, som kombinerer egen arbeidsstyrke med AI for å returnere kvalitetssikret merking. De er kjent for store, kompliserte prosjekter innen selvkjørende biler, robotikk og RLHF for de store språkmodellene.
Pris
Tilbudsbasert, prising per merket enhet etter kompleksitet og volum. Selvbetjent Scale Rapid finnes for mindre prosjekter. Sjekk scale.com for gjeldende pris.
Norsk-vurdering
OK. Scale er en global tjeneste der data hovedsakelig prosesseres utenfor EU, så GDPR-vurdering kreves for sensitive norske data.
Anbefaling
Beste valg når du har store volumer å merke og ikke vil bygge en egen merke-operasjon. Skala og kvalitet er styrken. Ulempen er at du gir dataene til en tredjepart, og at det er den dyreste tilnærmingen for små prosjekter sammenlignet med å merke selv.
4. SuperAnnotate — best for ende-til-ende kvalitet
Hva er det?
SuperAnnotate kombinerer et kraftig merkeverktøy med arbeidsstyring, kvalitetskontroll og en markedsplass for merke-tjenester. Den dekker bilde, video, tekst, lyd og LLM-data, har sterk auto-merking, og legger vekt på en stram kvalitetsprosess der hver merking kan gjennomgås og godkjennes i flere ledd.
Pris
| Plan | Pris |
|---|---|
| Starter | Gratis nivå |
| Pro | Tilbudsbasert |
| Enterprise | Tilbud |
Norsk-vurdering
God. SuperAnnotate tilbyr enterprise-datalokasjon og selvhostingsalternativer for sensitive data.
Anbefaling
Beste valg for team som setter kvalitet og kontrollert arbeidsflyt høyest – der hver etikett må gjennom flere godkjenningsledd. Kvalitetsverktøyene er sterke. Ulempen er at plattformen kan føles tung for enkle, små merkeprosjekter.
5. Roboflow — best for datasyn (computer vision)
Hva er det?
Roboflow er bygget spesifikt for datasyn – bilde og video. Den dekker hele løpet fra merking via auto-merking og datasettforvaltning til trening og utrulling av modeller. Auto Label bruker grunnmodeller til å merke bildene dine automatisk, og plattformen er populær fordi den gjør det raskt å gå fra rå bilder til en kjørende modell.
Pris
| Plan | Pris |
|---|---|
| Public (gratis) | Gratis for offentlige prosjekter |
| Starter | fra 249 $/mnd |
| Enterprise | Tilbud |
Norsk-vurdering
OK. Roboflow er en skytjeneste; for sensitive bilder bør datalokasjon avklares. Enterprise-avtaler gir mer kontroll.
Anbefaling
Beste valg for team som jobber med bilde- og videomodeller og vil ha merking, datasett og trening i én strøm. Auto Label sparer enormt med tid på datasyn. Ulempen er at den er smal – ren computer vision, ikke tekst eller lyd – og at gratis-nivået gjør prosjektene offentlige.
6. CVAT — best gratis for datasyn
Hva er det?
CVAT (Computer Vision Annotation Tool) er det ledende åpen kildekode-verktøyet for bilde- og videomerking, opprinnelig laget av Intel. Det dekker bokser, polygoner, segmentering, nøkkelpunkter og sporing av objekter gjennom video, har AI-assistert auto-merking, og kan kjøres helt på egen server uten kostnad.
Pris
| Plan | Pris |
|---|---|
| Self-hosted (open source) | Gratis |
| CVAT Online Free | Gratis nivå |
| CVAT Online Pro | fra 33 $/mnd |
Norsk-vurdering
Svært god for personvern via selvhosting. CVAT lar deg merke sensitive bilder og video på egen infrastruktur, der dataene aldri forlater maskinen.
Anbefaling
Beste valg for datasyn-prosjekter der du vil ha et kraftig, gratis verktøy med full datakontroll. Video-sporingen er spesielt sterk. Ulempen er at grensesnittet er mer teknisk enn Roboflows, og at du selv står for drift ved selvhosting.
7. Prodigy — best for tekst og NLP
Hva er det?
Prodigy fra spaCy-skaperne Explosion er et scriptbart merkeverktøy bygget for aktiv læring og tekst. Det er laget for at en utvikler eller forsker skal merke effektivt selv, der modellen i sløyfen foreslår etiketter og lærer mens du merker. Det kjøper du som en engangslisens og kjører helt lokalt.
Pris
| Lisens | Pris |
|---|---|
| Personal | 390 $ engang |
| Company | 490 $ engang per bruker |
| Enterprise | Tilbud |
Norsk-vurdering
Svært god for personvern – Prodigy kjører lokalt, og du kan merke norsk tekst uten å sende noe til skyen. Spiller godt sammen med norske spaCy- og NB-modeller.
Anbefaling
Beste valg for utviklere og NLP-forskere som vil merke tekst effektivt med aktiv læring, eie verktøyet med en engangslisens, og holde alt lokalt. Ulempen er at det er scriptbasert og rettet mot teknikere – ikke en visuell plattform for store merke-team.
8. Amazon SageMaker Ground Truth — best for AWS-brukere
Hva er det?
Ground Truth er Amazons datamerkingstjeneste, integrert i SageMaker. Den dekker bilde, tekst og video, tilbyr automatisk merking som reduserer manuell innsats, og lar deg velge mellom å bruke ditt eget team, en tredjeparts leverandør eller Amazons Mechanical Turk-arbeidsstyrke. Alt kobler rett inn i resten av AWS-ML-stacken.
Pris
| Komponent | Pris |
|---|---|
| Merking (per objekt) | fra 0,08 $/objekt |
| Automatisk merking | rabatt på automatisk merkede objekter |
Pluss arbeidsstyrke-kostnad hvis du bruker Amazons arbeidere.
Norsk-vurdering
God for AWS-brukere. Tjenesten kan kjøres i EU-regioner (inkludert eu-north-1 i Stockholm), som holder data i Europa.
Anbefaling
Beste valg for team som allerede bygger på AWS og vil ha merking integrert med trening og utrulling. Den automatiske merkingen kutter kostnad på store datasett. Ulempen er at det er låst til AWS-økosystemet og krever litt oppsett.
9. doccano — gratis-alternativet (åpen kildekode)
Hva er det?
doccano er et lett, gratis åpen kildekode-verktøy fokusert på tekstmerking – klassifisering, navngitte entiteter, sekvensmerking og oversettelse. Det er enkelt å sette opp, har et rent grensesnitt for samarbeid mellom flere merkere, og kjører på din egen server.
Pris
| Alternativ | Pris |
|---|---|
| doccano | Gratis (åpen kildekode, MIT) |
Norsk-vurdering
Svært god for personvern. Selvhostet doccano lar deg merke norsk tekst på egen infrastruktur uten kostnad.
Anbefaling
Beste valg for team og forskere som trenger enkel, gratis tekstmerking uten avansert auto-merking eller mange datatyper. Lett å komme i gang med. Ulempen er at det mangler den AI-assisterte auto-merkingen og kvalitetsverktøyene de kommersielle plattformene har.
Sammenligningstabell
| Verktøy | Datatyper | Selvhostet | Gratis nivå | Startpris | EU-data | Beste for |
|---|---|---|---|---|---|---|
| Label Studio | Alle | Ja | Ja (open source) | Gratis / 99 $/mnd | Ja | Fleksibel selvhosting |
| Labelbox | Bilde, video, tekst, LLM | Delvis | Ja | 0,10 $/enhet | Ja | Komplett plattform |
| Scale AI | Alle (tjeneste) | Nei | Demo | Tilbud | Nei (US) | Sette bort jobben |
| SuperAnnotate | Alle | Delvis | Ja | Tilbud | Ja | Ende-til-ende kvalitet |
| Roboflow | Bilde, video | Nei | Ja (offentlig) | 249 $/mnd | Delvis | Datasyn |
| CVAT | Bilde, video | Ja | Ja | Gratis / 33 $/mnd | Ja | Gratis datasyn |
| Prodigy | Tekst, NLP | Ja | Nei | 390 $ engang | Ja | Tekst og aktiv læring |
| SageMaker Ground Truth | Bilde, tekst, video | Nei | Betal-per-bruk | 0,08 $/objekt | Ja (eu-north-1) | AWS-brukere |
| doccano | Tekst | Ja | Gratis | Gratis | Ja | Enkel gratis tekstmerking |
Hvilket verktøy bør du velge?
Merke selv, alle datatyper: Label Studio for fleksibilitet og selvhosting gratis, Labelbox eller SuperAnnotate for en komplett kommersiell plattform med kvalitetskontroll.
Sette bort jobben i stor skala: Scale AI, som leverer kvalitetssikret merking med egen arbeidsstyrke.
Bilde og video (datasyn): Roboflow for hele løpet til en kjørende modell, CVAT hvis du vil ha det gratis og selvhostet.
Tekst og NLP: Prodigy for utviklere som vil ha aktiv læring og engangslisens, doccano for enkel gratis tekstmerking.
Allerede på AWS: SageMaker Ground Truth, integrert med trening og utrulling.
Maksimalt personvern: Selvhostet Label Studio, CVAT, Prodigy eller doccano – alle holder dataene på din egen infrastruktur.
Nøkkelstatistikk
- Det globale markedet for datamerking passerte 3 milliarder dollar i 2025 og forventes å vokse kraftig drevet av etterspørselen etter treningsdata til AI (Grand View Research)
- AI-assistert auto-merking kan kutte tiden per etikett med opptil 70–90 % sammenlignet med ren manuell merking, ifølge flere leverandørers målinger (Labelbox)
- Datavitere bruker anslagsvis rundt 80 % av tiden på å samle inn, rense og merke data – ikke på selve modellbyggingen (bransjeestimat, gjentatt i flere studier)
Datamerking er den ufeirede halvparten av maskinlæring: modellen får all æren, men merkingen avgjorde utfallet. AI har snudd kategorien på hodet ved å la modeller hjelpe til med å merke dataene som trener neste modell. Det riktige valget for norske team handler om hvor mye du vil merke selv – og om de sensitive dataene dine får bli på din egen server.
Kilder
- Label Studio — offisiell side
- Labelbox — Prising
- Scale AI — offisiell side
- SuperAnnotate — offisiell side
- Roboflow — Prising
- CVAT — offisiell side
- Prodigy — Prising
- Amazon SageMaker Ground Truth — prising
- doccano — GitHub
Ofte stilte spørsmål (FAQ)
Hva er det beste verktøyet for datamerking? Det avhenger av behovet. Label Studio er best for fleksibel selvhosting, Labelbox for en komplett plattform, Scale AI for å sette bort jobben, og Roboflow eller CVAT for bilde og video. For ren tekst er Prodigy eller doccano gode valg. Mange velger ut fra datatype og om dataene er sensitive.
Hva betyr auto-merking, og kan jeg stole på den? Auto-merking betyr at en AI-modell foreslår etikettene, og et menneske bekrefter eller retter. Den sparer mye tid, men bør alltid kvalitetssikres av en person – særlig på kritiske eller kompliserte data – fordi modellen arver sine egne feil hvis ingen kontrollerer den.
Kan jeg merke norske data uten å sende dem til skyen? Ja. Selvhostede verktøy som Label Studio, CVAT, Prodigy og doccano kjører på din egen infrastruktur, så norsk tekst, lyd og bilder forlater aldri maskinen. Det er den tryggeste tilnærmingen for sensitive data under GDPR.
Finnes det gratis verktøy for datamerking? Ja. Label Studio (Community), CVAT, doccano og SageMaker Ground Truths gratis prøvebruk er alle tilgjengelige uten lisenskostnad. De selvhostede er helt gratis, men krever at du selv står for drift og oppsett.
Bør jeg merke selv eller sette bort jobben? Merk selv hvis du har et lite til middels datasett, sensitive data, eller domenekunnskap som er vanskelig å overføre. Sett bort til en tjeneste som Scale AI hvis volumet er stort, oppgaven er standardisert, og du ikke vil bygge en egen merke-operasjon. Mange kombinerer ved å merke det vanskeligste selv.
Hvorfor er datamerking så viktig for AI-modeller? Fordi en modell bare blir så god som dataene den lærer av. Feilaktige eller inkonsistente etiketter gir en modell som tar feil på samme måte. God merking – riktig, konsistent og dekkende – er ofte det som skiller en modell som fungerer fra en som ikke gjør det.
Slik vurderer vi
Vi baserer innholdet på offisielle priser, leverandørenes egne sider og uavhengige kilder, oppdatert løpende. Vi tjener provisjon på enkelte lenker, men det påvirker ikke vurderingen.