Nasjonalbiblioteket og AI 2026 norsk språk skal inn i maskinene
Når 90 prosent av alle norske bøker er digitalisert, blir Nasjonalbiblioteket en ressurs for å trene språkmodeller på ekte norsk — ikke oversatt engelsk.
Nasjonalbiblioteket og AI 2026 — norsk språk skal inn i maskinene
Nasjonalbiblioteket satser tungt på kunstig intelligens og generative språkmodeller i 2026. Med rundt 90 prosent av alle bøker og 80 prosent av alle avisutgaver i Norge digitalisert, er biblioteket en av landets viktigste kilder til norsk tekst. Målet er at norsk språk og norsk kunnskap blir en del av framtidens AI, i stedet for at modellene bare lærer norsk gjennom oversatt engelsk.
En digitalisert kulturarv som treningsdata
Nasjonalbiblioteket har i mange år systematisk digitalisert hele samlingen sin, samt dokumentarven til norske museer, biblioteker og arkiver. Resultatet er enormt: rundt 90 prosent av alle bøker og om lag 80 prosent av alle avisutgaver som noensinne er utgitt i Norge, finnes nå i digital form.
Dette materialet er gull for språkmodeller. En modell som skal forstå og skrive god norsk, trenger store mengder ekte, variert norsk tekst — ikke bare maskinoversatt innhold. Nasjonalbibliotekets samling dekker bredt, fra skjønnlitteratur og fagbøker til lokalaviser gjennom over hundre år, og fanger dermed nyanser, dialektnære uttrykk og fagspråk som internasjonale modeller ofte bommer på.
Statlig satsing og generative modeller
Det offentlige har varslet økt satsing på AI ved Nasjonalbiblioteket. Blant tiltakene er forslag om ytterligere 20 millioner kroner til arbeidet med kunstig intelligens og trening av generative språkmodeller. Begrunnelsen er språkpolitisk like mye som teknologisk: norsk språk og norsk kunnskap skal bli en del av virkeligheten etter hvert som AI tas i bruk i hele samfunnet.
Biblioteket har også lansert egne AI-tjenester i Nettbiblioteket, som gjør den digitaliserte samlingen lettere å søke i og bruke. For forskere, journalister og slektsgranskere betyr det at AI blir et verktøy for å finne fram i et materiale som tidligere var tungt å navigere.
AI4LAM og samarbeid i kultursektoren
Nasjonalbiblioteket har fått det administrative ansvaret for AI4LAM — et internasjonalt nettverk for kunstig intelligens i biblioteker, arkiver og museer — for en periode på tre år. I sektoren er det allerede gjort mye testing rundt katalogisering, produksjon av metadata og chatboter.
Dette plasserer Norge sentralt i en internasjonal diskusjon om hvordan kulturarvinstitusjoner skal bruke AI ansvarlig. Det handler om praktiske oppgaver som å automatisere katalogisering og gjøre samlinger søkbare, men også om de prinsipielle spørsmålene rundt opphavsrett og bruk av vernet materiale.
«Nasjonalbibliotekets arbeid med generative språkmodeller skal sikre at norsk språk og norsk kunnskap blir en del av virkeligheten etter hvert som kunstig intelligens tas mer i bruk i hele samfunnet.» — kilde: pressemelding fra Nasjonalbiblioteket om satsing på AI og digitalisering
Opphavsrett er det vanskelige spørsmålet
Den store samlingen reiser et krevende spørsmål: mye av materialet er vernet av opphavsrett. Å digitalisere for bevaring er én ting, men å bruke vernede tekster til å trene generative modeller er noe annet, og berører rettighetene til forfattere og forlag.
Dette er den samme debatten som pågår internasjonalt om AI-trening på opphavsrettsbeskyttet innhold, men Nasjonalbiblioteket står i en særstilling fordi det forvalter en så stor del av den norske kulturarven på vegne av fellesskapet. Hvordan balansen mellom språkpolitiske mål og rettighetshavernes interesser løses, vil ha betydning langt utover bibliotekets egne vegger.
Hva det betyr for norsk AI
For norske brukere kan dette på sikt bety AI-verktøy som faktisk forstår norsk skikkelig — inkludert nynorsk, eldre språk og fagterminologi — fordi de er trent på ekte norsk kildemateriale. Det er et viktig mottrekk mot at norsk reduseres til et oversettelseslag oppå engelskspråklige modeller.
For aktører som følger feltet, er det verdt å merke seg at:
- Nasjonalbiblioteket blir en nøkkelressurs for norskspråklige modeller og datasett
- Statlig finansiering signaliserer at norsk språk i AI er blitt et politisk mål
- AI4LAM-ansvaret gir Norge en posisjon i internasjonal kultursektor-AI
- Opphavsrett til vernet materiale er den uavklarte og avgjørende flaskehalsen
Slik vurderer vi
Vi baserer innholdet på offisielle priser, leverandørenes egne sider og uavhengige kilder, oppdatert løpende. Vi tjener provisjon på enkelte lenker, men det påvirker ikke vurderingen.