Hvorfor satser Nasjonalbiblioteket på AI?

Målet er at norsk språk og norsk kunnskap skal bli en del av framtidens AI, ikke bare lært gjennom oversatt engelsk. Med rundt 90 prosent av norske bøker digitalisert er biblioteket en unik kilde til ekte norsk tekst for å trene generative språkmodeller.

Hva er utfordringen med opphavsrett?

Mye av materialet i samlingen er vernet av opphavsrett. Å bruke vernede tekster til å trene generative modeller berører rettighetene til forfattere og forlag, og er den samme debatten som pågår internasjonalt. Hvordan balansen løses, er den uavklarte flaskehalsen for satsingen.

Nasjonalbiblioteket og AI 2026 — norsk språk skal inn i maskinene

Q: Hvor mye av norsk litteratur er digitalisert?

Nasjonalbiblioteket har digitalisert rundt 90 prosent av alle bøker og om lag 80 prosent av alle avisutgaver som noensinne er utgitt i Norge. Dette materialet utgjør et stort og variert grunnlag for å trene språkmodeller på ekte norsk.

Q: Hva er AI4LAM?

AI4LAM er et internasjonalt nettverk for kunstig intelligens i biblioteker, arkiver og museer. Nasjonalbiblioteket har fått det administrative ansvaret for nettverket i tre år, og plasserer Norge sentralt i diskusjonen om ansvarlig bruk av AI i kultursektoren.

Nasjonalbiblioteket og AI 2026 — norsk språk skal inn i maskinene

Nasjonalbiblioteket satser tungt på kunstig intelligens og generative språkmodeller i 2026. Med rundt 90 prosent av alle bøker og 80 prosent av alle avisutgaver i Norge digitalisert, er biblioteket en av landets viktigste kilder til norsk tekst. Målet er at norsk språk og norsk kunnskap blir en del av framtidens AI, i stedet for at modellene bare lærer norsk gjennom oversatt engelsk.

En digitalisert kulturarv som treningsdata

Nasjonalbiblioteket har i mange år systematisk digitalisert hele samlingen sin, samt dokumentarven til norske museer, biblioteker og arkiver. Resultatet er enormt: rundt 90 prosent av alle bøker og om lag 80 prosent av alle avisutgaver som noensinne er utgitt i Norge, finnes nå i digital form.

Dette materialet er gull for språkmodeller. En modell som skal forstå og skrive god norsk, trenger store mengder ekte, variert norsk tekst — ikke bare maskinoversatt innhold. Nasjonalbibliotekets samling dekker bredt, fra skjønnlitteratur og fagbøker til lokalaviser gjennom over hundre år, og fanger dermed nyanser, dialektnære uttrykk og fagspråk som internasjonale modeller ofte bommer på.

Statlig satsing og generative modeller

Det offentlige har varslet økt satsing på AI ved Nasjonalbiblioteket. Blant tiltakene er forslag om ytterligere 20 millioner kroner til arbeidet med kunstig intelligens og trening av generative språkmodeller. Begrunnelsen er språkpolitisk like mye som teknologisk: norsk språk og norsk kunnskap skal bli en del av virkeligheten etter hvert som AI tas i bruk i hele samfunnet.

Biblioteket har også lansert egne AI-tjenester i Nettbiblioteket, som gjør den digitaliserte samlingen lettere å søke i og bruke. For forskere, journalister og slektsgranskere betyr det at AI blir et verktøy for å finne fram i et materiale som tidligere var tungt å navigere.

AI4LAM og samarbeid i kultursektoren

Nasjonalbiblioteket har fått det administrative ansvaret for AI4LAM — et internasjonalt nettverk for kunstig intelligens i biblioteker, arkiver og museer — for en periode på tre år. I sektoren er det allerede gjort mye testing rundt katalogisering, produksjon av metadata og chatboter.

Dette plasserer Norge sentralt i en internasjonal diskusjon om hvordan kulturarvinstitusjoner skal bruke AI ansvarlig. Det handler om praktiske oppgaver som å automatisere katalogisering og gjøre samlinger søkbare, men også om de prinsipielle spørsmålene rundt opphavsrett og bruk av vernet materiale.

«Nasjonalbibliotekets arbeid med generative språkmodeller skal sikre at norsk språk og norsk kunnskap blir en del av virkeligheten etter hvert som kunstig intelligens tas mer i bruk i hele samfunnet.» — kilde: pressemelding fra Nasjonalbiblioteket om satsing på AI og digitalisering

Opphavsrett er det vanskelige spørsmålet

Den store samlingen reiser et krevende spørsmål: mye av materialet er vernet av opphavsrett. Å digitalisere for bevaring er én ting, men å bruke vernede tekster til å trene generative modeller er noe annet, og berører rettighetene til forfattere og forlag.

Dette er den samme debatten som pågår internasjonalt om AI-trening på opphavsrettsbeskyttet innhold, men Nasjonalbiblioteket står i en særstilling fordi det forvalter en så stor del av den norske kulturarven på vegne av fellesskapet. Hvordan balansen mellom språkpolitiske mål og rettighetshavernes interesser løses, vil ha betydning langt utover bibliotekets egne vegger.

Hva det betyr for norsk AI

For norske brukere kan dette på sikt bety AI-verktøy som faktisk forstår norsk skikkelig — inkludert nynorsk, eldre språk og fagterminologi — fordi de er trent på ekte norsk kildemateriale. Det er et viktig mottrekk mot at norsk reduseres til et oversettelseslag oppå engelskspråklige modeller.

For aktører som følger feltet, er det verdt å merke seg at:

Nasjonalbiblioteket blir en nøkkelressurs for norskspråklige modeller og datasett
Statlig finansiering signaliserer at norsk språk i AI er blitt et politisk mål
AI4LAM-ansvaret gir Norge en posisjon i internasjonal kultursektor-AI
Opphavsrett til vernet materiale er den uavklarte og avgjørende flaskehalsen

Nasjonalbiblioteket og AI 2026 norsk språk skal inn i maskinene

Nasjonalbiblioteket og AI 2026 — norsk språk skal inn i maskinene

En digitalisert kulturarv som treningsdata

Statlig satsing og generative modeller

AI4LAM og samarbeid i kultursektoren

Opphavsrett er det vanskelige spørsmålet

Hva det betyr for norsk AI

Slik vurderer vi