Tekniske erfaringar med å avvikle og omdirigere allkunne.no 🤓

Dette er ei svært teknisk oppsummering av erfaringane med å avvikle allkunne.no. Korleis bør ein leggje opp eit omdirigeringsregime (redirect), kor ærleg bør ein vere andsynes Google og andre bottar?

Vi skriv denne bloggposten fordi vi sjølv har sett etter liknande skriftlege oppsummeringar av omdirigering av heile nettstader, utan å finne noko. Kanskje andre har bruk for desse erfaringane?

Vi har gjort store omdirigeringar av store nettstader to gongar dei siste åra:

  • I 2020 avvikla vi nettstaden denstoredanske.dk og omdirigerte trafikken til denstoredanske.lex.dk og med heilt ny URL-struktur. Dette var ein del av samarbeidet vårt med det danske leksikonet. Vi trur at vi gjorde nokre tabbar med det danske leksikonet: Vi omdirigerte all trafikk til det nye domenet. Der vi hadde rett URL til den nye artikkelen, omdirigerte vi dit, men alle førespurnader som vi ikkje klarte å mætsje til rett URL vart omdirigert til ei statisk side på lex.dk (https://om.lex.dk/denstoredanske.dk). Vi trur at vi mista ein del PageRank for det danske leksikonet i samband med omdirigeringa, og lurte på om Google kanskje oppfatta at vi forsøkte å omdirigere for mykje av trafikken.
  • Då vi skulle avvikle allkunne.no tenkte vi å forsøke ein annan strategi: Å berre omdirigere førespurnader vi var heilt sikre på at vi kunne sende til rett side på snl.no. For eksempel å omdirigere https://allkunne.no/framside/biografiar/p/vladimir-putin/99/14074/ til https://snl.no/Vladimir_Putin. Alle andre førespurnader skulle gje responskodane 404 og 410, sjå nedanfor. Vi valde òg å fylgje alle Googles retningsliner for omdirigering frå eitt domene til eit anna (vi er usikre på om det var ein god idé eller ikkje).

Kva er ein responskode?

Dei fleste kjenner responskoden 404 – Sida vart ikkje funnen. I HTTP-protokollen er det mange statuskodar, som blir brukt for ulike føremål. Kodane blir brukt for å utveksle standardisert informasjon mellom tenaren (servaren, i dette tilfellet allkunne.no) og lesaren.

Den vanlegaste statuskoden er 200 OK. Då har ein lesar bede om å få innhaldet frå ein bestemt URL, servaren forstod kva innhald han skulle vise og alt gjekk ok med å finne fram innhaldet. Dersom det ikkje går bra, for eksempel fordi servaren ikkje klarte å forstå førespurnaden, sender han 404 Ikkje funnen, eller kodar som 500 Intern servarfeil.

Responskodar frå allkunne.no

For allkunne.no bestemte vi oss for å bruke berre nokre få statuskodar:

Når ein omdirigerer ein heilt nettstad til ein annan er det ikkje vanleg å sende 404 eller 410. Det er lett å tenkje at ein vil ha med seg så mykje trafikk som mogleg, og omdirigere alt ein ikkje heilt forstår kva er med med 301 til ei statisk infoside eller framsida.

På grunn av erfaringane med omdirigering av det danske leksikonet bestemte vi oss for å bruke både 404 Ikkje funnen (for Allkunne-artiklar vi ikkje hadde klart å mætsje med rett SNL-artikkel) og 410 Forsvunne for artiklar vi ikkje ville ha på snl.no.

Erfaringane så langt

Til no, snaue tre månader etter at vi slo av allkunne.no, er det er registrert 1,1 millionar førespurnader til servaren. 67 % var etter artiklar, 94 % var frå bottar.

Vi veit ikkje om bot-trafikken til allkunne.no er representativ, men det er ganske tankevekkjande at 94 prosent av trafikken til ein stor norsk nettstad er frå bottar.

Kva er ein bot?

Ein søkjerobot (crawler, spider) er ein internett-bot som systematisk surfar internett, og blir som regel brukt for å indeksere nettsider til søkjemotorar. Søkjerobotane lastar ned lokale kopiar av nettsidene for analyse. Søkjerobotane har eksistert nesten like lenge som internett og alle søkjemotorar er avhengig av ein slik søkjerobot.

Det aller meste av trafikken til allkunne.no (94 prosent) er frå robotar. Det meste av trafikken er søkjerobotar (Google, Bing, Yandex m.fl.), ein del er frå ulike indekseringstenester, noko ser ut til å vere statleg etterretning (?) og ganske mykje er heilt uforståeleg trafikk.

Førespurnader til allkunne.no

I løpet av dei snaue tre månadene som har gått sidan vi slo av allkunne.no og slo på omdirigeringsmotoren vår (sjå nedanfor), har vi registrert 1 178 034 førespurnader til servaren.

Slik har vi svart:

301 Omdirigering629 25153 %
403 Forbode69 0796 %
404 Ikkje funnen88 4658 %
410 Sletta391 22633 %

Alle 301 har gått til riktig artikkel på snl.no.

Vi har altså gått «glipp» av 548 770 førespurnader som vi kunne omdirigert til snl.no.

Kvifor ville vi ikkje ha denne trafikken? For det fyrste er ein svært stor andel bottar, og vi vil ikkje at dei skal indeksere ei tilfeldig «omdirigeringsinformasjonsside» på snl.no. For det andre er det betre for brukarane om dei får klår og tydeleg informasjon om kva som har skjedd. Vi trur at dersom vi omdirigerer berre relevante ting, kan vi kanskje halde på PageRank m.m. hos Google.

Ein stor del av denne trafikken var etter bilete. Bileta på allkunne.no hadde så låg oppløysing av det var vanskeleg å få flytt dei til snl.no, så vi bestemte oss tidleg for ikkje å overføre bileta.

Slik har fordelinga av trafikk frå bottar og «folk» (d.v.s. alt vi ikkje har klart å identifisere som bottar) til allkunne.no vore dei siste tre månadene:

Førespurnader frå bottar og folk til allkunne.no i perioden 9. juni til 29. august.
Blå strek er bottar, grøn er det vi trur er folk (men truleg ein god del bottar i det talet òg).

Det vi ser er at bot-aktiviteten auka etter at vi slo av alkunne.no. Google m.fl. ville altså finne ut kva som har skjedd med sidene som ligg i indeksane deira. Så roa det seg litt etter nokre dagar, men trafikken har halde seg relativt høg. Trafikken frå faktiske folk gjekk raskt ned etter at vi slo av allkunne.no: Etter ei veke var dei alle fleste brukarane vekke.

Responskodar som er sendt

Rett etter at vi slo av allkunne.no såg vi at det var mange som forsøkte å opne bilete på allkunne.no. Vi ser at biletsøket til Google er mykje treigare til å oppdatere innhaldet sitt enn det vanlege nettsøket. Den absolutt størstedelen av førespurnadane til allkunne.no frå vanlege brukarar var til bilete.

Då vi slo av allkunne.no var det mange URL-ar som vi ikkje visste om, og vi sende ut mange 404-kodar dei fyrste dagane. Vi sette i gang eit relativt stort arbeid med å manuelt omdirigere førespurnader etter einskild-URL-ar på allkunne.no til rett side på snl.no. Denne innsatsen fungerte:

Dette er det vi har sendt av responskodar frå allkunne.no til IP-adresser som vi ikkje har identifisert som bottar.

Om vi ser på korleis vi har svart robotane er biletet veldig annleis:

Vi ser at nokre, særleg Google, testar dei same URL-ane mange gongar for å sjekke om vi verkeleg meiner at sida er omdirigert (301) eller borte (410).

404-førespurnadane auka kraftig etter eit par dagar: Søkjerobotane forsøkte å hente sidene mange gongar for å sjekke om sida verkeleg var 404, eller om vi hadde fiksa problemet.

Og ja: Vi fiksa problemet for mange sider. Auka i 404 overraska oss litt, og to studentar på sumarjobb fekk i oppgåve å sitje éin dag kvar for å leggje inn rette omdirigerings-URLar. Dei starta på jobben på føremiddagen 13. juni, og vi la ut endringane kvelden 13. juni. Oppdateringane hadde momentan effekt: Dagen etter var førespurnadane til 404-sidene langt lågare.

Korleis oppfører bottane seg?

Vi loggar kva bottar som er innom allkunne.no.

Rundt 40 prosent av bot-trafikken er Google , 19 prosent Bing, 10 prosent Apple. Det er lite overraskande.

Meir overraskande er at 7 prosent av bot-trafikken er frå eitt eller anna elevprosjekt hos Oslo kommune, at 4 prosent ser ut til å vere kinesisk etterretning eller eitt eller anna statleg kinesisk (?) og 4 prosent er ein servar hos tyske Bertelsmann som lastar dei same sidene om att og om att.

Rundt halvparten av bot-trafikken ser ut til å ta omsyn til responskodane vi sender. Den andre halvparten ignorerer svara dei har fått tidlegare, og hentar dei same sidene dag etter dag. Sjølv om vi altså har fortalt for eksempel Bertelsmann at ei side er fjerna (410) forsøker dei å opne den same sida dag etter dag. Feedcheck forsøker å laste RSS-feeden på allkunne.no kvart tiande minutt, heile døgnet, sjølv om dei har fått beskjed om at RSS-en er fjerna 48 160 gongar (!).

Kor lenge bør ein omdirigeringsmotor stå på?

Vi er usikre på kor lenge omdirigeringsmotoren som no ligg på allkunne.no bør vere i drift. Vi såg for oss at dei fleste søkjebottane ville få med seg at innnhaldet har flytta til snl.no relativt raskt, men dette viste seg å ikkje stemme: Google er framleis innom 10–20 prosent av allkunne.no-artiklane kvar einaste dag, tre månader etter at vi byrja omdirigere all trafikken.

Effekt på snl.no

Vi har knapt sett innverknad på lesinga av snl.no etter omdirigeringa, og er usikre på den faktiske effekten av omdirigering.

Dette er også svært vanskeleg å måle: Vi veit kor mange førespurnader til allkunne.no som har blitt omdirigert til snl.no, men ser samtidig at dette knapt har hatt innverknad på for eksempel sidevisningstala som blir registrert i Google Analytics for sidene vi har omdirigert til. Det er òg vanskeleg å få systematisk målt om PageRank er overført eller ikkje.

Vi fylgjde Googles retningsliner for omdirigering frå eitt domene til eit anna og varsla Google om omdirigering i Search Console, i tillegg til omdirigering gjort på artikkelnivå. I dag: Tre månader etter at allkunne.no vart slått av, har Google framleis tusenvis av Allkunne-URL-ar i indeksen sin, men alle ser ut til å ha SNL-innhald i seg (basert på snippetane som er i søkjeresultata).

Kan du programmere litt? Skriver du godt? Vil du jobbe i SNL?

Vi ser etter en kunnskapsrik og engasjert redaktør som både kan gjenkjenne og skape gode leksikonartikler, og som kan programmere.

Innholdet i Store norske leksikon er stadig under utvikling og forbedring, og noe av det vi ønsker å utvikle videre, er automatiske prosesser som kan generere eller oppdatere innhold. Det kan dreie seg om å generere tekst ut ifra standardisert innhold i databaser, lage grafer og kart og så videre. Vi har også behov for statistisk analyse av brukertall og sidevisninger. Til dette arbeidet brukes blant annet leksikonets API og databaser.

Du trenger absolutt ikke å ha utdanning i programmering, men kanskje har du brukt verktøy som R, Python eller PHP i arbeidet ditt? Hvis du ikke forstår noe av eksempelet her, er du trolig ikke riktig person. Skjønner du det meste, vil vi oppfordre deg til å søke!

Redaktørene i Store norske leksikon har som jobb å utvikle innholdet i leksikonet og helheten i prosjektet videre. Én av de sentrale oppgavene er å hjelpe fagfolk med å formidle kunnskap gjennom gode og forståelige leksikonartikler. Redaktørstaben skal til sammen dekke alle fagområdene i leksikonet. 

Se stillingsannonsen på finn.no

Størsteparten av redaksjonen under jubileumsmarkeringen Store norske fest i november i fjor.
Vi er vanligvis ikke så stivpynta på jobb 🙂
Redaksjonen i mer typisk antrekk og stil 🙂 Fra Latvia, da vi besøkte det latviske leksikonet, i juni.
Halve redaksjonen

Det tok oss 37 år, men no har vi ein artikkel om karelianismen

I fagtidsskriftet Bok og Bibliotek i 1985 fekk SNL relativt skarp kritikk fordi vi mangla ein artikkel om karelianisme, ei kunstretning i Finland frå 1890-åra til om lag 1920.

Les heile kritikken (langt grundigare enn dette lille eksempelet) hos Nasjonalbiblioteket.

I førre veke fekk SNL ein artikkel frå Allkunne om karelianismen, som kort tid etter vart oppdatert og utvida av fagansvarleg Morten O. Haugen. Det er sjeldan at det tek oss så lang tid å svare på kritikk 🙂

Rekordtal for nynorskinnhald i Store norske leksikon​

I over 100 år var Store norske leksikon (SNL) nesten berre på bokmål. Men etter at SNL og Nynorsk kultursentrum gjekk saman om ei satsing har talet på nynorskartiklar skote i vêret. 

I 2020 inngjekk Nynorsk kultursentrum eit samarbeid med Store norske leksikon. Målet var å auke nynorskinnhaldet i SNL, slik at fleire møter nynorsk i kvardagen. Som ein del av satsinga vart nynorskleksikonet Allkunne ein del av SNL. No er jobben med å flytte Allkunne-artiklane inn i SNL ferdig, allkunne.no er lagd ned og SNL har 17 500 artiklar på nynorsk.  

– Dette er det viktigaste arbeidet stiftinga gjer for å nå 16-åringar med nynorsk som hovudmål og alle andre som treng påliteleg innhald på nynorsk på nett. Våre medarbeidarar har saman med tilsette i Store norske leksikon gått gjennom kvar einaste artikkel, oppdatert innhaldet og gjort dei tilgjengelege for lesarane, seier direktør Per Magnus Finnanger Sandsmark i Nynorsk kultursentrum.  

Bakgrunnen for samarbeidet var ei semje om at det gode innhaldet frå Allkunne fortente å nå ut til eit breiare publikum, som det gjer i SNL. SNL er Noregs største nettstad for kunnskapsformidling, med 600 000 lesne artiklar kvar dag. I tillegg var det eit ønske om å eksponere folk for begge dei norske skriftspråka som ein naturleg del av språkmangfaldet vi har her i landet.  

– I tillegg er samarbeidet ei sikring av at den nynorske kulturhistoria blir dokumentert, seier Sandsmark. Med å ta i bruk både nynorsk og bokmål på alle fagområde i leksikonet styrkjer vi også norsk fagspråk og terminologi.   

Den store auken speglar seg også i lesartala. I år vil det bli lese om lag 3,5 millionar artiklar på nynorsk på snl.no. Ein viktig og sjølvforsterkande effekt av samarbeidet er at fleire forfattarar og fagansvarlege no tek initiativ til å skrive på nynorsk. Førebelse analysar viser at det har lite å seie for lesinga av artiklane om dei er skrivne på nynorsk eller bokmål, ifølgje Bolstad.   

Og fleire skal det bli. Framover skal institusjonane jobbe systematisk for endå meir nynorskinnhald i SNL. Målet er å doble talet på nynorskartiklar.  

– Kunnskapsformidling på nynorsk er eit viktig satsingsområde for oss, sjølv om vi ikkje lenger driv eige leksikon. Gjennom samarbeidet med SNL skal Nynorsk kultursentrum bidra med dokumentasjon av den nynorske kulturhistoria, artikkelskriving og språkrettleiing og omsetjing av artiklar frå bokmål til nynorsk, avsluttar Sandsmark.  

Allkunne er blitt del av Store norske leksikon

I 2020 inngjekk Nynorsk kultursentrum og Store norske leksikon eit samarbeid for å få meir nynorsk i SNL. Ein viktig del av samarbeidet var å flytte gode artiklar frå nynorskleksikonet Allkunne inn i SNL, slik at desse artiklane kunne få fleire lesarar.

Det tok godt over eitt år å få flytt over artiklane frå Allkunne til SNL, men 8. juni 2022 vart overflyttinga fullført og nettstaden allkunne.no lagt ned. No er det SNL som er nynorskleksikonet i Noreg.

1803 artiklar frå Allkunne er flytt over til SNL, som nye artiklar eller som utvidingar av eksisterande artiklar. 7000 artiklar frå Fylkesleksikon for Sogn og Fjordane er overleverte til Fylkesarkivet i Vestland. Alle artiklane er i tillegg overført til språksamlingane i Bergen og skal bli grunnlag for ordbøker og liknande korpus for nynorsk.

I tillegg til artiklane frå Allkunne har SNL òg omsett eller nypublisert 9900 artiklar på nynorsk dei siste to åra. Alt i alt er det no 17 500 nynorskartiklar i SNL. Til samanlikning var det rundt 26 000 artiklar i Allkunne, men hovudtyngda av desse var svært korte artiklar som opphaveleg kom frå eittbindsleksikonet Caplex.

Målet for samarbeidet mellom Nynorsk kultursentrum og SNL er at fleire skal lese nynorsk. Det har vi lukkast med: Lesartala for nynorskartiklar i SNL er no meir enn fire gongar høgare enn lesinga av heile allkunne.no til saman.

Les meir om kva Allkunne var i artikkelen om Allkunne i Store norske leksikon.

Vi har omdirigert lenker til allkunne.no vidare til riktig artikkel på snl.no, slik at folk som har gamle lenker framleis skal finne fram til det gode innhaldet frå Allkunne.

Pip, pip: No er det artiklar om alle fuglar i heile verda i SNL 🦆

No er det artiklar om absolutt alle fugleartar i verda i SNL. Det er nesten 11 000 ulike fugleartar alt i alt.

SNL hadde artiklar om alle fuglar som er nær Noreg frå før. Desse artiklane er relativt gode og utbygde. Så oppdaga vi at namneutvalet i Norsk ornitologisk foreining hadde laga norske namn til absolutt alle fuglar i verda. Eit imponerande arbeid!

Vi har eksperimentert med maskingenerert prosa i mange år. Dette er vanleg tekst i artiklar, men som er generert med script framfor ein forfattar.

Det er mange fordelar med å maskingenerere tekst: Vi kan oppdatere veldig mange artiklar samtidig, og vi kan halde eit veldig høgt presisjonsnivå dersom vi har gode databasar som er tilgjengelege. Utfordringa er å kombinere maskin- og menneskeskapt tekst på måtar som gjer at desse ikkje går i beina på kvarandre.

No har biolog Jon Peder Lindemann generert korte artiklar om alle fuglar i verda: Kvar dei bur, storleik, kva dei et, korleis dei legg egg og kvar dei bygg reira sine. Desse artiklane vil bli supplerte med bilete og utbreiingskart; og så kan fagfolka som arbeider for SNL gå laus og oppdatere med meir fagleg informasjon om desse fuglane.

Sjå alle fugleartiklane.

Kviss med Store norske leksikon og Nynorsk kultursentrum i Ørsta 9. juni 2022

Dei nynorske festspela blir arrangert i Ørsta og Volda 9. til 12. juni 2022. På opningsdagen 9. juni inviterer Store norske leksikon og Nynorsk kultursentrum til kviss på Målbar kl 23:30.

Visste du at Nynorsk kultursentrum er medlem og bidragsytar til Store norske leksikon? Nett no pågår eit stort arbeid med å auke nynorskandelen i nettleksikonet. Denne kvelden på Målbar vil ansvarleg for dette arbeidet hos Nynorsk kultursentrum, Stina Aasen Lødemel, og sjefredaktør Erik Bolstad i Store norske leksikon utfordre deg på små og store kviss-spørsmål medan du nyt god drikke frå Målbaren. Vel møtt! 

Lyst til å vere med? Sjå Facebook.

Honorar og skatt for 2021

Info til dem som har fått honorar fra SNL for 2021.

Dette må du gjøre

Sjekk om honoraret du har fått fra SNL står på skattemeldingen din for 2021. Dersom honoraret står der trenger du ikke gjøre noe mer, og du trenger heller ikke å lese videre på denne sida.

Dersom du allerede har levert skattemeldingen din uten at honoraret fra SNL var med, må du sende inn korrigert skattemelding. Det er enkelt å gjøre: Bare logg inn på skatteetaten.no og endre de innsendte opplysningene. Se nedenfor.

Frist for å levere skattemelding er 30. april (31. mai dersom du er næringsdrivende).

Forklaring

SNL rapporterte utbetalte honorar for 2021 til Skatteetaten på vanlig måte i januar i år. I mars meldte flere fagansvarlige fra om at honoraret ikke hadde dukka opp på skattemeldingene deres, og flere fortalte også at de plutselig hadde fått krav om å levere næringsspesifikasjon (tidligere kalt næringsoppgave).

SNL har vært i kontakt med Skattetaten om dette i over en måned. De har gjort endringer i hvordan de behandler innrapportert «Godtgjøring til opphaver til åndsverk» (som er det SNL rapporterer inn, tidligere kalt royalties). Skattetaten har ikke varslet at de har gjort endringer, og skriver heller ikke noe om dette i veilederne sine.

Vi har ikke fått noen fornuftige svar, og skriver derfor denne teksten for å hjelpe alle til å fylle ut skattemeldingen sin på riktig måte. Vi vet ikke hvor mange som er berørt av disse problemene, og Skatteetaten kan heller ikke svare på det.

Alle som fikk honorar fra SNL for 2021 fikk årsoppgave på e-post 14. januar. Du har fått tilsendt summen på nytt i e-post 21. april. Summen er for honorar opptjent i 2021, som enten er utbetalt i perioden februar-desember 2021 eller i januar 2022.

Legg til honoraret fra SNL i skattemeldingen

Dersom honoraret fra SNL ikke står i skattemeldingen din, må du legge det til.


Dersom honoraret ikke står i skattemeldingen, og du IKKE har fått krav om å levere næringsoppgave

Åpne skattemeldingen, rull ned til «Ønsker du å oppgi andre opplysninger under temaet Arbeid, trygd og pensjon?», trykk på «Se hva du kan legge til», velg «Næring», og så «Inntekter, kostnader, formue og gjeld fra næringsvirksomhet» og deretter «Andre næringsinntekter».

Fyll ut slik:

  • Utbetalt av: Store norske leksikon
  • Næringstype: Annen næring
  • Næringsinntekt rapportert inn fra tredjepart: Summen du har fått utbetalt (står i årsoppgaven du fikk på e-post 14. januar

Dersom honoraret ikke står i skattemeldingen, og du HAR fått krav om å levere næringsoppgave

Du har trolig fått krav om å sende inn næringsoppgave fordi du har hatt inntekter fra flere steder. Du må summere sammen inntektene og eventuelle utgifter du har hatt.

Åpne skattemeldingen, rull ned til «Ønsker du å oppgi andre opplysninger under temaet Arbeid, trygd og pensjon?», trykk på «Se hva du kan legge til», velg «Næring», og så «Inntekter, kostnader, formue og gjeld fra næringsvirksomhet» og deretter «Gå til næringsspesifikasjon».

Du får så noen innledende spørsmål før du kan fylle ut skjemaet. Skatteetaten har en god veileder for utfylling av næringsspesifikasjonen.


Har du et enkeltpersonforetak som du ikke bruker?

Det lønner seg å slette inaktive enkeltpersonforetak. Da får du færre krav om rapportering m.m.

Noregs største arkitekturleksikon

Dei siste to åra har ei gruppe arkitektar, med Per Rygh i spissen, oppdatert mange tusen arkitekturartiklar i Store norske leksikon. Artikkelbasen i SNL om arkitektur er blitt det aller største oppslagsverket om arkitektur som er laga i Norden nokon gong.

I 2019 fekk Store norske leksikon (SNL) overta dei digitale publiseringsrettane til Arkitekturleksikon. Dette bokverket vart skrive av arkitekt Arne Gunnarsjaa, og gjeve ut på Abstrakt Forlag.

Arkitekturleksikon var då det kom ut, det største leksikalske oppslagsverket om arkitektur som var gjeve ut i Norden nokon gong. I 2021 fullførte vi ein stor import der dei fleste av artiklane vart importert til SNL. Nokre av artiklane er nye oppslag i SNL, andre har blitt samskrive med oppslagsord vi hadde frå før, men var lite utbygd. Undervegs har mange av artiklane vorte utvida og oppdatert av dei fagansvarlege for arkitektur i leksikonet, Per Rygh, Ketil Moe, Ulf Grønvold, Anne Margrethe Sørseth og Helle Brænd Rabbås. Arkitekturleksikon hadde svært gode teikningar av kjende bygg, teknikkar og arkitektoniske omgrep, teikna av Gunnarsjaa sjølv. Desse teikningane har verkeleg gjort arkitekturstoffet vårt lettare tilgjengeleg for lesarane. I samband med importen er det lagt inn fleire tusen fotografi, som saman med teikningane har gjort leksikonet rikare og vakrare.

Arne Gunnarsjaa var mest kjend som forfattar av verka Arkitekturleksikon, Arkitekturhistorie, Norges arkitekturhistorie og Arkitekturguide for Norge og for å ha vore domkirkearkitekt ved Nidaros domkyrkjes restaureringsarbeider frå 1989 til 2006.

Kvifor satsar SNL på arkitektur?

Arkitekturstoffet i SNL var tidlegare relativt ujamnt. Noko var svært bra, andre område fanst ikkje, medan nokre artiklar var direkte dårlege. No er heile dette området i langt betre stand enn tidlegare.

Arkitekturen er uttrykk for skiftande stilretningar i tida, og eitt av dei beste uttrykka for samtidshistoria. Bygningane som er rundt oss påverkar oss, dei skapar debatt og arkitekturen pregar både bygd og by. Då skulle det berre mangle at eit fagredigert leksikon som SNL er gode på dette feltet òg.

Satsinga på arkitektur er ikkje avslutta. Mange av artiklane er blitt veldig mykje betre, men ein del arbeid står framleis att. Dersom du er arkitekturkyndig og har relevant fagbakgrunn kan du bidra i SNL.

Målform har liten innverknad på lesing av artiklar

Dei siste par åra er 1800 artiklar i Store norske leksikon omsett frå bokmål til nynorsk. No har vi analysert kva som har skjedd med lesinga av desse artiklane før og etter omsetjing, og ei førebels oppsummering er at målform har liten innverknad på lesinga.

Vi var spente på om artiklar som vart omsett til nynorsk ville få færre lesarar. Det har ikkje skjedd: I snitt får dei omsette artiklane fleire lesarar etter omsetjing, men har litt lågare vekst enn bokmålsartiklane.

Tre av de mest lesne nynorskartiklane i SNL

Analyse av omsette artiklar

Vi har sett på korleis lesing av artiklar som er omsette frå bokmål til nynorsk i perioden 2016 til sumaren 2021, har utvikla seg. Dette er artiklar der vi har datagrunnlag for minst 100 dagar etter omsetjing og kan samanlikne dette med den same perioden året før.

I analysen har vi fjerna mange artiklar fordi dei av ulike grunnar forkludrar resultata eller er lite signifikante. Analysen er gjord på 441 artiklar. Desse 441 artiklane vart lesne til saman 312 000 gongar i løpet av dei 100 dagane etter omsetjing. Til samanlikning vart dei lesne 277 000 gongar i den same perioden året før. I sum har altså artiklane auka 12 prosent i lesing etter omsetjing.

Men: Leksikonet aukar i lesing kvart år. Dersom vi korrigerer for den ålmenne auken i lesinga av leksikonet, ser vi at artiklane som er omsette, har 1,5 prosentpoeng lågare auke i lesing enn andre artiklar. Dette er eit lågt tal og truleg ikkje signifikant fordi datagrunnlaget er for lite.

Mange av artiklane blir svært mykje betre samtidig som dei blir omsette til nynorsk. Nokre av dei blir vesentleg lengre (når ein kort bokmålsartikkel frå SNL blir erstatta av ein lengre artikkel frå Allkunne), mange av dei får bilete, betre formatering og fleire lenker. Desse endringane gjer resultata vanskelegare å tolke, ideelt sett burde vi berre omsett artiklane for å kunne analysere om språk har innverknad på lesinga.

Vi har eit litt for tynt datagrunnlag, men vi forsøker oss likevel på ein førebels konklusjon om at omsetjing til nynorsk samla sett har liten verknad på lesinga.

Vi er usikre på konklusjonen: For nokre artiklar ser vi relativt stor nedgang i lesing etter omsetjing, men dette kan ofte forklarast med pandemien (den fyrste nedstenginga i mars og april 2020 hadde enorm verknad på lesartala våre), nyheitssaker eller TV-seriar. I andre tilfelle ser vi stor auke. Når vi får litt større datagrunnlag, vil vi kunne gje ein betre analyse.

Metode

Vi gjer ein automatisk analyse av nyleg oppdaterte artiklar kvar natt, mellom anna for å sjekke målform. Dersom artiklane inneheld typiske nynorskord som «ikkje» eller «Noreg» får dei eit nynorskpoeng, medan typiske bokmålsord gjev bokmålspoeng.

Totalt 1837 artiklar er omsette frå bokmål til nynorsk i perioden 2016 til sumaren 2021. Analysen er gjort på 441 artiklar. 1393 artiklar er fjerna fordi dei har låge lesartal (anten under 30 sidevisningar i perioden før omsetjing eller etter omsetjing). 3 artiklar er fjerna fordi lesartala vart sterkt påverka av pandemien. Dei 441 artiklane har 200 datapunkt kvar (sidevisningar per dag), til saman 88 200 datapunkt. Dei er samanlikna med 200 datapunkt for 182 000 artiklar, til saman 36 millionar datapunkt.

Vi har så samanlikna lesartal for artiklane 100 dagar etter omsetjing med den same perioden året før. Artikkelen om hinduisme vart for eksempel omsett frå bokmål til nynorsk 28. oktober 2020. Vi har då summert saman lesartal for denne artikkelen for perioden 29.10.2020 til 5.2.2021 (100 dagar etter omsetjing) og har samanlikna dette med data for perioden 29.10.2019 til 5.2.2020.

Samanlikningane mellom lesing av nynorskartiklane og heile leksikonet er gjord for dei same periodane. I hinduisme-eksempelet er altså utviklinga i lesing av hinduisme-artikkelen samanlikna med lesing av alle artiklar i dei same periodane.

Dei mest lesne nynorskartiklane i SNL

  1. hinduisme
  2. svartedauden
  3. Land i Europa
  4. Ivar Aasen
  5. Jesus
  6. norsk språkhistorie
  7. energi
  8. norrønt
  9. Immanuel Kant
  10. Nelson Mandela
  11. tungtvannsaksjonen
  12. protestantisme
  13. nynorsk
  14. pandemi
  15. Kina
  16. anafylaktisk sjokk
  17. Den islamske staten (IS)
  18. helse
  19. dialekt
  20. nordnorsk
  21. sosiolekt
  22. trøndersk
  23. Håvamål
  24. mellomnorsk
  25. jernteppet
  26. anafylaksi
  27. Norsk Ordbok
  28. kasus (grammatikk)
  29. norsk alfabet
  30. Ludwig van Beethoven
  31. Max Weber
  32. abiotiske faktorar
  33. histamin
  34. elementærpartikkel
  35. Voluspå
  36. poliklinikk
  37. kløyvd infinitiv
  38. asket
  39. vestnorsk
  40. Pride
  41. Kleopatra
  42. subjektiv
  43. borgerrettsbevegelsen
  44. Gunnlaug Ormstunges saga
  45. biotiske faktorar
  46. lemenår
  47. Johann Sebastian Bach
  48. morfologi (grammatikk)
  49. produsent (biologi)
  50. Peter Wessel Tordenskiold
  51. infinitiv (grammatikk)
  52. hygiene
  53. Aasmund Olavsson Vinje
  54. Harald 5.
  55. anamnese (medisin)
  56. Ålesund
  57. Åsgårdsrei
  58. jamstillingsvedtaket
  59. Heimskringla
  60. dialekter i Nordland
  61. preteritum
  62. Tarjei Vesaas
  63. satellitt
  64. Magnus Lagabøters landslov
  65. landsmål
  66. epikrise
  67. diagnose
  68. Halldis Moren Vesaas
  69. dialekter i Sogn og Fjordane
  70. parasitt
  71. dialektar i Østfold
  72. dialekter og språk i Troms
  73. kvitveis
  74. Graham Greene
  75. Kjell Askildsen
  76. studentopprøret
  77. humaniora
  78. dialekter og språk i Finnmark
  79. Tore Renberg
  80. Kåre Mol
  81. blåveis
  82. Oskar Braaten
  83. Høyesterett
  84. atopi
  85. albedoeffekt
  86. ordbok
  87. romani
  88. incel
  89. norvagisering
  90. nøkkelart
  91. Den store nordiske krigen
  92. fele
  93. høysnue
  94. Johan Falkberget
  95. Kygo
  96. endringar i norske dialektar
  97. helseføretak
  98. likeverd
  99. kongruens (grammatikk)
  100. Galdhøpiggen