Om SNLs innhold og struktur (del I)

De mest synlige forandringene på snl.no siden den nye redaksjonen overtok, har så langt gått på tekniske og formelle ting. Vi skårer høyere på Google, vi har fjernet «kvalitetssikret»-merket, vi flytter metainformasjon rundt på sidene. Og snart kommer den mest iøyenfallende forandringen av alle – i form av splitter ny nettsidedesign. Men parallelt, og mindre synlig, foregår en like viktig jobb: vi jobber med leksikonets innhold og struktur.

Leksikonets 220 000 artikler utgjør samlet sett snl.no sitt innhold. Det er en enorm base med tekst (og en del bilder, litt lyd, pluss én video), med mengder av fantastisk informasjon og flotte fakta. Basen er akkumulert over flere år og er et resultat av at noen av Norges flinkeste fagfolk har delt av sin kunnskap om et helt spekter av emner, fra Adelsvesen til Åsnes i Hedmark.

Men ingen kunnskap er statisk og det finnes store variasjoner i kvaliteten på innholdet, hos oss som i alle andre databaser. Leksikonet er dermed avhengig av dyktige folk som kan rette opp i feil, skrive nye artikler og følge opp brukeres spørsmål og kommentarer. Dette er den desidert mest tid- og ressurskrevende delen av leksikonjobben. Å produsere og revidere innhold i en så stor artikkelbase er også en mer langsom prosess enn for eksempel teknisk utvikling, og forbedringer kommer ikke så brått eller merkes så klart som når noe skjer på designsiden. Det er også derfor det ikke har vært stort å lese om denne siden av jobben på bloggen så langt. Resultatene og erfaringene kommer rett slett ikke til oss like fort her som på andre områder!

Fordi vi er en liten redaksjon er vi ikke i nærheten av å ha tid eller bred nok faglig kompetanse til å gjøre skrivejobben selv, og sjefen har, som en konsekvens, gitt oss skriveforbud. Store Norske Leksikon lener seg derfor på en modell hvor fagansvarlige med ulike former for ekspertkompetanse  har redaksjonelt ansvar for en avgrenset artikkelbase. De fagansvarlige må ha en oversikt over hva som skjer på ett eller flere spesifikke kunnskapsfelt, og sørge for at dette er dekket på en god måte. Mangler informasjon er det de fagansvarlige som må sørge for at den kommer på plass, og de må til enhver tid ha så god oversikt over et felt at de kan rette opp informasjon når den som ligger i basen er utdatert.

Innholdsproduksjon i det offentlige rom, foto av benchilada, Creative Commons-lisensiert, via Flickr, CC BY-NC-SA 2.0

Størstedelen av jobben til oss i redaksjonen går dermed ut på å finne flinke folk som kan ta på seg denne oppgaven for hvert enkelt fagområde, og vi må motivere og støtte dem i jobben å forvalte dette ansvaret på en så god måte som mulig. Det vi har oppdaget så langt er at de ulike sidene av denne jobben tar mange former, og innebærer mange ulike oppgaver, avhengig av våre fagansvarliges bakgrunn og utgangspunkt.

Noen fagansvarlige, gjerne de som har vært i systemet og kjenner det fra før, er selvdrevne og skriver gode nettleksikonartikler uten at de behøver å tenke mye over det. For andre er leksikonsjangeren ny, og de trenger dermed tilbakemelding på hva slags informasjon som skal med i en tekst, hva som er riktig tone, og så videre. For noen garvede leksikonskribenter er det kanskje tilbakemelding rundt hva som er en god nettleksikonartikkel som behøves først, da det er mye som skiller artikler på internett og de som de har vært vant til å skrive på papir. Hva skal lenkes til hvor, hvilke andre ressurser kan man henvise til, og hvor lang kan en tekst være?

De fleste av spørsmålene vi får fra fagansvarlige har vi ikke ferdig utformede svar på, og mye av veien blir dermed til mens vi trasker av gårde. Når vi skal avgjøre fra hvor og hvordan man henter data for innbyggertall og landareal (og hvorvidt dette skal inkludere vannmasse eller ikke) må vi diskutere dette over tid med de fagansvarlige, hente inn kunnskap og få råd fra andre som jobber med tilsvarende problemstillinger. Hvilke transkripsjonsnormer vi følger fra kinesisk og arabisk, hva som skal være kriteriet for at vi skal prioritere omtale av en komponist, eller hvor tett vi skal være på aktuelle hendelser, er spørsmål vi må avgjøre dels når de dukker opp, og dels uavhengig og prinsipielt.

Så: fra hvilket hull i jorda dukker disse flotte fagansvarlige opp? Det er nesten like mange måter fagansvarlige kommer til SNL på som det er fagansvarlige. Noen var i systemet fra før, og jobbet iherdig med innhold og utvikling selv i tiden da leksikonets skjebne var høyst uavklart. Disse har fortsatt å jobbe like flittig i ettertid, og har vært en enormt viktig ressurs for oss på dager hvor veien fram mot visjonen om et åpent, gjennomsiktig, oppdatert, redigert leksikon har føltes lang.

Andre har ligget i skjul i systemet, og våknet til live når de har skjønt at det finnes en aktiv redaksjon og andre engasjerte mennesker i og rundt leksikonet. Dette kan enten være fagansvarlige som i sin tid har sagt ja til å være med, og siden ikke blitt fulgt opp, eller det kan være folk som skrev to brukerartikler i 2009, for ikke å høre noe igjen før to år etterpå. Noen har også dukket opp som vanlige brukere i nyere tid, og når det har vist seg at deres kompetanse er etterspurt har de gått inn i oppgaven som fagansvarlig med liv og lyst. Enkelte fagansvarlige har meldt seg til tjeneste etter å ha lest om oss i media, eller skjønt at vi trenger hjelp med et gitt område.

Redaksjonen har også rekruttert via nettverk, eller vi har gjort målrettede søk fordi vi vet at en person eller institusjon er den beste i Norge til å formidle kunnskap på et gitt område.

Alle sider ved innholdsjobbingen på leksikonet har sine egne utfordringer, og vi lærer noe nytt om hvordan dette kan gjøres bedre hver eneste dag. En stor hindring for å gjøre dette arbeidet godt har så langt vært at en del av fagene ikke har vært strukturert i oversiktlige og håndterlige kategorier. Vi har dermed brukt mye tid på å få på plass et bedre kategorisystemet en del steder i leksikonet. Men utfordringene og gledene ved dette arbeidet er verdt sin egen bloggpost, så kategorisering kommer dere til å høre mer om senere.

Slik blir det nye søket

Da jeg overtok jobben med nettsidene til Store norske leksikon, var det én ting folk var misfornøyde med: Søket. Siden storparten av brukerne våre er inne i leksikonet for å søke etter artikler, er søket den viktigste enkeltfunksjonen i leksikonet. Et søk som ikke fungerer, er et leksikon som ikke fungerer.

For å fikse søket vårt, har vi måttet jobbe både teknisk, redaksjonelt og designmessig. Under følger alle endingene vi har gjort, samt en smugkikk på det nye designet.

Redaksjonelle endringer

Det første vi fant ut når vi gikk søket etter i sømmene, var at folk «gikk seg bort» i søkeresultatene våre. 1 av 2 fant ikke det de lette etter, selv om artikkelen de så etter dukket opp i søket. For å endre det, måtte vi gjøre det enklere for folk å skjønne at de hadde funnet de de lette etter. Dette betydde å redusere mengden alternativer. Her er noen av tingene vi har fjernet fra søket:

  1. Alle registerartiklene. Du skal være sikker på at den første artikkelen du trykker på, faktisk er en artikkel, ikke en henvisningen til treff 2 i søket.
  2. Alle lydfiler og bildefiler. Du skal bare få «rene» leksikonartikler.
  3. Vi har oppfordret fagansvarlige til å fjerne ukjente mellomnavn og lite kjente navn på temaer fra overskriftene sine, og legge dem i artikkeltekstene istedet. Det er fordi du skal kunne finne «Lenin» uten å kunne mellomnavnene hans.

I tillegg har vi begynt å ta i bruk nøkkelord-feltet mer aktivt, slik at vi kan sørge for at artikler dukker opp i søket på relaterte søkeord, ikke bare selve søkeordet. I det nye designet vil nøkkelordfeltet være tydeligere enn i dagens redigeringsgrensesnitt. Jeg er ikke overrasket hvis du som fagansvarlig ikke har lagt merke til det (c:

Tekniske endringer

Teknisk sett står søkefeltet ganske likt som det gjorde da vi begynte. I tiden fremover vil vi endre en del ting. De står under i prioritert rekkefølge.

  1. Artikkelforslag/brukerartikler og personlige artikler skal ut av søkeresultatene. Vi lager et eget brukersøk istedet, og gjør artikkelforslag utelukkende tilgjengelig for innloggede brukere. Grunnen til det sistnevnte, er at vi ikke vil at Google skal hente opp dårlige forslag som reelle SNL-artikler. Det ligger mye ubehandlet grums i arkivet av brukerartikler, og vi rekker ikke behandle alt med det første. Ergo skal de skjules for alle andre enn fagansvarlige, registrerte brukere og redaktører.
  2. Vi skiller de tre leksikonene våre, Store norske leksikon, Store medisinske leksikon og Norsk biografisk leksikon i tre separate søk. Det er fordi å få to treff i «tarm», et vanlig og et med (SML) bak, er ganske forvirrende for en bruker som lurer på hvilken artikkel hun skal lese om tarm. Dessuten ser vi av statistikken at mange leter etter egne søk i utelukkende SML og NBL. Det har vi tenkt å gi dem.
  3. Relevante treff vil bli tatt ut av sideboksen og inkludert i de vanlige treffene for å bli mer synlige.

Kryssordsøket

Visste du at SNL har et kryssordsøk? Det visste ikke vi da vi overtok, vi lurte bare på hvorfor statistikken var preget av søkeord som så slik ut:

_od_

Det viser seg at et søk på _od_, gir deg et treff i artikkelen «Bodø». Du kan faktisk søke etter ord uten å kjenne til alle bokstavene i SNL. Etter litt Googling viste det seg at dette er en funksjon mange techsavy kryssordentusiaster kjenner til. Vi kommer til å la kryssordsøket være som det er, og muligens bare promotere det litt bedre. Vi har også kommet frem til at kryssordsøket også er et rimordbok-søk. Et søk på _ar, gir alle enstavelsesord som slutter på «ar». Bra når du skal skrive konfirmasjonssang.

Endringer i desinget

Her passer det best å vise to bilder:

Her er dagens søk, med treff i både SNL og NBL, samt relevante treff på siden.

Her ser du søkesiden slik den kommer til å se ut i det nye designet. Du får SNL, SML, NBL og leksikonfolk (redaktører, fagansvarlige, brukere og feiljegere) i hver sine faner, selv om du har søkt på Jens Stoltenberg i et søkefelt. Du kan også se hvordan designet kommer til å bli i forhold til font og fargevalg. Vi går for mer «papiraktig» font og bakgrunn, med fargene til det gamle papirleksikonet. Pent, ikke sant? Du kan klikke på bildet for å se en stor utgave.

Designet er laget av Thord Foss, og Ida Aalen og Eirik Rønjum har planlagt struktur og interaksjonsdesign. Alle vi i leksikonredaksjonen har selvfølgelig også planlagt, tenkt, kritisert og kommet med forslag. Hva synes du?

Vi kommer til å slippe flere og flere ferdige bildefiler av designet etterhvert som vi blir helt enige med oss selv. Heng med!

Google-revolusjonen

«Jeg bare googler noe og så går jeg på nettsiden som er øverst på google. Og det er jo aldri dere.»

Når vi spør folk om de bruker Store norske leksikon, er dette det vanligste svaret vi får. Folk bruker ikke leksikonet fordi de ikke finner leksikonet. Da jeg begynte i jobben, var spørsmålet alle stilte meg: «Men hvordan skal du løse Google-problemet?» Og de spurte på en måte som gjorde det tydelig at de trodde det ville være et umulig problem å løse.

Men nå har vi faktisk løst det – i hvertfall nesten. Vi har forbedret googlerangeringen vår enormt på noen få uker. Vi havner fortsatt langt nede på søkeord som enten er mye skrevet om på blogger og forum, søkeord det er mye Google-ads på og søkeord som betyr det samme på engelsk, men bortsett fra disse untakene, kommer artiklene til Store norske leksikon som regel på første, andre eller tredje plass.

Du kan for eksempel forsøke å søke på:

  1. Katti Anker Møller
  2. Narsissisme
  3. Solidaritet
  4. Bjørnstjerne Bjørnson

Eller alle andre ord som måtte falle deg inn.

Slik fikk vi det til

En av de som jobber med nettsidene våre heter Wilhelm Joys Andersen. Det første Wilhelm gjorde da han begynte, var å sammenligne artikkelstrukturen i Store norske leksikon og artikkelstrukturen til norsk Wikipedia. Hva var forskjellen? Hvorfor lå Store norske så langt bak på Google?

Her er det han fant ut – forenkelt slik at det skal være lesbart for alle. Det første Wilhelm gjorde, var å skru av CSS’en på en av artikkelsidene våre for å kunne se hvordan leksikonet ser ut for Google. Google ser hverken hvilke farger du bruker på nettsiden din eller hvilken skrifttype du bruker. Google ser HTML’en din, og tenker at «Hm. Det som ligger øverst, er nok viktigst.»

På Wikipedia, var det som lå øverst i HTML’en til en artikkel begynnelsen på selve artikkelen. På Store norske var det dermot vanvittig mye rot. Tomme reklamebokser, menyelementer, bildetekster – you name it. Du måtte scrolle mange skjermlengder for å komme til selve artikkelen.

«Ok», sa jeg til Wilhelm. «Da er det bare å begynne å slette.»

Og Wilhelm slettet. Og slettet. Og slettet. Og slettet. Han røsket ut flere hundre linjer drit bare han og Google kunne se, elementer som var usynlige for brukerne. Alt det han ikke slettet, puttet han under selve artikkelen, slik at det ikke lå i veien.

Det andre Wilhelm påpekte da han begynte i jobben, var at vi alltid hadde «Store norske» foran alt. Det betydde at overskriftene våre på Google var «Store norske leksikon – Katti Anker Møller», mens Wikipedia hadde «Katti Anker Møller – Wikipedia.» Denne lille, semantiske forskjellen var en av grunnene til at du ikke fikk opp Store norskes artikkel om du bare søkte på Katti Anker Møller. Om du derimot søkte på «Leksikon Katti Anker Møller», kom artikkelen vår opp på toppen. Løsningen var enkel: Bytte plass på ordene og få Google til å indeksere oss på nytt.

Nå begynner vi å se resultatene av denne jobben. Vi har fortsatt en stor jobb å gjøre med å lenke mer, og å lage bra innhold folk får lyst til å lenke til, men nå har vi hvertfall ikke et teknisk hinder mellom oss og Google mer. Og å fjerne det tekniske hinderet har faktisk gitt veldig konkrete resultater.

Hurra!

Tekniske feil på snl.no

Er du en av dem som har kontaktet oss i redaksjonen fordi du har funnet en tenkisk feil? Vi får ofte epost om feil som folk har oppdaget – alt fra lenker du trykker på som ikke fører noen steder til knapper som blir borte i bestemte nettlesere. Nå har vi laget et samlet sted i leksikonet der du kan fortelle om feilene du har funnet. Bruk kommentarfeltet til å beskrive følgende:

  • Hva du prøvde å gjøre da noe gikk galt
  • Hva du forventet at skulle skje
  • Hva som skjedde

Da kan vi som jobber med den tekniske delen av nettsidene fikse feilene fortløpende, holde oversikt over feilene folk har funnet og gi dere beskjed så fort noe er fikset opp i. Og dere har et sted å mase, selvfølgelig.