Hvordan sortere 220 000 artikler

Sorterer man ikke leksikon alfabetisk lengre? (hørt på Twitter)

Search, don’t sort! (Google Mails mantra)

En av de største forskjellene mellom et papirleksikon og et nettleksikon går på hvordan en leser finner fram i all kunnskapen. Mens man før gikk i bokhylla, dro ut et tungt bind, bladde seg fram og tilbake for å finne et oppslagsord utifra alfabetet, bruker nå de fleste søkefunksjoner for å finne det de vil lese om.

Hovedredaktør Godal vurderer kategorisering av samfunnsfagene. Foto: Georg Kjøll, CC-BY-SA

Men selv om det for den jevne søker dermed vil være likegyldig til hvori en database en leksikonartikkel ligger, er det ikke dermed sagt at alle oppslagsordene kan plasseres i en diger haug. På snl.no har vi i overkant av 200 000 artikler som alle skal oppdateres, administreres og sjekkes for feil med ujevne mellomrom. Hvordan vet man hvilke artikler som bør sjekkes når, og hvem skal gjøre all denne oppdateringen?

Store norske leksikon sitt store svar på dette spørsmålet er å fordele artiklene mellom fagansvarlige. Når en ny fagperson kommer på plass skal hun få overta en artikkelbase som hun har spesielle faglige forutsetninger for å forvalte, og den skal være av en slik størrelse at det er mulig å ha oversikt over hva som ligger der.

Alle våre artikler er dermed  kategorisert i fagområder, med ett fagområde per artikkel. Artikkelen om Accra ligger i «Ghanas geografi«. Artikkelen om kosher ligger i kategorien «jødedom«. Omtalen av Massive Attack ligger i «elektronisk musikk«.

Den underliggende strukturen av fagområder er en sentral forutsetning for at ideen om et redigert leksikon, forvaltet av redaktører og fagansvarlige kan fungere. Og siden vi allikevel har behov for kategorisystemet, har vi åpnet opp for muligheten til brukere å navigere i kategoriene, ved å gjøre kategoriene til en synlig del av artiklene og nettsidene.

Utklipp av strukturforslag til bildende kunst

Dermed har også fagstrukturen en pedagogisk funksjon, og lar folk lete seg fram i kunnskapen, ikke bare ved søk, men også ved å klikke seg fram i kategorier de synes ser interessante ut.

Men behovet for og verdien i god kategorisering gjør også leksikonjobbingen ganske kompleks. Når Kunnskapsforlaget overførte leksikonet fra papir til nett, var både tid og ressurser begrenset, og ikke alle emner ble delt inn på en god måte.

Noen inndelinger har vært greie for Kunnskapsforlaget å gjøre, og veldig mange artikler er dermed delt inn (relativt) logisk etter geografiske regioner, som Ecuadors geografi, Australias litteratur, Frankrikes historie. Andre fagområder lider derimot under at det ikke har blitt gjort noen forsøk på å fordele artikler utover å putte dem i veldig generelle kategorier: for eksempel spillefilm og fjernsyn, malerkunst, arkitektur, bedrifter.

Fagområdet arkitektur inneholder i dag over 1800 artikler, malerkunst har  nesten 2600. Over 1300 artikler om bedrifter av ulikt slag har hittil vært samlet i én haug.

Utsnitt av tankekart for kategorisering av typografi og grafisk design, av fagansvarlig Christian Leborg

Det er umulig for én fagansvarlig, som deltidsjobb, å holde styr på alt som foregår og har foregått i feltet «malerkunst», like lite som det er mulig å vite om alle forandringer i selskapers ledelse og struktur, når selskapene er så forskjellige som Pfizer, Norgesmøllene og Carlings.

Å rydde opp i dette sammen med de fagansvarlige, og lage logiske og pedagogiske inndelinger, har vist seg å være blant de mest utfordrende og tidkrevende sidene ved innholdsjobben i leksikonet. Det er ikke tungt bare fordi alle artiklene pr i dag må flyttes én etter én (puh!), men også fordi valg av kategorier, deres navn og hva som skal plasseres hvor, forutsetter at verdivalg tas, og kompromisser gjøres.

Hvor skal spørsmål om kjønn og seksualitet behandles? Kanskje i samfunnsfagene, men isåfall hvor? Handler kjønn mest om politikk, sosiale spørsmål, eller rettigheter? Hvor skal en religion som baha’i plasseres? Å la den ligge under «islam», slik den har gjort hittil, står i fare for å nedvurdere dens plass som selvstendig tro og verdensreligion.

Eller ta et mindre kontroversielt eksempel: Bjørn Floberg. Skal han plasseres i film eller teater? Burde man finne multikunstneren Kim Hiorthøy i elektronisk musikk, kunst eller litteratur?

Redaktør Ryste, Redaktør Hovde og Hovedredaktør Godal i dyp kontemplasjon om struktureringen av samfunnsfagene. Foto: Georg Kjøll, CC-BY-SA

Det hadde vært kjekt å kunne hoppe bukk over alle disse problemstillingene, og bare putte ting i den rekkefølgen det (tilnærmet) nøytrale systemet alfabetisering dikterer. Men samtidig har det å kunne dele slike problemstillinger, få innspill fra brukere, og åpne opp prosessen med kategorisering en stor merverdi.

Hvilke fagfelt et begrep tilhører, innenfor hvilket fagområde en artikkel er plassert, er en del av kunnskapens kontekst. Ved å gi innsyn i denne konteksten, og dermed hvilke valg som til enhver tid gjøres i både kategorisering og skriving, åpner vi opp for at disse valgene kan diskuteres, og nye perspektiver slippes til.

11 svar til “Hvordan sortere 220 000 artikler”

  1. Hei Vidar. Takk for innspill og bra tips! Vi har et øye til Dewey-kategorisering når vi utformer våre egne kategorier, og lærer og trekker på dem der det er mulig.

    Men siden kategoriene våre har litt annerledes formål og funksjoner , kan vi ikke adoptere Dewey i sin helhet. For eksempel blir Dewey-kategorisering på en del områder litt for spesifikt for oss, og det er ikke alle spesialfagområder hvor vi har artikler vi kan fylle Dewey-kategorier med.

    Hilsen Georg

    1. Eg ser den. I somme websøk i bibliotek kan ein navigere ut frå dewenummer, sjå t.d. her: http://asp.bibits.no/jaerbiblioteka/wsDewey.Asp?UnitId=0&DocGrp=1&SearchUnitId=0&LoanUnitId=0&comb=AND.

      Utfordringa med dette er at det er somme emne der ein berre treng spesifisering på tre nivå, andre emne der ein treng både sju og åtte. Men det bør kunna fiksast slik at ein berre gjer brukte kategoriar synleg?

      Andre som jobbar med emnekategorisering er Universitetsbiblioteket i Oslo: http://ubtinget.wordpress.com/2012/02/20/meremneordsnytt/

  2. Ja, det burde i prinsippet være mulig å få til en slik løsning, men her er det nok det tekniske det skorter på per i dag. Men vi har snakket med Realfagsbiblioteket og Knut Hegna om ulike måter å koble oss opp mot kategoriseringsarbeidet der på. En ting vi har drøftet er å legge inn dewey-søk som lenker i artiklene, eller automatisk generert linker på de nye «kategoriforsidene» som vi utvikler.

    Vi har nok en bedre oversikt over hva som er mulig å få til etter at de nye nettsidene er på plass i mars, men her finnes det mange muligheter!

    Georg

  3. Ja, det er mange muligheter. Wikipedia bruker mange kategorier for artiklene sine slik at artiklene blir listet opp flere steder. Men da blir det også mer å holde styr på. Et enkelt kategori-tre ville være det beste.

  4. Jeg tror ikke Dewey er til særlig hjelp. Skal man først se til et klassifikasjonsskjema, vil nok Bibliographic Classification være mer egnet(se hjemmesiden) Det er en meget stor og vanskelig oppgave å strukturere (kategorisere) et leksikon. Det er prøvd i forbindelse med utarbeidelse av systematiske registre til leksika – f.eks PAX. Jeg vil ikke anbefale å prioritere dette. Viktigere er det å få til velskrevne artikler – med et godt og korrekt innhold og henvisningsapparat.

  5. Svein: Det er først og fremst prinsippet med én artikkel – én fagansvarlig som setter en stopper for å gi hver artikkel flere kategorier.

    Tor: Kunnskapsforlaget hadde i sin tid et intrikat og veldig informasjonsrikt metadatasystem fra papirtiden, som dessverre aldri ble overført til nettversjonen. Men vi håper at en basal, oversiktlig kategorisering, kombinert med et mer avansert system for å tagge/markere artikler, kan gjøre at vi får en god struktur i bunn.

  6. Trenger hjelp til religion i England og finner det ikke noen steder på nett heller ikke på snl.org!!! Hjelp meg!!!!!!

  7. Hei Styrk. Vi har en artikkel om religion i Stortbrittania, men den var ganske godt gjemt: http://snl.no/Storbritannia_og_Nord-Irland/befolkning#menuitem3

    Hvis du leser på engelsk så har den britiske avisa Guardian veldig mye stoff om landets religioner på sine nettsider, selv om det meste er fra 2002: http://www.guardian.co.uk/religion/page/0,,818217,00.html

    Håper dette kan hjelpe litt!

    Tor: Vi tar imot all hjelp vi kan få, særlig fra folk med så mye erfaring på disse problemstillingene som deg.

Stengt for kommentarar.