«Eg las på internett at …»

Utsegna «eg las på internett at …» har vore vanleg i mange år, kanskje særleg blant dei over 40 år. Dei yngste blir så drilla i kjeldekritikk på skulen at dei sjeldan berre les eitt eller anna på internett utan å sjekke opphavet.

I 2024 kjem dette truleg til å endre seg: Vi kjem alle til å lese tekstar på nett med uklårt opphav. I 2023 vart språkmodellane tekne i bruk, og kunstig intelligens utfordrar no alle som arbeider med tekst og kunnskap. Faktagrunnlaget og kjeldene er tvilsame, og så å seie alle dei store språkmodellane er baserte på innhald som er stole frå oppslagsverk, bøker og nettkjelder.

Google har rulla ut ein ny versjon av søkjemotoren sin til 120 land. Her er søkje-resultata dytta langt ned, til fordel for ein maskingenerert «leksikonartikkel» på toppen. Dette er ei vidare-utvikling av det vi har sett dei siste åra, der Google forsøkjer å gje brukarane sine svaret på det dei ser etter med éin gong, utan at dei må gå til dei faktiske kjeldene. Den såkalla knowledge panel («faktaboksen» til høgre i søkjeresultata) inneheld data som er teke frå ei rekkje kjelder. Ved å gje brukarane desse opplysningane, slepp Google å sende brukarane vidare til andre kjelder, og kan halde trafikken og annonsekronene for seg sjølv. Konsekvensen for oppslagsverk som SNL er at vi går glipp av lesarar. I 2023 mista vi truleg 30 millionar sidevisningar på grunn av dette.

Endringane til Google vil ha langt meir dramatiske konsekvensar, ikkje berre for SNL, men for alle som publiserer eller les sakprosa. Fleire milliardar brukarar over heile verda vil få opp maskingenererte «leksikonartiklar» i staden for dei vanlege søkje-resultata. «Leksikonartiklane» er ikkje forfatta av menneske, men av språk-modellen Bard. Kjeldegrunnlaget er innhald som Google har stole frå fleire millionar ulike nettkjelder. Sjølv om kjeldetilfanget er stort, har språkmodellen store -utfordringar: Tekstane som blir presenterte, er ei blanding av gode faktaopplysningar, «hallusinasjonar», falske fakta og konspirasjonsteoriar. Desse maskingenererte tekstane er dårleg merkte; det er knapt mogleg for ein vanleg person å forstå at tekstane er forfatta av ei maskin og ikkje eit menneske.

Diverre heng reguleringa av språkmodellane etter. I 2024 håpar vi at politikarar over heile verda tek grep og innfører redaktøransvar for maskin-genererte tekstar. Om ikkje, kjem vi til å møte eit heilt anna internett i framtida: eit internett der så å seie alt innhaldet er maskingenerert, med tvilsame fakta og kjelder. Konsekvensane vil vere skremmande.

Erik Bolstad og Knut Olav Åmås

Teksten er henta frå SNLs årsmelding for 2023.