Utålmodig teknolog tenker stort om oppdagelser og forskning

Internettet har endret hverdagen for de fleste av oss, men vi har trolig bare sett begynnelsen når det gjelder måter å samarbeide på. Vi ser stadig eksempler på nye former for organisering som bryter med gamle måter å gjøre ting på, og som lykkes med det man nesten trodde var umulig. Et så omseggripende fenomen blir selvsagt gjenstand for studier, men det fins også dem som argumenterer for at det skjer for lite og for langsomt, og som mener at vi må forene alle krefter for å løse de store utfordringene. Et annet aspekt er demokratisering av alt som har med kunnskap å gjøre. Det dreier seg om åpen forskning (open science) og åpen tilgang (open access), men mest om en infrastruktur som legger til rette for dette.

Bokomtale
Michael Nielsen: Reinventing Discovery – The New Era of Networked Science
Princeton/Oxford: Princeton University Press, 2011
Les Princeton University Press’ omtale av boka her

En som har studert nye, nettverksbaserte verktøy som wikier, blogger og andre fora, og satt seg inn i hva de kan åpne for, er den australskfødte fysikeren og skribenten Michael Nielsen. Nielsen er en pioner innen kvantedatabehandling, som i en periode hoppet av den akademiske karusellen og gjorde seg til talsmann for åpen forskning. I boka Reinventing Discovery beskriver han inngående nye måter å drive forskning på, der det handler mye om potensialet nettverket har til å løse oppgaver som langt overgår det enkeltpersoner kan makte alene. Han nøyer seg ikke med en situasjonsbeskrivelse, men utvikler også langt på vei en kravspesifikasjon til det han kaller framtidas datanettverk. Nielsen ønsker med Reinventing Discovery å åpne øynene til forskerkolleger, som han mener er sinkene i klassen: «I wrote this book with the goal of lighting an almighty fire under the scientific community.»[1] Om ikke boka har gjort det, har vel noen av tankene ført til ulming rundt omkring, men Nielsen må helt tilbake til svenskenes overgang til høyrekjøring for å finne noe å sammenlikne den nødvendige holdningsendringen med. Spørsmålet er om svenskenes kvantesprang kan gjentas.

Åpen forskning handler ikke bare om økt samarbeid mellom forskere, men også om at internettet åpner for å invitere lekfolk inn i det gode selskap, slik at de kan bidra i forskningssamarbeid. Det er et fenomen som har fått flere betegnelser engelsk, som crowdsourcing, crowd science ellercitizen science. På norsk har fenomenet blitt betegnet som nettdugnader for forskning, slik Henrik Svensen gjorde i artikkelen «Massenes kraft og forskeren i deg» i Morgenbladet 22.–28.5.2015. Artsdatabanken som koordinerer det meste av artsinformasjon i Norge, omtaler rapporteringstjenesten Artsobservasjoner, der både fagfolk og amatører kan registrere observasjoner av planter og dyr, som en kunnskapsdugnad. Dugnad kan være et greit begrep for en avgrenset aktivitet, men hvis vi holder etnografien utenfor, kan vi kanskje omtale fenomenet som folkeforskning – en mer demokratisk form for forskning?

Folkeforskningen er underordnet hos Nielsen. Nettverksbasert forskning dreier seg framfor alt om nye verktøy for forskere. Han argumenterer sterkt for at slike verktøy vil forandre måten forskere gjør oppdagelser på, og det ganske formidabelt. De kan bidra til å styrke det han kaller kollektiv intelligens, gjøre forskerne smartere og dermed bedre i stand til å takle komplekse vitenskapelige problemer, som klimaproblemet. Han ber oss tenke tilbake på den moderne vitenskapens tilblivelse på 1600-tallet, på de store oppdagelsene som Galileis observasjon av månene rundt Jupiter og Newtons formulering av loven om tyngdekraften. Den største arven etter disse storhetene var ikke enkeltoppdagelsene, men den vitenskapelige metoden som etter hvert gjorde vitenskapelige framskritt dagligdagse. Nielsen hevder at vi med framveksten av nettverksbaserte verktøy står foran et paradigmeskifte av tilsvarende betydning, at disse verktøyene vil gi oss nye muligheter i et omfang vi ikke har sett siden den moderne vitenskapens barndom. Han tror at den vitenskapelige prosessen – måten å gjøre oppdagelser på – vil endre seg mer i løpet av de neste 20 årene enn den har gjort de siste 300.

Reinventing Discovery er organisert i to hoveddeler. Den første delen handler om hva som kan utrettes ved hjelp av verktøy som bidrar til og utnytter kollektiv intelligens. Slike verktøy kan åpne for nye samarbeidsmåter, og Nielsen er grundig i behandlingen av hva som fungerer, hva som ikke fungerer og hvorfor det er på den ene eller andre måten. Den andre delen av boka handler om nettverkets muligheter, hva det kan bli når det blir stort. Internett er fortsatt preget av barnesykdommer, slik Nielsen ser det. Han ser for seg et datanettverk der enorme informasjonsbaser blir tilgjengelig for alle. Noe finnes allerede, som den fullstendige kartleggingen av det menneskelige genomet (GenBank), haplotypekartet over hele menneskeheten (HapMap) og Allen Institutes hjerneatlas. Problemet blir å finne mening i disse datamengdene. Begrensningen vil ikke være mangel på data, men på gode spørsmål. Datamengdene må angripes på nye måter, og døra settes også på gløtt for den interesserte lekmann. Nielsen ønsker at nettverksbaserte verktøy skal forandre forskerhverdagen på flere måter, og også forholdet mellom vitenskapen og samfunnet.

Kollektiv intelligens

Nielsen åpner boka med et eksempel han stadig vender tilbake til, Polymath-bloggen. Matematikeren Tim Gowers ved Cambridge University la i januar 2009 fram noen tanker om et uløst matematisk problem i et blogginnlegg og inviterte andre til å delta i et forsøk på å løse det. Han ville utforske mulighetene for å angripe forskningsspørsmål gjennom et massivt, nettverksbasert samarbeid. Gowers fikk ingen umiddelbar respons, men det tok ganske snart av. Etter sju timer fikk han et par kommentarer og forslag, og etter hvert ballet det på seg med nye ideer og kommentarer. Noe var blindspor, men etter 37 dager hadde 27 personer skrevet 800 kommentarer i bloggen. Da var problemet løst, og ikke bare det. Det var løst som et særtilfelle av et mer krevende problem, som ad hoc-forskningsgruppen hadde funnet ut av i løpet av prosessen. Gowers beskrev senere opplevelsen som å kjøre bil i stedet for å slite med ei håndkjerre.

Hvordan fungerer kollektiv intelligens? Metaforen med en kollektiv hjerne der deltakerne spiller rollen som neuroner, er problematisk, men Nielsen illustrerer fenomenet med en henvisning til James Surowiecki (The Wisdom of Crowds, 2004). Surowiecki forteller historien om den britiske forskeren Francis Galton som overvar et fesjå på den engelske landsbygda i 1906. Der var det en konkurranse om å tippe vekten på en okse, og Galton observerte at gjennomsnittet av mange mer eller mindre ville gjetninger bare bommet på oksens faktiske vekt med ett pund, altså med rundt en halv kilo. Nielsens prosjekt dreier seg om hvordan nettverksbaserte verktøy kan tappe denne typen kunnskapskilden. Da handler det ikke om tipping, men om å løse problemer på grensen til det vi har kapasitet til.

Nielsen støtter seg til konkrete eksempler i argumentasjonen sin. Som han påpeker, det er ikke rådende teori innen felt som gruppepsykologi, sosiologi eller økonomi som har avfødt de beste nettverksbaserte verktøyene. Opphavspersonene er heller unge studenter som Matt Mullenweg (WordPress) og Linus Torvalds (Linux-operativsystemet med åpen kildekode). Det var ifølge Nielsen flere grunner til at Polymath-bloggen ble så mye mer fruktbar enn en hvilken som helst samtale mellom framstående matematikere. «Samtalen» var for det første styrt – Gowers ønsket én poengtert tanke per innlegg. Videre gjorde bloggmediet det mulig å lese slik en selv ville og hoppe over alt man ikke hadde tid til eller kunne forholde seg til, og man hadde alltid anledning til å gå tilbake og se nærmere på ting. Nettverksbaserte verktøy har et viktig fortrinn i det at de kan rette spesialisters oppmerksomhet mot akkurat det de er spesialister på. Verktøyene kan utnytte det Nielsen kaller mikroekspertise, det at enkeltpersoner av spesielle årsaker kan vite mye om et svært avgrenset felt. Han viser til et eksempel fra sjakkverdenen, matchen mellom den russiske verdensmesteren Garri Kasparov og Verden i 1999. I denne matchen fikk en juniorspiller fra USA, Irina Krush, en sentral rolle. Hun hadde i tida før matchen diskutert et spesielt trekk med sine rådgivere, og som en av tre valgte rådgivere for verdensteamet, som var organisert via en nettside, kom hun i posisjon til å foreslå dette som trekk 10. Trekkene til verdensteamet ble avgjort ved avstemning, men hennes trekk ble foretrukket fram til trekk 50. Det var ukjent terreng for verdensmesteren og mye av grunnen til at han fikk en uventet hard kamp.

Det at Krush fikk mulighet til å bruke det innstuderte trekket, var ikke gitt. Spillet kunne tatt en annen retning. Nielsen beskriver samarbeidsformen som nettverksbaserte verktøy åpner for, som slumpetreff gjennom design (designed serendipity). Det handler om at tilfeldigheter kan forløse ideer, og det kan gjelde selv for den beste. Mannen bak relativitetsteorien, Albert Einstein, hadde balet med teorien sin i flere år og kommet til at tyngdekraften på en eller annet måte var knyttet til en geometri uten de rette vinklene vi kjenner, men hvordan? Einstein slumpet til å nevne problemet for vennen og matematikeren Marcel Grossmann, som kunne fortelle at dette hadde Bernhard Riemann allerede beskrevet. Riemannsk geometri skulle bli den generelle relativitetsteoriens matematiske språk, men Nielsens poeng er at slike tilfeldigheter opptrer altfor sjelden. Innen kreativt arbeid bruker de fleste, som Einstein, mye tid på problemer som ville vært rutine i de rette hender. Verktøy som tar slumpen ut av slumpetreffene, vil gjøre oss i stand til å håndtere utfordringer som ville satt deltakerne hver for seg sjakk matt.

Følelsen av å delta i et samarbeid som virkelig tar av, er som om hjernen får vinger, ifølge Nielsen. Han bruker kjernereaksjon, eller nærmere bestemt det som kalles kritisk masse, som analogi. For å følge ham må vi venne oss til tanken om at masse er mest tomrom. Det er så mye tomrom mellom kjernene i et stykke metall, også det ustabile uran 235, at nøytroner fra kjerner som går i oppløsning, har en liten vei å gå før de treffer en annen kjerne og starter en kjernereaksjon. Slik kan det være når vi forsøker å løse problemer på egen hånd, ideene forsvinner ut i det store intet. Uranklumpen må ha en viss størrelse før sannsynligheten er stor nok for at nøytroner på ville veier treffer andre kjerner som skyter ut nøytroner som igjen treffer andre kjerner og så videre. Det er den kritiske massen. I et nettverksbasert samarbeid, slik Nielsen ser det for seg, kan vi stimulere andre og sette i gang prosesser, slik at vi får et oppskalert samarbeid der antall deltakere og mangfoldet de representerer øker sannsynligheten for en selvgående kreativ prosess. Da har samarbeidet nådd en kritisk masse, som i Polymath-prosjektet.

Hvordan møte den rette personen som kan bringe deg et lite skritt videre? Konvensjonelle samtaler kommer til kort når det gjelder målestokk og deltakernes allsidighet. Her trengs en arkitektur for oppmerksomhet som kan lede oppmerksomheten dit hvor deltakerne i et prosjekt kan gjøre størst nytte, hvor de har såkalte komparative fortrinn.

Nielsen er ikke fornøyd med å beskrive dagens situasjon, men er på jakt etter framtidas optimale samarbeidssystemer. En samarbeidsarkitektur der forskeres aha-opplevelser kommer nærmest på bestilling, vil kreve skaleringsmekanismer, måter å filtrere bidrag på, slik at den enkelte deltaker bare ser bidrag som de finner verdifulle eller stimulerende, forklarer Nielsen. Programutvikling basert på åpen kildekode er et felt hvor dette har vist seg å fungere i praksis, og Nielsen trekker fram noen mønstre som går igjen i vellykkede prosjekter: modularitet, oppmuntring til mindre bidrag, enkel gjenbruk av andres arbeid og signalmekanismer for å styre oppmerksomheten.

Dette er en måte å samarbeide på som kan fungere godt innenfor vitenskapen, men kollektiv intelligens vil ikke fungere i alle sammenhenger. Grupper kan ha problemer med å utnytte kollektiv kunnskap og i stedet bruke tida på informasjon som medlemmene har felles, eller det kan være slik at medlemmer med høy status setter dagsordenen. Deltakerne må ha et felles kunnskapstilfang og en felles praksis eller måte å anvende kunnskapen på for å lykkes med kollektiv intelligens. Samarbeidet vil strande der det er uenighet om grunnleggende kjøreregler. En felles praksis kan lede til et kvalitativt skifte i et nettverkssamarbeid, og i vitenskapen er det stort sett personen med de beste bevisene og argumentene som vinner fram. Han kommer tilbake til det at mange finner grunner til ikke å samarbeide.

Nettverksbasert forskning

I andre del av Reinventing Discovery ser Nielsen nærmere på nettverksbasert forskning, hvilke samarbeidsmuligheter nettverket gir og hvilke hindringer som står i veien for en forskerhverdag langt fra tellekantregimet. Han er fra første stund tydelig på at det må dreie seg om åpen forskning for at nettverket skal komme til sin rett. Nielsen forteller om en pensjonert informasjonsforsker, Don Swanson, som har gjort flere betydelige medisinske oppdagelser ut fra en tese om at den vitenskapelige kunnskapsmengden har vokst seg så stor at viktige koblinger mellom fenomener ikke blir fanget opp. Ved hjelp av den medisinske søkemotoren Medline, som indekserer millioner av forskningsartikler innenfor medisin, oppdaget pensjonisten en forbindelse mellom migrene og magnesiumunderskudd, et resultat som senere er bekreftet.

Det foregår en oppbygning av enorme kunnskapsdatabaser som ligger fritt tilgjengelig på internett. Wikipedia har en liste med langt over 200 biologiske databaser. Den nevnte kartleggingen av det menneskelige genomet ble fullført i 2003 ved hjelp av et stort antall biologer fra hele verden. I kjølvannet fulgte haplotypekartet som kartlegger hele menneskeheten med genetiske variasjoner. Ellers fins det eller kommer det til å finnes kartleggingsprosjekter for nesten alt mulig: jordas atmosfære, jordas overflate, jordas klima og all verdens arter, menneskets hjerne og ikke minst universet. Sloan Digital Sky Survey (SDSS) tar høyoppløste bilder av stjernehimmelen ved hjelp av et robotstyrt teleskop i New Mexico-fjellene, bilder som hvem som helst kan studere.

Nielsen beskriver dette som en enorm informasjonsallmenning, men en slik tilgjengeliggjøring av kunnskap medfører både fordeler og utfordringer. Han mener vi befinner oss i en oppdagelsenes tidsalder som på mange måter er lik det som skjedde på 1400−1700-tallet, men i vår tids grenseområder av vitenskapen. Utviklingen av digitale verktøy som utfører kognitive oppgaver direkte ved å søke etter mening og skjulte koblinger i en kollektiv kunnskap, er en parallell til verktøyene som styrker vår kollektive intelligens. Når datagrunnlaget måles i terabyte, er det mangelen på gode spørsmål som blir begrensningen. Noen spørsmål vil aldri bli stilt hvis tilgangen til data er begrenset, hevder Nielsen. I stedet for å sende spørsmål ut i verden i håp om å treffe en som kan svare, stilles datamengder til disposisjon i håp om å uteske spørsmål som leder til ny innsikt. Målt etter antall siteringer i forskningsartikler viser SDSS-prosjektet at åpne data og deling kan få en enorm rekkevidde.

Det normale har vært at forskere vokter sine data, selv om det dreier seg om grunnforskning som burde vært åpent tilgjengelig. Medline-eksemplet viser at de enorme datamengdene gir uante muligheter. Tilgangen til informasjon har blitt revolusjonert gjennom internettet og søkemotorer, og det har også vist seg mulig å finne mening i slike overmenneskelige mengder av informasjon. I USA har kartlegging av Google-søk blitt brukt til å varsle om mulige utbrudd av influensa, noe som viste seg å være mye raskere enn å innhente data fra primærhelsetjenesten via tjenestevei. Det er analogt med systemene næringslivet bruker i forsøk på å forstå kundenes handlingsmønstre – eller handlemønstre, bare i en mye større skala. Nielsen ser for seg et datanettverk der all kunnskap blir knyttet sammen, ikke som nå med frittstående løsninger for aminosyrer, gener, proteiner, legemidler og pasientjournaler, for eksempel. Han ser de teknologiske mulighetene, men nevner ikke noe om at det kan være gode grunner til ikke å koble data. Datatilsynet vil sikkert ha et ord med i laget, men datanettverket vil ganske sikkert komme fordi stadig flere vil dele data og knytte seg til andre kilder. Foreløpig er det uferdig og har flust av mangler.

Nielsen innser at han befinner seg i kontroversielt terreng, men ønsker ikke å bli avfeid som science fiction-forfatter. Han styrer derfor bevisst unna et begrep som kunstig intelligens, som han mener ofte handler om å erstatte mennesker og utføre oppgaver som vi klarer godt selv. Han legger eksisterende teknologi til grunn når han i stedet lanserer begrepet datadrevet intelligens. Nielsen skjønner at mange vil reagere på en slik bruk av begrepet intelligens, men hevder at datamaskiner har noen egenskaper som vi ikke har i behandlingen av store datasett. Ved å kombinere visjonene om henholdsvis datanettverket og datadrevet intelligens ser han for seg at vi kan skape mening ut av all verdens kunnskap.

Datanettverket Nielsen skisserer, vil kunne endre vitenskapen på et par vesentlige måter. For det første vil mange flere spørsmål kunne besvares. Når to datasett kombineres, kan du finne svarene som ligger i hvert av datasettene, men også svarene som finnes i relasjonene mellom dem. For det andre kan forklaringer bli mer komplekse. Nielsen nevner evolusjonsteorien som er enkel teori som forklarer mye. I vitenskapen spesielt har det vært et prinsipp at den enkle forklaringen mest sannsynlig er den riktige, og det finnes et uttrykk for dette metodologiske økonomiprinsippet, Ockhams barberkniv. Men er prinsippet alltid like anvendelig på sammensatte saksforhold? Nettverksbaserte verktøy vil hjelpe oss med å konstruere og trekke mening ut av komplekse modeller, men de vil også kunne endre de vitenskapelige forklaringene, hevder Nielsen. Komplekse problemer kan kreve komplekse løsninger. (Journalisten Arnfinn Christensen har gjort seg noen tanker om dette på nettstedet forskning.no.)

Kosmisk spøkelse oppdaget i stua

Tradisjonelt har det vært slik at forskeren som gjorde observasjonen, også sto for analysen. Som Medline-eksemplet og de høyoppløste bildene i SDSS-prosjektet viser, er ikke dette like selvsagt lenger. Her kommer amatørforskeren inn i bildet. En ung nederlandsk lærer, Hanny van Arkel, stusset over en merkelig blå flekk der hun satt og klassifiserte galakser. Hun la ut et spørsmål på Galaxy Zoos nettforum, men ingen kunne si hva det var. Nærmere undersøkelser viste at objektet var reelt nok, ikke en bildefeil, og titusener av lysår i diameter. Eksperter ble tilkalt, og nye observasjoner med bedre utstyr ble foretatt, men Hanny’s Voorwerp (etter oppdageren og det nederlandske ordet for objekt) forble et mysterium. Uansett hva det var som var oppdaget, hadde aktiviteten utviklet seg til noe langt mer komplisert enn en i utgangspunktet enkel klassifisering av galakser.

Galaxy Zoo har rekruttert mer enn 200 000 frivillige på nettet til å klassifisere galakser gjennom å svare på et par enkle spørsmål ut fra bilder på en dataskjerm. Er det en spiralgalakse eller en elliptisk galakse, og hvis det er en spiralgalakse, beveger den seg da med eller mot urviseren? Et robotteleskop har tatt bildene, slik at ingen har sett dem før. Da boka ble skrevet, hadde denne kosmologiske inventeringen bidratt til 150 millioner galakseklassifiseringer, noe fagastronomer ikke kunne drømt om å få til uten hjelp.

Galaxy Zoo-eksemplet viser at forskning ikke lenger er noe som bare bedrives av forskere. Folkeforskningen er i ferd med å gripe om seg. I første rekke dreier det seg om innsamling av data, men det fins flere eksempler på tolkningsdugnader som Galaxy Zoo, og noen ganger kan dette utvikle seg til forskningssamarbeid på høyt plan. Tidsskriftet Scientific American har en nettside med oversikt over noe av det som finnes av små og store kunnskapsdugnader. Oversikten viser noe av bredden i dette, selv om det meste er hentet fra den engelskspråklige verden. Wikipedia har også en liste over aktive og fullførte prosjekter som er langt fra komplett, og det finnes en nettside, SciStarter, der forskere og potensielle bidragsytere kan finne hverandre.

Kunnskapslek

Forskningsspørsmål kan stilles på ulike måter, også i form av dataspill. Et av biologiens mysterier er hvordan DNA bestemmer formen på organismer. FoldIt er et eksperimentelt spill, en avansert form for Rubiks kube som går ut på å folde eller pakke proteinmolekyler for å finne proteinenes iboende struktur. Disse molekylene består av lange kjeder av aminosyrer i en bestemt rekkefølge, men formen kan være kompleks. Det å kjenne proteiners form er viktig for å forstå hvilken funksjon de har, for eksempel hvordan antistoffer, som er proteiner, fungerer i forhold til virus. Aminosyrenes rekkefølge er kodet i DNA, men derfra til å utlede proteinets eksakte form er det et stykke å gå. Det finnes en treg og kostbar metode, røntgendiffraksjon, men det finnes millioner av proteiner som vi bare kjenner DNA-sekvensen til. Den eksakte formen er kjent bare for en brøkdel, slik at alternative metoder kan være interessante.

FoldIt startet som et dataprogram som ble laget for å forsøke å regne seg fram til formen på proteiner, men et hundretalls eller kanskje tusen aminosyrer gir et astronomisk antall mulige kombinasjoner som selv stormaskiner sliter med. Slik maskinkapasitet er heller ikke alltid tilgjengelig, så et par amerikanske forskere fordelte derfor i stedet regneoppgaven på private PC-er for å øke behandlingskapasiteten. Som en gimmick ble et todimensjonalt bilde av den ufullkomne proteinstrukturen, så langt maskinen var kommet, vist som skjermsparer på PC-ene som ble stilt til disposisjon av privatpersoner. Det som skjedde da, var at PC-eiere meldte tilbake at de så forbedringsmuligheter, men dessverre ikke kunne gripe inn. Da dukket ideen om et PC-spill opp.

Ifølge Nielsen kan de beste FoldIt-spillerne konkurrere med eksperter på området, med alle deres hjelpemidler. Biokjemikere er ikke de eneste som tenker i romlige strukturer, og har sikkert ingen spesielle egenskaper som 3D-problemløsere, så her kan møbelsnekkere, mekanikere og rene dataspillere ha fortrinn. I bunnen ligger en forutsetning om at formen som krever minst energi for å holde molekylet sammen, er den riktige. Det betyr at spillerne kan få umiddelbare tilbakemeldinger om hvordan deres struktur ligger an i forhold til andre forslag. Nielsen var skeptisk første gang han hørte om FoldIt. Han syntes det hørtes ut som et av de kjedelige pedagogiske dataspillene han opplevde i skolen på 1980-tallet, men etter noen timer med spillet var dommen en annen. Spillet har en tvingende, avhengighetsskapende kvalitet, slik gode dataspill har: en oppgave som er utfordrende, men ikke umulig, umiddelbare tilbakemeldinger om hvordan du gjør det, og en følelse av at du alltid bare er et lite skritt unna forbedringer. Spillet har heller ingen aldersgrense.

Folkeforskning kan også føre til direkte samarbeid mellom forskere og frivillige. Et eksempel er oppdagelsen av de grønne bønnene – en ny type galakse − som først ble beskrevet av Galaxy Zoo-moderatoren Alice Sheppard på nettstedets blogg. Fagastronomene var merkelig fraværende i dette tilfellet, men det dukket etter hvert opp flere spørsmål om uvanlige, grønne galakser fra de frivillige som klassifiserte galakser. Den ivrige Hanny van Arkel fant den tredje «bønnen» og fikk ballen til å rulle da hun satte navn på fenomenet med innlegget «Give peas a chance!» på Galaxy Zoo-forumet. Snart hadde de nok til ertesuppe uten at noen fra fagmiljøene engasjerte seg. Det ble fleipet med at dette var en stor hemmelighet astronomene ville ha for seg selv, men enkelte begynte også å gjøre egne undersøkelser. En av forskerne bak Galaxy, Kevin Schawinski, ble nysgjerrig og foretok noen tester. Han kunne bekrefte at det var en ny type galakse, men kunne ikke gå videre med saken da.

De frivillige hadde imidlertid fått teften av noe. Nå startet en systematisk oppstilling av galakser som kunne være av den nye typen, og en diskusjon som ble mer og mer faglig. Ifølge Nielsen var de faglige utvekslingene på mange måter tilsvarende de han så i Polymath-prosjektet. De bygde gradvis opp en større forståelse, og tilfeldig leting ble erstattet av avanserte databasesøk i SDSS-datasettet etter aktuelle kandidater. Schawinski og en student fullførte til slutt arbeidet i samarbeid med de Galaxy Zoo-frivillige, og da Nielsen skrev Reinventing Discovery, hadde Galaxy Zoo avfødt 22 forskningsartikler og mange fler var på vei.

Det viste seg at et stort antall frivillige kunne finne mønstre i et datasett på en måte som langt overgikk det enkeltpersoner kan klare, og i tillegg kunne menneskelig intelligens brukes i analysen. Det er en ny måte å gjøre data til kunnskap på, og Galaxy Zoo er i ferd med å bli en generell plattform for å knytte fagastronomer til interesserte lekfolk, slik at de kan drive forskning sammen. Det kan være en effektiv løsning hvis oppgaven er for omfattende for en masterstudent eller man ønsker resultater raskere. Nielsen hevder at nettverksbaserte verktøy er i ferd med å endre forholdet mellom vitenskapen og samfunnet.

Samfunnets støtter?

På hver sin måte gir artsobservatørene, FoldIt-spillerne og alle som klassifiserer galakser i Galaxy Zoo, hver for seg et lite, men reelt bidrag til vitenskapen og felles kunnskap. Det er imidlertid ikke nytt at vanlige borgere driver med forskning. Professor ved Universitetet i Tromsø Marie-Theres Federhofer skriver i antologien Mellom pasjon og profesjonalisme,[2] som handler om dilettantkulturer i skandinavisk vitenskap og kunst, at det først var i forbindelse med profesjonalisering og spesialisering i opplysningstida at betegnelsen «dilettant» fikk en nedsettende betydning, som merkelapp på fuskere i faget. Opprinnelig betegnet «dilettant» en person som syslet med kunst og vitenskap for sin fornøyelses skyld, og antologien viser at dilettanter var viktige kunnskapsbærere i den nordiske moderniseringsprosessen på slutten av 1800-tallet, ei tid som allerede var preget av profesjonalitetskrav og av et heller nedlatende syn på dilettanter. Det framgår at dilettantene bidro på avgjørende måte til utviklingen av de spesialiserte vitenskapene ved å skape et grunnlag i form av empirisk materiale og institusjonelle forutsetninger.[3]

Innenfor visse deler av vitenskapen var amatører framtredende også etter det. Nielsen nevner kometjegere som ett eksempel, og svenske amatørbotanikere fikk utløp for sin interesse gjennom landskapsfloraer.[4] Men selv om amatørforskning ikke er noe nytt, gjør de nettverksbaserte verktøyene det mulig for langt flere å delta, og de utvider også den enkelte deltakers muligheter til å bidra. En kometjeger på 1960-tallet måtte kjøpe eller bygge et teleskop, lære hvordan det skulle brukes og siden observere himmelen i time etter time. Barrierene for å komme i gang var høye, og man måtte være en velhavende person, som oftest mann, for å holde det gående. Nå kan du være i gang i løpet av minutter, og du kan klassifisere galakser på en smarttelefon.

De nettverksbaserte verktøyene åpner også for interaktiv opplæring, og deltakere bringes sammen i fora hvor de kan lære av hverandre og støtte hverandre. Det som kjennetegner kreative samfunn, er fora der folk hjelper og støtter hverandre og hvor man kan lære og vokse som «forsker» i en vennlig atmosfære. Deltakelse i kunnskapsdugnader skjer ikke i ensomhet, isolert fra oppmuntring og kritikk fra kolleger. Nielsen savner imidlertid mer effektive læringsmiljøer med de strukturerte utviklingstrinnene og mentorordningene som finnes i fagmiljøer. Folkeforskningen utfyller på sett og vis Nielsens verktøy for datadrevet intelligens, men han er usikker på om de vellykkede prosjektene er kuriositeter eller om de innvarsler en ny æra.

Selv om innsatsen til de Galaxy Zoo-frivillige er imponerende, kan potensialet være mye større. 1,5 millioner galakseklassifiseringer tilsvarer rundt 250 heltidsansatte i ett år, mens «skjerminnsatsen» til amerikanske tv-tittere tilsvarer én million Galaxy Zoo-prosjekter i året. Nielsen tror ikke at taket er nådd, men folkeforskningens utbredelse vil avhenge av at forskere finner nye måter å knytte til seg lekfolk på, inspirere dem og hjelpe dem med å yte meningsfylte bidrag. Noen vil si at folk flest ikke er smarte nok til å bidra til vitenskapen, men Galaxy Zoo og FoldIt viser noe annet.

Nielsen har kalt kapitlet om folkeforskningen «Democratizing Science», demokratisering av vitenskapen. Samfunnsforskere har også fanget opp denne trenden og snakker om framveksten av Pro-Ams, innovative, engasjerte og nettverkstilknyttede amatører som arbeider etter profesjonelle standarder.[5] Hos Federhofer gjøres dilettantene til garantister for demokratisk-liberale prinsipper. De handler uavhengig av ytre prestasjonstvang og administrativt og byråkratisk press, og de organiserer seg frivillig. Mannen bak begrepet kognitivt overskudd, Clay Shirky, har uttrykt det slik: «We are used to a world where little things happen for love and big things for money. Love motivates people to bake a cake and money motivates people to make an encyclopedia. Now, though, we can do big things for love.»[6] Det kognitive overskuddet er et mål på samfunnets disponible tid og energi etter at primærbehovene er dekket, men Nielsen vil ikke innlate seg på å spekulere rundt hvilken faktor folkeforskningen kan utgjøre.

Vitenskapen og samfunnet

Vi har kunnskapen og teknologien til å bygge verktøyene som kreves for å lykkes med nettverksbasert forskning. Nielsen finner ikke hindringene der. Han skulle gjerne sett at vitenskapen spilte en mer sentral rolle i offentlig forvaltning og i demokratiet som helhet. Vitenskapen er en måte å se på verden på, ikke en interessegruppe. Nielsen ønsker at god forskning skal komme menneskeheten til gode, men dette forutsetter trolig full åpenhet om forskningens data og resultater. Bare etterprøvbarheten kan avgjøre hvor god forskningen er.

Selv om Nielsen ikke har noen løsning når det gjelder vitenskapens rolle i samfunnet, tror han ikke den er gitt for alltid. Rollen har skiftet, og den kan endres igjen, og endringer har ofte vært knyttet til nye teknologier som har ført til institusjonelle endringer. Han mener rollen kan bli endret ved å endre svarene på spørsmål som «Hvem finansierer forskning?», «Hvordan gjøres forskning til politikk?» og «Hvem kan være forsker?». Nettverksbaserte verktøy åpner for muligheter til å endre institusjoner, og helt sentralt for Nielsen er åpen tilgang til forskning. Han ser det urimelige i at skattebetalerne som betaler for forskningen, ikke får lese resultatene av den – du må kanskje være forsker selv. Forskningspublikasjoner tar seg godt betalt og er en stor og lønnsom industri, men de har også tjent samfunnet i det trykte mediets tid. Internettet legger imidlertid til rette for åpen tilgang, og ting er i ferd med å skje.

Akkurat som folkeforskningen endrer hvem som kan være forsker, endrer åpen tilgang hvem som får tilgang til resultatene av forskningen. Et eksempel er arXiv. Fysikere kan forhåndspublisere ferdige artikler samtidig som de vurderes for publisering av vanlige publikasjoner. Arkivet er åpent også for lekfolk, men for fysikere betyr det at nye oppdagelser og deling av kunnskap går raskere. Public Library of Science (PLoS), som ble etablert i 2000, fungerer mer som tradisjonelle publikasjoner, men tar betalt av forfatterne i stedet for at forsknings- og utdanningsinstitusjoner må betale for tilgang. Dermed er det mulig å gjøre innholdet fritt tilgjengelig, og mange prestisjefylte publikasjoner har sett dagens lys på kort tid. Samtidig krever National Institute of Health (NIH) i USA, som årlig forvalter 30 milliarder dollar i forskningsmidler, at studiene de finansierer, skal publiseres med åpen tilgang. Norges forskningsråd ønsker også mer publisering i tidsskrifter som er gratis og fritt tilgjengelig, og har etablert en støtteordning for åpen publisering. Her kan vi stå overfor et institusjonelt skifte, hevder Nielsen. Forlagsindustrien driver utstrakt lobbyvirksomhet, men trusselen mot fortjeneste og arbeidsplasser i denne industrien er en liten pris å betale for å gjøre all viten fritt tilgjengelig.

Nielsens krav om åpenhet gjelder ikke bare forskningsartikler, men også forskningsdata. Noen av de vellykkede prosjektene som er beskrevet i boka hans, er basert på åpne data, som SDSS-bildene. I disse tilfellene skyldes åpenheten i første rekke at det dreier seg om gigantiske prosjekter der finansieringen ville bli vanskelig hvis data skulle hemmeligholdes. Historien om GenBank er illustrerende. Institusjonen ble etablert i 1982, men fikk en treg start. Forskere tok mer enn gjerne del i andres data, men var lite villige til å bidra med egne. En konferanse på Bermuda i 1996 ble et vendepunkt. Der klarte et antall innflytelsesrike forskere å bli enige om å dele data umiddelbart på internett og få forskningsråd med på dette, med den følge at motvillige forskere ikke ville få forskningsmidler. Avtalen gjaldt bare det menneskelige genomet, og det har hittil vist seg umulig å få til liknende avtaler for andre forskningsfelt, for eksempel for kartlegging av influensaviruset. Mangelen på åpenhet og deling er for Nielsen antitesen til Polymath-prosjektet. Selv om forskningstidsskrifter og bevilgende myndigheter har begynt å kreve at data gjøres offentlig tilgjengelig etter publisering, kan deling av data være problematisk for den enkelte forsker eller institusjon så lenge publisering av forskningsartikler – tellekantsystemet – er det alt dreier seg om.

Smaismrmilmepoetaleumibunenugttauiras

Da Galilei oppdaget de første tegnene til ringer rundt Saturn i 1610, sendte han straks brev om oppdagelsen til konkurrenter i faget. Innholdet var ikke umiddelbart tilgjengelig, men besto av anagrammet i mellomtittelen.[7] Slik kjøpte Galilei seg tid til videre uforstyrrede undersøkelser samtidig som han sikret seg mot at noen tok æren for oppdagelsen. Hemmelighold var i tidas ånd. I dag avhenger forskeres levebrød av publisering. Forskningspublikasjoner dukket opp fordi mesenene som solte seg i glansen av oppdagelsene, ønsket bredest mulig publisering. Senere har det blitt slik at oppdagelser ikke er fullendt før de har blitt publisert. Det er et system for deling av kunnskap som Nielsen mener har fungert godt gjennom 300 år uten store endringer, men nå er tida moden for mer moderne medier. Flaskehalsen er forskere som ikke deler data.

Nielsen nevner flere løfterike initiativ som har strandet – ikke på grunn av manglende interesse, men fordi opphavspersonen ikke fikk drahjelp. En kvante-wiki var det nær sagt ingen som bidro til i praksis, og en nettside for anbefalinger av forskningsartikler ble heller ingen suksess. Forskere presses til å pleie karrieren – eller til å skaffe seg en – og har ikke tid til eller ønske om å delta i ulike typer forskningsnettverk, som inkluderer deling av data. De skriver forskningsartikler eller søker om forskningsmidler, ei tvangstrøye Nielsen stadig vender tilbake til. Det å bidra til noe av felles nytte innenfor et fagfelt, har ingen prioritet. Det betyr for ham at noe må være alvorlig galt med vitenskapen. De vellykkede folkeforskningsprosjektene har vært grunnleggende konservative – det endelige målet har vært å produsere forskningsartikler. Bidrag til wikier og anbefalinger av forskningsartikler inngår ikke i det mønsteret, men er noe som burde være mål i seg selv. Det å utvikle forskningsverktøy, som arXiv, har heller ingen høy stjerne i forskermiljøene. Hvordan kan folkeforskning og datanettverket materialiseres i et slikt klima? Nielsen ser en mulighet til å bygge bro over ferdighetsgapet, over avgrunnen mellom utfordringer og løsninger.[8] Han ønsker seg «publish data or perish» som leveregel, ikke «publish papers or perish».

En anmelder, James Wilsdon på FT.com, kritiserte Nielsen for å behandle anvendt forskning og intellektuell eiendom med harelabb (patenter og kommersialisering er behandlet på to sider), men det er grunnforskning Nielsen er mest opptatt av. I 1980 ble det innført lovgivning i USA (Bayh-Dole Act) som ga undervisningsinstitusjoner rettighetene til patenter og annen intellektuell eiendom som var frambrakt ved hjelp av offentlige midler. Det førte til at universiteter begynte å tenke mer i retning av anvendt forskning, på bekostning av grunnforskning. Samtidig begynte de å se på mulighetene for patenter i forbindelse med grunnforskning, en forskning som tidligere var åpen. Dette er et alvorlig hinder for Nielsens vyer, men i hans øyne er hovedproblemet kulturen som bare honorerer deling av kunnskap i form av artikler.

Enkeltforskere får ikke noe igjen for å dele hvis andre ikke er villige til å bidra. Åpen forskning krever derfor at et stort antall forskere endrer handlingsmønster samtidig. Da svenskene gikk over til høyrekjøring natta til 3. september 1967, var det en tilsvarende kollektiv endring i handlingsmønster. Den overgangen skjedde imidlertid etter lovendringer og en lang kampanje. Det blir noe annet å innføre åpenhet som styrende prinsipp i grunnforskning, men et første skritt ble tatt allerede da vitenskapens pionerer ble overtalt til å slutte med anagrammer og heller publisere funnene sine i de tidlige vitenskapelige tidsskriftene. Da var det i fellesskapets interesse å få oppdagelsene publisert, nå er behovet der for større åpenhet.

I et håp om å løse denne floken ser Nielsen til samfunnsforskere som Mancur Olson og Elinor Ostrom. Olson har beskrevet den kollektive handlingens logikk, og Ostrom fikk Nobel-prisen i økonomi for forskning på forvaltning av felles ressurser. Ostrom var opptatt av det såkalte allmenningens problem – det at brukerne av felles goder ofte tar seg til rette. Det vil si, hun var mer interessert i de tilfellene hvor det ikke var noe problem, ut fra en tanke om mulig overføringsverdi. Derav Ostroms lov: En ressursforvaltning som fungerer i praksis, kan fungere i teorien. Trolig kreves både pisk og gulrot. OECD anbefalte i 2007 åpen publisering av offentlig finansiert forskning, men Nielsen kan også tenke seg at institusjoner som finansierer forskning, begynner å kreve formidling overfor allmennheten gjennom blogging eller bidrag til forsknings-wikier. Slik kan de bli katalysatorer for en ny virkelighet, men det må skje i dialog med forskningsmiljøene, som i tilfellet med Bermuda-avtalen. Det trengs også insentiver til å dele. Oppdagere blir ikke automatisk kompensert for å dele oppdagelsene sine, men de kan bli kreditert for dem og bygge omdømme på den måten. Nielsen ser for seg at en slik «omdømmeøkonomi» kan utvides til andre former for deling. Hvis forskere kunne motiveres til å lage verktøy som Galaxy Zoo, FoldIt, arXiv og så videre, ville de ikke lenger være sinker i utviklingen av kunnskapsverktøy.

***

Nielsen framstår ikke så tålmodig som det kan høres ut når han siterer forskeren Daniel W. Hills på at «det finnes problemer som er umulige hvis du tenker i toårsperspektiv, men enkle hvis du tenker i 50-årsperspektiv». Selv forsøker han å gå foran som et godt eksempel. Han er en erfaren blogger og viser også hva åpenhet kan være. På nettsidene hans kan man finne en gratis, nettbasert lærebok om kunstige nevrale nettverk og dyp læring. Underveis i skriveprosessen la han ut betaversjoner av bokkapitlene, slik at de som måtte ha noe å bidra med, kunne kommentere dem. Det ligger også et TED-foredrag på nettsidene hvor han selv presenterer tankene sine om åpen forskning.

*

Om forfatteren:

Dag Hovind (født 1957) er fagoversetter (engelsk til norsk) med mange års erfaring som oversetter av datasystemer og dokumentasjon til program- og maskinvare. De senere årene har han tatt opp igjen gamle interesser for naturhistorie og egen skriving. Han har skrevet litt for Blyttia, tidsskriftet til Norsk Botanisk Forening, og redigerer medlemsbladet til foreningens Østlandsavdeling, Firbladet. Høsten 2013 begynte han som deltidsstudent ved Høgskolen i Buskerud og Vestfolds masterstudium i faglitterær skriving. Foto: Jan Wesenberg

*

Noter

[1]  Nielsen 2012:206

[2] Federhofer, M.-T. (2011). Dilettantismens potensial. I: M.-T. Federhofer & H. Hodacs (red.). Mellom pasjon og profesjonalisme: Dilettantkulturer i skandinavisk kunst og vitenskap (s. 11–29). Trondheim: Tapir Akademisk Forlag.

[3] Amatør: person som driver med vitenskap, kunst, idrett uten å ha det som levevei; selvlært person (fra latin amare «elske»). Dilettant: person som dyrker en kunst eller et fag som hobby, amatør (fra italiensk dilettante, avledet av dilettare «glede (seg), nyte», egentlig «en som nyter». de Caprona, Y. (2013). Norsk etymologisk ordbok. Oslo: Kagge Forlag.

[4]  Beckman, J. (2011). Amatörer, dilettanter och botanisk arbetsfördeling. I: M.-T. Federhofer & H. Hodacs (red.). Mellom pasjon og profesjonalisme: Dilettantkulturer i skandinavisk kunst og vitenskap (s. 309–325). Trondheim: Tapir Akademisk Forlag.

[5]  Federhofer 2011:19

[6]  Nielsen 2012:154

[7] Smaismrmilmepoetaleumibunenugttauiras er anagram for «Altissimum planetam tergeminum observavi». https://en.wikipedia.org/wiki/Anagram

[8] Begrepet ferdighetsgap ble lansert av Thomas Homer-Dixons i boka The Ingenuity Gap (Knopf 2000), mens uttrykket «bygge bro over ferdighetsgapet» er hentet fra Hassan Masum og Mark Toveys artikkel «Given enough minds…: Bridging the ingenuity gap» i tidsskriftet First Monday(2006). http://journals.uic.edu/ojs/index.php/fm/article/view/1370

*

Del artikkelen på sosiale medier