I dette blogginnlegget skal jeg oversette og forbedre dybde innlegget “With so much data out there, why is there so little trust? | Klipfolio” skrevet av Alan Wille den 23. mars i år. I en verden full av data er det mye informasjonsasymmetri, og i innlegget deler han sin kunnskap om hva data det er, hvordan man tolker og vurderer det.

Alan bor i Ottawa og jobber i et firma som driver med utvikling av programvare for forretningsintelligens. Han er medgrunder og administrerende direktør i Klipfolio, designer, syklist, en far og optimist. Han forteller at han brenner for data, og har selv bygget et levebrød på evidensbasert fakta. Han fant seg frustrert over hvor mange som kunne tro på og handle på en strøm av usannheter. Løgner og halvsannheter sprer seg som ild i tørt gress, og hvordan kan intelligente mennesker være bevisst over og akseptere usannheter når vitenskapsbaserte sannheter er rett foran ansiktet deres. Hvorfor leser ikke mennesker seg opp på fakta, og hvorfor er det så mye desinformasjon der ute i en verden full av data?
Man skulle ønske å få svar på spørsmålene, men de er vanskelige å finne fasit på. Alan ønsker derfor å dele hvordan å være åpen om og kritisk til data og forstå dens sanne verdi.
Hvorfor datakompetanse er viktig
Det mange ikke vet enda er hvordan å validere data, eller viktigheten i det. I dagens verden er evnen til å kritisk vurdere informasjonen like grunnleggende som å vite at rødt betyr stopp og grønt klarsignal. Det er fordi det ikke er portvakter lenger. Ankomsten av sosiale medier har bidratt til å fjerne dem. Vi lever i en tid med teknologisk endring, oversvømmet med uendelige livestreams, videoer, bilder fra både kjente og ukjente mennesker. Eller roboter? Algoritmer mater oss med den samme informasjonen, uten at vi bekymrer oss for om det har blitt sendt er en rapport fra en respektert og valid nyhetskanal eller en smart, men fullstendig fabrikkert godbit fra en konspirasjonsteoretiker som har pitchet den for å appellere til følelser.
Mennesker bruker data for til å danne tanker og et bilde av hva som foregår i verden. Problemet ligger i at man ikke kan skille mellom gode data, altså det som er verifiserbart, og dårlig data, feil eller falskt. Dårlig data inneholder både feilinformasjon og desinformasjon. Skillet mellom dem er at feilinformasjon kommer av at forfatteren har vært klønete, eller ikke hatt kunnskap nok. Desinformasjon er noe som er bevisst skapt for å lure.
Det kan publiseres av bedrifter, myndigheter eller enkeltpersoner. Data blir troverdig når du etter et par skritt har bekreftet det og så legge til kontekst. Bare med gransking oppstår det tillitt til data.
Slik kan du være datakyndig
Bekreft informasjonen
Det første du kan gjøre er å validere det og se om du finner den samme informasjonen fra et par andre kilder. Hvis du for eksempel ser en video på Tiktok som advarer at en myggart er i ferd med å invadere, er det lurt å undersøke informasjonen og se om du finner andre kilder. Jo flere bekreftelser du får, jo mer troverdig er informasjonen.
Det skal være naturlig at de kildene som validerer det ikke er interesserte parter. Et selskap som f.eks selger myggspray er ikke en nøytral kilde; det er til fordel for dem som bekymrer seg i en myggpandemi.
Vi lever i et veldig priviligerte samfunn hvor vi har tilgang til en rekke kilder. Noen steder, f.eks i Russland akkurat nå er det en utfordring å sjekke og validere data. Blir Ukraina invadert, eller blir de befridd fra et naziregime? Når det er skapt av store, mektige organisasjoner som regjeringer og andre med mye makt og penger. Kan det være vanskelig å verifisere desinformasjonen, fordi de kan vises i en rekke kilder, det er derfor viktig å være skeptisk til tider.
Bekreft konteksten
Data er ubrukelig uten kontekst. Se for deg at du hører at et lokalt selskap ansatte 50 personer i fjor. Det er bra greier! Men uten å kjenne til konteksten er det umulig å vite om det stemmer eller ikke. Hva om de 50 personene ble ansatt i januar, men i februar ble halvparten permittert? Hva om halvparten var ansatt deltid eller at de jobbet fjernarbeid fra andre land enn hjemme.
Når du analyserer forretningsdata, er det avgjørende å sjekke om konteksten stemmer. Det gjøres vanligvism ved å se på en rekke beregninger som vil kunne gi det sanne bildet. F.eks forteller ikke profitt i seg selv hele historien. Et sunt ett års overskudd kan være resultat av en stor engangsmulighet, eller permitteringer som reduserte utgiftene.
Bare ved å forsgtå konteksten vil få deg til å forstå data. For å forstå det må du stille spørsmåk, v ære skeptisk og se etter bevisende informasjon.
Valider hvordan og når informasjonen ble samlet inn
Hvis du er sulten og du ser et skilt utenfor en restaurant du aldri har testet ut, “Kåret til den beste restauranten i Oslo” vil det høres ut som en god anbefaling. Vent litt nå!
Vet du egentlig hvem som stemte? Fikk eieren av restauranten kun familie og venner til å gjøre det, eller var det en avstemmning i hele Oslo? Når ble det isåfall holdt? I år eller fem år siden? Hvor lenge har restauranten drevet buisnessen? Hvem foretok avstemmningen? Restauranten selv? Hvordan informasjonen samles inn er enormt viktig. Se alltid etter datoen, tidsrommet og hvordan dataen ble samlet inn. Hva slags undersøkelser ble gjort, var det ved direkte ovservasjon eller gjennom en spesifikk maskin? Spør spørsmål, og forstå svarene.
Valider hvordan dataen presenteres

La oss si at en undersøke gjort av 100 personer viser at 99 av dem var fornøyd med en såpe, hvor den ene mislikte såpen fordi den ga allergisk reaksjon. I det tilfelle er begge disse overskriftene gyldige.
“Såpe som er overveldene godkjent av brukere”
“Såpe, kilden til sterk allergisk reaksjon”
Forestill deg at hver av overskriftene er publisert på instagram, og i det første tilfellet vil såpen bli oppfattet som positivt, mens det andre negativt. Samme informasjonen, forskjellige perspektiver.
Når du ser på diagrammer og garfer, vær oppmerksom på kumulative data, forstå skalaen til aksen, og om det har blitt brukt ujevninger eller trender. Det vil visuelt endre tolkningen av resultatene. Når du forstår data, er det viktig å se forbi hvordan det presenteres. Data i seg selv er nøytralt, det er verken der eller her. Måten den presenteres på kan endre hvordan den oppfattes.
Kalibrer på nytt
Så du har nå validert “Kåret til den beste restauranten i Oslo” stedet- og oppdaget at avstemmningen var en ligitm, byomfattende undersøkelse fra et uinteressert parti. Men følg med på datene med jevne mellomrom. Kanskje, etter seks måneder oppdager noen at den opprinnelige undersøkelsedn var en svindel. Kanskje restauranen mister kokken og ender opp med å bli bøtelagt for brudd på mattilsynet. Eller kanskkje den en dag for en Michelin-stjerne?
Med alle typer data kan det dukke opp ny informasjon som endrer det. Feil blir avdekket og rettet, og priser settes. Sjekk, og sjekk på nytt for å sikre at data du bruker fortsatt betyr det du trodde det betydde. Dette er en del av den vitenskapelige forskningsprossessen, feil peker forskning i nye retninger. Å ombestemme seg på grunnlag av nytt funn er positivt.

Er du bevisst på bias?
“Biler utestenges fra hovedgaten i sentrum” kan oppfattes som både gode nyheter for fotgjengere, og dårlig for sjåfører. Når vi prøver å forstå data, må vi være oppmerksomme på skjevheter- altså vår egen og personene som samlet inn eller prestenterte dataene.
Å forstå ens ene bektreftelsesfordommer er ofte en utfordring. For å få den sanne verdien av data, må vi være bevisste på vårt “ønskede resultat” og sørge for at det ikke forstyrrer vår evne til å lese og forstå dataene.
Hvis du deler data på sosiale medier, er det viktig å forstå hvorfor du gjør det. Vil det hjelpe, informere eller skade? Deling er ikke en nøytral handling, men en refleksjon av dine egne skjevheter og ønsker.

Kom deg ut av ekkokammeret ditt
Klikk på epler og algoritmer på sosiale medier vil gi deg flere epler. Klikker du på appelsiner, vil du få flere appelsiner. Det er så enkelt som det. Men etter en stund ser eplepersonen bare epler, og appelsinpersonen bare appelsinen. Det er ikke bra. For å forstå data bedre, må du aktivt søke nye perspektiver. Det betyr å finne kilder utenfor komfortsonen din og vurdere disse åpent og rasjonelt.
Data og tillit
I begynnelsen av innlegget forteller Alan at han ikke har fasit på beskymringer og sinne rundt data, og konkluderer med at han fortsatt sliter med hvorfor et økende antall mennesker føler seg uhørt og ikke verdsatt. Hvorfor foretrekker de å trekke inn sitt eget sinne fremfor å sjekke fakta?
Men en ting er at data alene ikke er det som gir gjenklang hos folk. Historie, sann eller usann, er det akkurat det folk forholder seg til, husker og gjenforteller. data blir kratige når de blir brukt til å lage overbevisende historier. Tillit til data er sentralt for vår evne til å handle på alle spørsmålene rundt det som skjer i verden, og diskutere blandt mange mennesker vi kommer til å møte på. Vi har nådd et punkt hvor vår overleving- som individer og som sanfunn- vil avhenge av hvilke historier vi tror på, og hvilke vi forkaster. Hvis vi ikke er enige, hvordan kan vi noen gng stole på hverandre nok til å leve i harmoni?

Kilder