Kakediagrammer er onde

Fagfolk mener...

7. desember 2012
Å fremstille data grafisk gjøres av millioner hver dag. Hvordan de visualiseres tenker vi ikke alltid så nøye over. Det burde vi. Det er en egen vitenskap.

Datavisualisering kan være effektfullt. Tross alt sitter ca 70 % av våre sensoriske reseptorer i øyet, kapable til å ta inn 10 millioner bit pr sekund av informasjon. Dette er langt overlegent alle andre sanser. Mennesker er ekstremt gode til å se mønstre, så lenge de presenteres riktig. Med «riktig» menes slik den menneskelige persepsjon fungerer. 

Stephen Few, en av guruene innen feltet, sier at datavisualisering handler om å presentere data visuelt gjennom å benytte attributter som plassering, lengde, form, farge, størrelse og bevegelse for å avdekke mønstre, trender og avvik, som ellers kunne blitt oversett. Vår ubevisste prosessering av visuell informasjon er vesentlig raskere enn den bevisste. Derfor er det nyttig å vite hva slags visualiseringer som vår ubevisste prosessering forstår, og hvilke som skaper utfordringer. 

Dette bringer oss over til de onde kakediagrammene. Kakediagrammer er onde på samme måte som djevelen er ond; de forsøker å lure deg og forkludre din dømmekraft, mens du føler at du tar fullstendig rasjonelle beslutninger. 

Figur 1: Kakediagram

Se på kakediagrammet (figur 1). Hvilken er nest størst? Det er faktisk den rosa kalt «Other». Siden «Apple»-stykket er i forgrunnen får det ekstra pixler og ser større ut. Hvis man droppet 3D og rotasjon så ville det vært litt lettere å se at de var ganske like, men fremdeles ville man ikke se verdiene. Kan man ikke bare legge på dataetiketter, tenker du? Da er du på vei til grafenes ekvivalent til junk food. Må man legge på etiketter så har grafen sviktet deg. Det er ille nok at øynene må hoppe frem og tilbake mellom kaken og forklaringsteksten, som er nok et problem med kakediagrammer. Kakediagrammer med mer enn 3-4 verdier er veldig vanskelige å tolke, og bør unngås. Vi klarer å tolke verdier i kakediagrammer som er 25 %, 50 % eller 75 %, så lenge de starter kl 3, 6, 9 eller 12. Utover det sliter vår visuelle persepsjon med å tolke dem, og de bør droppes. 

Figur 2: Søylediagram

Setter vi derimot disse dataene i et søylediagram, (figur 2), blir det straks mye lettere å se forskjellene i størrelse. Ikke trenger man å bruke unødvendige farger eller etiketter heller. Menneskers persepsjonsevne har store vansker med å tolke relativ størrelse på sirkler på grunn av den πr²-formelen, og stykker av sirkler er enda verre. Vi vil ofte tolke et kakestykkes størrelse forskjellig avhengig av hvor på kaken den sitter. Er kakediagrammet i tillegg i 3D, så blir det enda vanskeligere, da 3D-visualiseringer forvrenger størrelsesforholdet på kakestykkene. 

Det finnes en rekke grelle eksempler på manglende eller uhensiktsmessig visualisering av data der ute. Mange dashboards har et ekstremt dårlig pixel-til-informasjonsforhold, hvor det tilsynelatende har vært viktigst å få det til å se fancy ut, uavhengig av om det faktisk kommuniserer godt til brukeren. 

Dropp de onde kakediagrammene, les litt om faget datavisualisering, og lag bedre dashboards. Det leder til bedre innsikt og riktigere beslutninger. Det finnes til og med egne datavisualiseringsverktøy, men også disse krever at man tar hensyn til hvordan vår visuelle persepsjon fungerer optimalt. 

A fool with a tool is still a fool.