Afgelopen week ging er een bericht rond op social media dat mij inspireerde iets te schrijven over data en de interpretatie ervan. Tijdens het schrijven kwam ik op zoveel mogelijke fouten in interpretaties en zelfs (onbedoelde) misleidingen, dat ik niet alles kwijt kan in één blog. Daarom heb ik bedacht een serie te starten ‘Dansen met Data’.

Pseudo Patronen

Het eerste onderwerp in die serie is aansluitend op de genoemde post, het vinden van patronen waar die (mogelijk) helemaal niet zijn: Pseudo Patronen. In de statistiek ook wel een type I fout genoemd, in de categorie apofenie.

Het linker rijtje in het onderstaande figuur heeft het it was het bericht dat opviel. Hier staat het lijstje van besmettingen en overledenen opgesomd. Met een vergelijkbaar beginpunt bij aantal besmettingen en overledenen. Maar toch een net andere verhouding.

Dit bericht werd uitstekend ontleed door het AD in het bericht Staatje met cijfers van Nederland en Italië: Wat zeggen kenners erover? door Marcia Nieuwenhuis en Raymond Boere. Wat iedereen mogelijk veel heeft geholpen in het duiden van de informatie. Het maakt namelijk veel verschil welk lijstje je kiest om te vergelijken.

Maar dit soort pseudo patronen komen vaker langs en in verschillende vormen. Daarover later meer.

Discussieer mee!