Project KAFE_05 Correlatiedracht

In deze post knopen we twee voorafgaande ideen aan elkaar:

 1. KAFE_02 :kunnen we iets zeggen over de “drachtafstand” van pm2.5 ?
 2. KAFE_04 :we zagen een stevige correlatie tussen twee naast elkaar gelegen citizenscience sensoren vanverschillend merk

Wat als we nu eens iets doen wat wellicht statistisch verantwoord op het randje is ?

We nemen de nederlandse rivm stations en (Pearson)correleren bilateraal twee station tijdseries tegen elkaar alsof het een lineair verband betrof.

De gevonden correlatie zetten we uit tegen de onderlinge afstand, dan we komen tot het onderstaande fraaie plaatje:

Wat je ziet is dat de bovengrens van de correlatie, dus hoe meer twee stations op elkaar lijken,
afneemt met de afstand.

Als je stelt dat een R^2 tenminste 0.5 moet zijn voor een “echte” significante correlatie,
dan kom je, toegegeven, enigszins arbitrair, tot een PM2.5 dracht van ongeveer 50 km.

Een kalibratiealgoritme zou zich wellicht kunnen beperken tot de meest nabije RIVM buurstations

De correlatie van de correlatiefactoren zullen we niet berekenen, we staan al op glad ijs .

Afsluitend, als je puur op afstand sorteert dan zie je in onderstaande top 20 tabel, dat de geclaimde afstand-correlatie relatie niet helemaal waterdicht is, maar toch te mooi om niet te noemen !

 distance station1 station2  R2 MSE   lat1   long1   lat2   long2
   0.4 NL10741 NL10742 0.72 3.6 5.857777 51.841372 5.856938 51.838221
   0.5 NL49553 NL49557 0.69 4.1 4.601986 52.493992 4.599313 52.490052
   0.5 NL10636 NL10643 0.67 3.8 5.124464 52.105031 5.128183 52.101308
   0.6 NL01487 NL01488 0.65 4.1 4.480660 51.891130 4.487590 51.893610
   0.6 NL50004 NL50010 0.78 3.5 5.714750 50.845940 5.718977 50.841053
   1.3 NL49012 NL49016 0.53 4.5 4.887811 52.389983 4.870157 52.393972
   1.5 NL50004 NL50009 0.78 3.6 5.714750 50.845940 5.713820 50.859820
   1.8 NL49570 NL49572 0.65 4.2 4.640531 52.489303 4.628800 52.474400
   1.8 NL10136 NL10138 0.72 3.9 5.970496 50.887960 5.986853 50.900320
   1.8 NL49557 NL49573 0.30 7.6 4.599313 52.490052 4.579343 52.478871
   1.9 NL01493 NL10418 0.75 3.2 4.461360 51.927110 4.479923 51.914233
   2.1 NL50009 NL50010 0.80 3.3 5.713820 50.859820 5.718977 50.841053
   2.2 NL49551 NL49572 0.16 5.6 4.601842 52.463039 4.628800 52.474400
   2.2 NL49007 NL49016 0.62 4.8 4.845233 52.381331 4.870157 52.393972
   2.3 NL49551 NL49573 0.11 8.2 4.601842 52.463039 4.579343 52.478871
   2.3 NL49014 NL49017 0.78 3.2 4.866208 52.359714 4.899700 52.358039
   2.3 NL49553 NL49573 0.28 7.5 4.601986 52.493992 4.579343 52.478871
   2.4 NL01488 NL10418 0.72 3.4 4.487590 51.893610 4.479923 51.914233
   2.5 NL01491 NL01493 0.75 3.8 4.430700 51.938580 4.461360 51.927110
   2.6 NL01487 NL10418 0.65 3.8 4.480660 51.891130 4.479923 51.914233
   2.7 NL49557 NL49572 0.36 5.6 4.599313 52.490052 4.628800 52.474400