Project KAFE_05 Correlatiedracht

In deze post knopen we twee voorafgaande ideen aan elkaar:

  1. KAFE_02 :kunnen we iets zeggen over de “drachtafstand” van pm2.5 ?
  2. KAFE_04 :we zagen een stevige correlatie tussen twee naast elkaar gelegen citizenscience sensoren vanverschillend merk

Wat als we nu eens iets doen wat wellicht statistisch verantwoord op het randje is ?

We nemen de nederlandse rivm stations en (Pearson)correleren bilateraal twee station tijdseries tegen elkaar alsof het een lineair verband betrof.

De gevonden correlatie zetten we uit tegen de onderlinge afstand, dan we komen tot het onderstaande fraaie plaatje:

Wat je ziet is dat de bovengrens van de correlatie, dus hoe meer twee stations op elkaar lijken,
afneemt met de afstand.

Als je stelt dat een R^2 tenminste 0.5 moet zijn voor een “echte” significante correlatie,
dan kom je, toegegeven, enigszins arbitrair, tot een PM2.5 dracht van ongeveer 50 km.

Een kalibratiealgoritme zou zich wellicht kunnen beperken tot de meest nabije RIVM buurstations

De correlatie van de correlatiefactoren zullen we niet berekenen, we staan al op glad ijs .

Afsluitend, als je puur op afstand sorteert dan zie je in onderstaande top 20 tabel, dat de geclaimde afstand-correlatie relatie niet helemaal waterdicht is, maar toch te mooi om niet te noemen !

  distance station1 station2    R2  MSE      lat1      long1      lat2      long2
      0.4  NL10741  NL10742  0.72  3.6  5.857777  51.841372  5.856938  51.838221
      0.5  NL49553  NL49557  0.69  4.1  4.601986  52.493992  4.599313  52.490052
      0.5  NL10636  NL10643  0.67  3.8  5.124464  52.105031  5.128183  52.101308
      0.6  NL01487  NL01488  0.65  4.1  4.480660  51.891130  4.487590  51.893610
      0.6  NL50004  NL50010  0.78  3.5  5.714750  50.845940  5.718977  50.841053
      1.3  NL49012  NL49016  0.53  4.5  4.887811  52.389983  4.870157  52.393972
      1.5  NL50004  NL50009  0.78  3.6  5.714750  50.845940  5.713820  50.859820
      1.8  NL49570  NL49572  0.65  4.2  4.640531  52.489303  4.628800  52.474400
      1.8  NL10136  NL10138  0.72  3.9  5.970496  50.887960  5.986853  50.900320
      1.8  NL49557  NL49573  0.30  7.6  4.599313  52.490052  4.579343  52.478871
      1.9  NL01493  NL10418  0.75  3.2  4.461360  51.927110  4.479923  51.914233
      2.1  NL50009  NL50010  0.80  3.3  5.713820  50.859820  5.718977  50.841053
      2.2  NL49551  NL49572  0.16  5.6  4.601842  52.463039  4.628800  52.474400
      2.2  NL49007  NL49016  0.62  4.8  4.845233  52.381331  4.870157  52.393972
      2.3  NL49551  NL49573  0.11  8.2  4.601842  52.463039  4.579343  52.478871
      2.3  NL49014  NL49017  0.78  3.2  4.866208  52.359714  4.899700  52.358039
      2.3  NL49553  NL49573  0.28  7.5  4.601986  52.493992  4.579343  52.478871
      2.4  NL01488  NL10418  0.72  3.4  4.487590  51.893610  4.479923  51.914233
      2.5  NL01491  NL01493  0.75  3.8  4.430700  51.938580  4.461360  51.927110
      2.6  NL01487  NL10418  0.65  3.8  4.480660  51.891130  4.479923  51.914233
      2.7  NL49557  NL49572  0.36  5.6  4.599313  52.490052  4.628800  52.474400