Zijn de voorgestelde EU normen realistisch? -deel 1 - dagoverschrijdingen en jaargemiddeldes / methode

In het RIVM-briefrapport 2023-0167 (R.J.M. Maas et al., Gevolgen van de voorgestelde Europesche luchtkwaliteitsrichtlijn voor Nederland) wordt de haalbaarheid van de door de EU voorgestelde normen onderzocht. Daarbij wordt gekeken naar zowel daggemiddelden als ook naar jaargemiddelden.
Jaargemiddelden zijn belangrijk als indicatoren voor lange termijn effecten op de gezondheid; daggemiddelden als indicatoren voor korte termijn gemiddelden.

De normen zijn als volgt veranderd:

  • Voor PM10 is de grenswaarde voor het daggemiddelde nu nog 50 µg/m3, maximaal 35 maal te overschrijden. In het EU voorstel wordt dat 45 µg/m3, maximaal 18 maal te overschrijden. Huidige grenswaarde voor het jaargemiddelde is 40 µg/m3, dat wordt nu 20 µg/m3.
  • Voor PM2,5 wordt de grenswaarde voor het daggemiddelde 25 µg/m3, maximaal 18 maal te overschrijden (Nieuwe norm). Huidige grenswaarde voor het jaargemiddelde is 25 µg/m3, dat wordt nu 10 µg/m3.
  • Voor NO2 wordt de grenswaarde voor de daggemiddelde 50 µg/m3, maximaal 18 maal te overschrijden (ook een nieuwe norm). In de bestaande norm is een maximum aantal overschrijdingen van een uurgemiddelde van 200 µg/m3 vastgesteld. Huidige grenswaarde voor het jaargemiddelde is 40 µg/m3, dat wordt nu 20 µg/m3.

Zoals uit bijdragen van Walter Takens al duidelijk is (en onder de aanname van een lognormale verdeling van vervuilingswaardenmeer theoretisch onderbouwd door Joost Wesseling [On the relation between daily exceedances and yearly averages for PM10, 14th Conference on Harmonisation within Atmospheric Modelling for Regulatory Purposes, Kos, Greece, 2011]): er is een relatie tussen dag en jaar gemiddelden.

De aanname van een lognormale verdeling is niet eenvoudig na te gaan (ander onderwerp dan deze bijdrage). Hier kijk ik uitsluitend naar de relatie tussen jaargemiddeldes en de kans op een specifiek aantal dagen overschrijdingen van de norm voor daggemiddelden. De uitkomst van mijn berekeningen geeft de kans dat het aantal overschrijdingen van de daggrens groter is dan het toegestane aantal, gegeven het jaargemiddelde en de daggrens.

De hier gehanteerde aanname is dat de dataset van alle metingen van luchtmeetnet van 2011 t/m 2022 representatief zijn voor het gedrag van de luchtvervuiling nu en in de toekomst. Daar is wellicht wat op aan te merken - de lage jaargemiddeldes komen typisch van meetstations in het noorden en oosten van Nederland, terwijl er forse jaargemiddeldes zijn gemeten bij industrie en drukke wegen.
We gebruiken dus deze dataset. Ik beperk me om de procedure te illustreren tot de PM10 dataset. In een andere bijdrage toon ik ook de resultaten voor PM2.5 en NO2.

Gemiddeldes en het aantal dagen overschrijdingen van de grenswaarden zijn eenvoudig te berekenen, hoewel - er zitten daar dagen in waarbij veel metingen zijn geëlimineerd in de QC van RIVM enb er zitten dagen in dat apparatuur was uitgevallen. Mijn keuze was deze dagen niet mee te nemen in de berekeningen. Als daardoor het aantal dagen in een jaar met x% is verminderd, vermenigvuldig ik het gemeten aantal dagoverschrijdingen met (100)/(100 - x). Metingen van jaargemiddeldes (en aantal dagoverschrijdingen) van jaren met een meetstation waarbij op minder dan 85% van de dagen metingen aanwezig zijn worden niet meegenomen. Omdat de verdeling van dagoverschrijdingen over het jaar ongelijk is zou dat fouten kunnen introduceren - ook al is die fout waarschijnlijk klein.

De PM10 dataset telt zo’n 100 stations. De jaargemiddeldes (in kleurenschaal - geel staat voor ongeveer 10 mmgr/m3 en donkerpaars voor ongeveer 40 mmgr/m3; grijs betekent geen data) zijn te zien in onderstaande heatmap. Elke rij representeert een meetstation, elk kolom is een jaar (van 2011 t/m 2022).


Men kan een crossplot / puntdiagram maken van de jaargemiddeldes en het aantal dagoverschrijdingen ( de daggrens is 45 mmgr/mm3). In onderstaande plot is het jaar van de meting aangegeven als kleur, horizontaal is het gemeten jaargemiddelde, verticaal het gemeten aantal dagoverschrijdingen (na correctie zoals hierboven beschreven).

Duidelijk is dat er een grote spreiding is.
De verdeling van de gegevens kan worden aangegeven door bij elke waarde van het jaargemiddelde de kwantielen te berekenen - een kwantiel is het getal dat een verzameling van getallen verdeelt in twee delen: het deel met de kleinere en het deel met de grotere getallen. De 0,25 kwantiel is de waarde waarbij 25% van de verzameling getallen kleiner is, en 75% groter. Hieronder is de plot van de 0,05, 0,25, 0,50, 0,75 en 0,95 kwantielen als functie van de jaargemiddeldes. Ook het gemiddelde is aangegeven (in blauw, licht gestippeld) - deze scheelt in dit geval niet veel met de 0,5 kwantiel, de mediaan.

In feite geeft de 0,25 kwantiel op deze plot de waarden waarbij 75% van het aantal overschrijdingen groter is dan de bijbehorende waarde op de y-as.
De daggrens mag voor PM10 (en ook voor NO2 en PM2,5) 18 x worden overschreden. Grofweg aflezend van de grafiek heb je een kans van 2,5 % als het jaargemiddelde 20 mmgr/m3 is, een kans van 25 % als het jaargemiddelde 22 mmgr/m3 is, en een kans van 50% als het jaargemiddelde iets onder de 23 mmgr/m3 is.
We kunnen de gegevens in de plot ook anders representeren - met de kans op overschrijding op de y as en met de lijn gelabeld met de toegestane aantal dagen met overschrijdingen. Dit is de plot van wat genoemd wordt de conditional probability P(aantal overschrijdingen | jaargemiddelde). In zo’n representatie kun je dan ook laten zien wat de kansen zijn als er een ander aantal dagen zou zijn toegestaan.
In onderstaande plot de kansen dat voor 12, 15, 18, 21 en 24 dagen de daggrens van 45 mmgr/m3 wordt overschreden.

De groene lijn is de door de EU voorgestelde limiet. Bij een jaargemiddelde van 20 mmgr/m3 is de kans op 18 overschrijdingen per jaar klein, zo’n 10%.

De verschillen tussen de gevonden waardes in de plots van kwantielen en conditional probabilities zijn te wijten aan verschillen in binning - keuze van welke kwantielen wel of niet worden berekend, en keuze welke data bij elkaar worden geveegd om een verdeling te definiëren.

Berekeningen volgens hetzelfde stramien zijn ook gedaan voor NO2 en PM2,5.