Samenrekenen op het RIVM Deel 3: PM25 Cabauw data en marges

In dit deel wat bespiegelingen over meetfouten en missende data.

We meten iets, maken daarin per definitie een meetfout, een onnauwkeurigheid hoe klein ook, en presenteren het meetresultaat met een foutenmarge.
Wat zijn nu de marges het aantal overtredingsdagen, met name voor ons voorbeeldstation Cabauw ?
Voor het jaargemiddelde stelt het RIVM dat er een fout van 3mmg/m3 is .
Wat betekent een foutmarge van 3ug/m3 op jaarbasis voor de onzekerheid in 24 uurs gemiddelde en daarmee voor de onzekerheid in het aantal overtredingsdagen.?

We gaan, immer vooruitkijkend, weer uit van de toekomstige normen: de voorgestelde EU norm PM25: jaargemiddelde 10mmg/m3 ;dagoverschrijdingen: max 18 dagen > 25mmg/m3

Een fictief voorbeeld1: Stel op dag is het daggemiddelde 23 +/- 3 ug/m3 ,
dan is het aantal overtredingsdagen 0 of 1.
Fictief voorbeeld2: Stel op dag is het daggemiddelde 26 +/- 3 ug/m3 ,
dan is het aantal overtredingsdagen 0 of 1.

Wat de daadwerkelijke fout in de uurmetingen en de berekende daggemiddeldes zijn, in hoeverre dit absolute fouten of relatieve fouten zijn en hoe of je deze al dan niet mag optellen is het onderwerp van een toekomstige blog.

Behalve fouten zien we ook dat de meetdata niet compleet is, er missen gegevens. Niet alleen vanwege onderhoud of random storingen, maar ook bewust ingebouwd: https://www.luchtmeetnet.nl/informatie/componenten/fijn-stof-(pm2.5)

Als de data niet aanwezig is, hoe berekenen je nu een dag of jaar gemiddelde van een enkel station met ontbrekende waardes ? Een enkele missende waarde kunnen we nog zonder al te grote risico’s wel interpoleren tussen bekende metingen net ervoor en net erna.
Maar wat als het missende gat groter is ? Nemen we dan waardes van een in de buurt liggend, gelijk RIVM station ?
We leggen het vergrootglas op Cabauw PM25 2022: totaal missen er 298 uurmetingen op een jaar van 365*24 metingen,
dus niet veel mist er op het totaal aantal wel aanwezige metingen.
Hoeveel maakt dat uit voor een jaarberekening, en de onzekerheid daarin ?

Terzijde :De eu heeft het over 24 uurs data, wij vertalen dat naar gemiddelde dag data. Strict genomen is dat niet hetzelfde

We hebben zoveel metingen dat die paar missende niet zoveel uitmaken:
Rekenvoorbeeld: stel we hebben 355 dagen meetgegevens, die resulteren in een jaar gemiddelde van 10 ug/m3 PM25,
met daarin een fout van 3 ug/m3 (een daadwerkelijke schatting van het rivm (https://www.rivm.nl/bibliotheek/rapporten/2023-0167.pdf alinea 8.1)

De ondergrens wordt dan dat alle 10 missende dagen een PM25 gemiddelde dagwaarde van 0 ug/m3 hebben
De bovengrens stellen we op een PM25 gemiddelde dagwaarde van 50 ug/m3 voor alle dagen.
Voor de jaarondergrens vinden we voor ons voorbeeld dan 9.7 ug/m3, voor de bovengrens 11.1 ipv de 10ug opbasis van de wel aanwezige metingen. Dat zijn geen schokkend grote afwijkingen die vallen binnen de foutmarge van 3ug/m3.

De berekening van het aantal “overtredingsdagen” (de voorgestelde eu norm is dat er maximaal 18 dagen zijn met een gemiddelde pm25 van 25ug ) met de missende dagen een grotere uitdaging:

Als er een hele dag mist, dan zal deze dag zonder correcties, nooit tot een overtredingsdag leiden.Dus dan is de berekening zonder correcties te optimistisch.
Als de helft van een dagmeting mist, dan zou je op basis van de aanwezige data een gemiddelde kunnen berekenen, die in werkelijkheid door de missende data van de andere helft van de dag ofwel omhooggetrokken ofwel omlaaggetrokken kunnen worden. Het kan dan dus twee kanten opgaan, gemiddeld dus goed :slight_smile:

Laten we gewoon eens kijken naar de Cabauw overtredingsdagen in 2022, we vonden (deel 1 ) : 20 overschrijdingsdagen:

In het wit de dagen waarvan geen meetwaardes zijn.

laatste meting voor gat eerste meting na gat gatgrootte in uren
2022-02-26 19:00:00+00:00 2022-03-01 11:00:00+00:00 63
2022-05-19 11:00:00+00:00 2022-05-20 14:00:00+00:00 26
2022-06-22 10:00:00+00:00 2022-06-24 14:00:00+00:00 51
2022-06-27 08:00:00+00:00 2022-06-28 15:00:00+00:00 30

Kijkend naar de uurwaardes en daggemiddeldes van de omliggende dagen, kun je voor het juni gat wel met enige zekerheid concluderen dat er juni geen te hoog daggemiddelde PM25 in Cabauw was.

Voor het gat eind februari treedt er een aardige complicatie op: ervoor was er in Cabauw geen PM25 dagoverschrijding, erna wel. Wat zou de het gemiddelde op 27 en 28 feb zijn ?

Als we kijken naar het dichtstbijzijndst station, Utrecht Griftpark:
https://iq.luchtmeetnet.nl/open_api/measurements?station_number=NL10643&formula=PM25&start=2022-02-26T00:00:00Z&end=2022-03-02T23:59:59Z
Dan zien we dat daar op 27 en 28 februari wel hoge pm2.5 daggemiddeldes zijn, maar niet hoger dan de 25 ug/m3 grens, tsja, wat is dan wijsheid ?

Al met al is mijn voorlopige conclusie dat jaargemiddeldes ook door amateurs goed berekend kunnen worden.
Voor overtredingsdagen moet je aandachtig naar data kijken (dat is zowieso altijd een aanrader), ik ben benieuwd of het RIVM een algemeen werkende automatische procedure heeft .