Préparation des données

Le Data Warehouse de MétéoSuisse prépare les données de mesure pour les utilisateurs et les soumet à un contrôle systématique et permanent. Il comble les lacunes des mesures, calcule des paramètres complémentaires et apporte des corrections. Le contrôle de qualité se déroule par étapes.

L'ensemble des données de mesure sont regroupées dans le Data Warehouse (DWH) afin de les sauvegarder à long terme sous une forme homogène. Une fois les données stockées dans le système, elles passent par différents processus de préparation. Plus les données de mesures sont anciennes, plus les calculs, les contrôles de qualité et les modifications apportées auront été nombreux. Le processus de préparation complet ne s'applique pas à chaque série de données. Tout dépend de l'exploitation qui sera faite des données et du programme de traitement précis. Les principales étapes sont le calcul de paramètres complémentaires, le comblement des lacunes et l'apport de corrections.

Calculs

  • Calculs temporels: Il est possible de calculer des sommes horaires, journalières, mensuelles et annuelles à partir des valeurs enregistrées toutes les dix minutes.
  • Calculs spatiaux: Pour un secteur défini, on intègrera les valeurs collectées depuis les stations de mesures qui s'y trouvent afin d'établir une valeur de secteur.
  • Paramètres complémentaires: on calcule d'autres paramètres comme l'indice de fœhn, les codes météo actuels, l'humidité relative de l'air ou la pression atmosphérique réduite au niveau de la mer.

 

Comblement des lacunes

  • Méthode manuelle: la connaissance des conditions météorologiques permet de combler manuellement certaines lacunes. Les valeurs complétées sont marquées afin de pouvoir comprendre par la suite comment elles sont apparues et, plus tard encore, de les remettre en question.
  • Méthode automatique: les lacunes temporelles relativement brèves à une station sont automatiquement comblées par interpolation. Les données sont également marquées. L'importance admissible de la lacune dépend du paramètre mesuré. Pour la pression atmosphérique, des lacunes plus conséquentes peuvent être réparées automatiquement, ce qui n'est pas le cas des précipitations: en effet, la pression atmosphérique varie moins dans le temps et l'espace que les précipitations.

 

Correction des valeurs mesurées erronées ou non plausibles

Le DWH vérifie automatiquement si les valeurs mesurées sont plausibles. Les règles suivantes s'appliquent alors:

  • Si une valeur est physiquement impossible (par exemple, une pluviométrie négative), il s'agit d'une erreur.
  • Si certains seuils climatologiques sont dépassés (par exemple, si la température indiquée en février à Zurich est de 25 °C), tout porte à penser que les mesures sont fausses.
  • On peut également avoir quelques doutes quand un paramètre, comme la température, reste constant sur une assez longue durée ou présente des variations brusques sur une courte période. Ces mesures ne sont cependant pas systématiquement fausses. En cas de brouillard par exemple, la température change très peu, alors que le fœhn peut entraîner un brusque pic de température.
  • Si différents paramètres sont incohérents, comme lorsqu'une station relève à la fois des précipitations et un ensoleillement, c'est qu'il y a erreur. Les données feront alors l'objet d'une analyse approfondie.

Les données de mesures sont soumises à près de 250 tests mathématiques. En moyenne, environ 2% des chiffres sont faux ou discutables. Les chiffres clairement erronés sont automatiquement éliminés de la série de données et, si possible, corrigés à la main. Les chiffres improbables sont automatiquement marqués et vérifiés manuellement.

 

Correction à long terme (homogénéisation)

Les séries de mesure sélectionnées et très importantes sont homogénéisées des mois, voire des années plus tard. Les erreurs systématiques et les écarts de données sont éliminées des séries de mesures et corrigées. Elles peuvent provenir de transferts de stations, d'erreurs instrumentales ou de changements d’instruments. Après ce traitement, les données atteingnent le niveau de qualité le plus élevé.