Datensatzdokumentation
Robert Koch-Institut | RKI
Nordufer 20
13353 Berlin
Beitragende
Michaela Diercke¹, Justus Benzler¹, Alexander Ullrich¹ und Eberhard Pape²
¹ Robert Koch-Institut | Fachgebiet 32
² Robert Koch-Institut | Fachgebiet IT 4
Zitieren Robert Koch-Institut (2024): Laborbestätigte Influenzafälle in Deutschland. [Dataset] Zenodo. DOI:10.5281/zenodo.14557220.
Im Datensatz "Laborbestätigte Influenzafälle in Deutschland" werden die wöchentlichen Fallzahlen und Inzidenzen (Fälle pro 100.000 Personen) der nach den Vorgaben des Infektionsschutzgesetzes (IfSG) von den Gesundheitsämtern in Deutschland an die zuständigen Landesbehörde und das Robert Koch-Institut (RKI) übermittelten laborbestätigten Influenzafälle bereitgestellt.
Die zugrundeliegenden Daten werden im Rahmen des Meldesystems gemäß IfSG erhoben und verarbeitet. Zuständig für die fachliche Umsetzung des Meldesystems ist das Fachgebiet 32 | Surveillance und elektronisches Melde- und Informationssystem (DEMIS) | ÖGD-Kontaktstelle des RKI.
Die Verarbeitung und Aufbereitung der im Meldesystem vorliegenden Rohdaten erfolgt durch das Fachgebiet IT4 | Softwarearchitektur und -entwicklung.
Die Veröffentlichung der Daten, die Datenkuration sowie das Qualitätsmanagement der (Meta-)Daten erfolgen durch das Fachgebiet MF 4 | Fach- und Forschungsdatenmanagement. Fragen zum Datenmanagement und zur Publikationsinfrastruktur können an das Open-Data-Team des Fachgebiets MF4 unter OpenData@rki.de gerichtet werden.
Das RKI ist ein Bundesinstitut im Geschäftsbereich des Bundesministeriums für Gesundheit (BMG) und ist die zentrale Einrichtung des Bundes auf den Gebieten der Krankheitsüberwachung und -prävention sowie der anwendungsorientierten biomedizinischen Forschung. Es berät die zuständigen Bundesministerien, insbesondere das Bundesministerium für Gesundheit, und wirkt bei der Entwicklung von Normen und Standards mit. Wesentliche Aufgaben des RKI leiten sich aus dem Infektionsschutzgesetz (IfSG) ab. Dazu gehört neben der in § 4 Abs. 1 IfSG beschriebenen Aufgabe der „Vorbeugung übertragbarer Krankheiten sowie zur frühzeitigen Erkennung und Verhinderung der Weiterverbreitung von Infektionen“ auch die Erstellung von „Falldefinitionen für die Bewertung von Verdachts-, Erkrankungs- oder Todesfällen und Nachweisen von Krankheitserregern“ (vgl. § 11 Abs. 2 IfSG).
Das Infektionsschutzgesetz hat den Zweck, der Übertragung von Krankheiten beim Menschen vorzubeugen und Infektionen frühzeitig zu erkennen sowie die Verbreitung dieser zu verhindern. Es regelt, welche Krankheiten bei Verdacht, Erkrankung oder Tod und welche Nachweise von Krankheitserregern meldepflichtig sind. Zusätzlich wird neben der Art der zu meldenden Krankheit auch festgelegt, welche Personen zur Meldung verpflichtet sind, welche Merkmale solch eine Meldung enthalten muss, an wen diese Meldung erfolgen muss und welche Fristen eingehalten werden müssen.
Dem Gesundheitsamt wird gemäß § 7 Abs. 1 Nr. 25 IfSG nur der direkte Nachweis von Influenzaviren, soweit er auf eine akute Infektion hinweist, namentlich gemeldet.
Gemäß § 11 Abs. 2 IfSG hat das RKI die Aufgabe, Falldefinitionen zu erstellen, die die Kriterien für die Übermittlung von Meldedaten vom Gesundheitsamt an die zuständige Landesbehörde und von dort an das RKI festlegen. Die Falldefinitionen haben zum Ziel, bundesweit einheitliche Kriterien im Rahmen der epidemiologischen Überwachung von Infektionskrankheiten sicherzustellen. Damit sollen sie zu standardisierten Bewertungen, aussagekräftigeren Statistiken und letztlich objektiveren Entscheidungen beitragen.
Die Falldefinitionen ändern sich in unregelmäßigen Abständen in Abhängigkeit von politischen Entscheidungen oder durch neue wissenschaftliche Erkenntnisse und werden auf der Website des RKI veröffentlicht. Die Falldefinition orientiert sich dabei an den drei Evidenztypen:
Klinisches Bild
- Aufführung von klinischen Symptomen, Zeichen, Befunden und anamnestischen Angaben, die je nach Übermittlungskategorie einzeln oder in Kombination zutreffen müssen
Labordiagnostischer Nachweis
- Aufführung von direkten, indirekten und anderen Nachweisen, die je nach Übermittlungskategorie einzeln oder in Kombination zutreffen müssen
Epidemiologische Bestätigung
- Explizite Nennung von epidemiologischen Zusammenhängen und epidemiologisch bestätigten Expositionen
Diese Evidenztypen werden zu einer von fünf Falldefinitionskategorien zusammengefasst. Aus den Falldefinitionskategorien leitet sich für jede Krankheit die jeweilige Referenzdefinition ab. Diese legt fest, welche übermittelten Fälle in den Veröffentlichungen des RKI erscheinen. In den Kontextmaterialien des Datensatzes ist die Falldefinition und die darin enthaltene Referenzdefinition für Influenza zu finden.
Der Datensatz enthält dabei nur Daten zu laborbestätigten Influenzafällen (Kategorien C, D und E) nach der Falldefinition (Influenzavirus, human oder pandemisch).
Die Meldung an das Gesundheitsamt hat gemäß §14 IfSG elektronisch zu erfolgen. Die Spezifikationen für die elektronische Meldung sind im Implementierungsleitfaden beschrieben: https://simplifier.net/guide/implementierungsleitfadenfrdemis?version=current
Die im Gesundheitsamt eingehenden Meldungen werden weitestgehend automatisiert in der Gesundheitsamtssoftware weiterverarbeitet, durch weitere Ermittlungen ggf. vervollständigt, gegebenenfalls werden mehrere Meldungen zum selben Fall zusammengeführt und dort gemäß Falldefinition bewertet. Erfüllt ein Fall die Falldefinition des RKI, müssen die Daten vom zuständigen Gesundheitsamt spätestens am nächsten Arbeitstag elektronisch an die zuständige Landesbehörde und von dort spätestens am nächsten Arbeitstag an das RKI übermittelt werden. Der Umfang der an das RKI übermittelten Daten ist in § 11 IfSG festgelegt. Dies beinhaltet demografische und epidemiologische Angaben. Im Verlauf einer meldepflichtigen Infektion kann zwischen verschiedenen Kennzeitpunkten unterschieden werden:
- Erkrankungsdatum des Falls
- Datum der Meldung, z.B. von Laboren, Krankenhäusern oder Ärzt:innen
- Meldedatum, Eingang/Eingabe im Gesundheitsamts
- Übermittlungsdatum nach IfSG
- Erfassungsdatum des Falls am RKI
In den Statistiken des RKI wird in der Regel das Meldedatum verwendet. Das Meldedatum ist das Datum, an dem das GA Kenntnis von dem Fall erlangt und ihn als solchen anlegt. Mit Einführung der elektronischen Meldung liegen das Datum der Meldung (z.B. durch das Labor) und das Meldedatum (Erfassung Fall im Gesundheitsamt) eng beeinander. Entgegen den gesetzlichen Vorgaben kann es dazu kommen, dass die Meldung an das Gesundheitsamt oder die Übermittlung des Falls an die zuständige Landesbehörde oder von dort an das RKI verzögert erfolgt. Dies wird allgemein als Melde- und Übermittlungsverzug bezeichnet.
Der Datensatz enthält epidemiologische Daten über den Verlauf der laborbestätigten Influenzafälle in Deutschland. Abweichend von den in anderen RKI-Veröffentlichungen gemachten Angaben zu Influenzafällen werden in diesem Datensatz nur die laborbestätigten Influenzafälle gezählt. Klinisch-epidemiologisch bestätigte Fälle werden nicht berücksichtigt. Dadurch kann es zu Abweichungen von anderen RKI-Veröffentlichungen kommen. Genauere Informationen finden sich im Abschnitt Falldefinition.
Im Datensatz enthalten sind:
- Fallzahlendaten und Inzidenz mit wöchentlichen Meldungen von Influenzavirus-Infektionen
- Datensatzdokumentation in deutscher Sprache
- Kontextmaterialien zur Datenpublikation
- Metadaten zur Datenpublikation
- Lizenz Datei mit der Nutzungslizenz des Datensatzes
Zentrales Datum des Datensatzes sind die aktuellen Fallzahlen der laborbestätigten Influenzafälle. Diese sind im Hauptverzeichnis unter "IfSG_Influenzafaelle.tsv" abrufbar und werden wöchentlich überschrieben.
Die Fallzahlendaten bilden den wochenaktuellen Datenstand, Mittwoch 0:00 Uhr, aller bisherig übermittelten Influenzafälle in Deutschland ab. Das bedeutet, dass alle bis 24:00 Uhr des Vortrages von den Gesundheitsämtern, über die zuständigen Landesbehörden, an das RKI übermittelten Influenzafälle im Datenstand enthalten sind. Die Daten werden wöchentlich vollständig neu erzeugt und dieser Datenstand ersetzt den vorherigen Datenstand.
Die Publikation der Daten erfolgt planmäßig Donnerstags zusammen mit der aktuellen Ausgabe des Epidemiologisches Bulletins des RKI.
In den Fallzahlen differenzieren die Spalten nach verschiedenen Merkmalen einer Fallgruppe. Pro Zeile ist eine eineindeutige Fallgruppe abgebildet. Fallgruppen werden durch folgende Eigenschaften charakterisiert (in den Klammern finden sich die Merkmale dieser Eigenschaften):
- Zeitlicher Verlauf (Meldewoche)
- Geografische Zuordnung (Region, Region_Id)
- Personengruppe (Altersgruppe)
- Mächtigkeit der Gruppe (Anzahl, Inzidenz pro 100.000)
Die Datei IfSG_Influenzafaelle.tsv enthält die in der folgenden Tabelle abgebildeten Variablen und deren Ausprägungen. Ein maschinenlesbares Datenschema ist im Data Package Standard in tableschema_IfSG_Influenzafaelle.json hinterlegt:
Variable | Typ | Ausprägungen | Beschreibung |
---|---|---|---|
Meldewoche | date | Format: YYYY-Www |
Kalenderwoche, in der der Fall dem Gesundheitsamt bekannt geworden ist. JJJJ entspricht der Jahresangabe,Www entspricht der Wochenangabe nach ISO 8601 (beispielsweise 2021-W34 für die 34. Kalenderwoche des Jahres 2021) |
Region | string | Werte: Baden-Württemberg , Bayern , Berlin , Brandenburg , Bremen , Hamburg , Hessen , … |
Name der Bezugsregion, Bundesländer bzw. gesamt Deutschland |
Region_Id | string | Werte: 01 , 02 , 03 , 04 , 05 , 06 , 07 , …Fehlende Werte: NA |
ID nach dem Amtlichen Gemeindeschlüssl. Zusätzlich 00 für gesamt Deutschland und NA für unbekannt |
Altersgruppe | string | Werte: 00-14 , 15-59 , 60+ , 00+ , Unbekannt |
Altersspanne der in der Gruppe enthaltenen Fälle |
Fallzahl | integer | Werte: ≥0 |
Anzahl der Fälle in der Fallgruppe |
Inzidenz | number | Fehlende Werte: NA |
Anzahl der Fälle pro 100.000 Personen bezogen auf die Gesammtbevölkerung der Fallgruppe (NA , falls Altersgruppe oder Region unbekannt sind) |
Die Daten sind im Datensatz als tabulatorseparierte .tsv-Datei enthalten. Der verwendete Zeichensatz der .tsv-Datei ist UTF-8. Trennzeichen der einzelnen Werte ist ein Tabulator [tab]. Datumsangaben sind im ISO-8601-Standard formatiert.
- Zeichensatz: UTF-8
- Datumsformat: ISO 8601
- .tsv-Trennzeichen: Tabulator [tab]
Zur Erhöhung der Auffindbarkeit sind die bereitgestellten Daten mit Metadaten beschrieben. Über GitHub Actions werden Metadaten an die entsprechenden Plattformen verteilt. Für jede Plattform existiert eine spezifische Metadatendatei, diese sind im Metadatenordner hinterlegt:
Versionierung und DOI-Vergabe erfolgt über Zenodo.org. Die für den Import in Zenodo bereitgestellten Metadaten sind in der zenodo.json hinterlegt. Die Dokumentation der einzelnen Metadatenvariablen ist unter https://developers.zenodo.org/representation nachlesbar.
In der zenodo.json ist neben der Publikationsdatum ("publication_date"
) auch der Datenstand enthalten:
"dates": [
{
"start": "2023-09-11T15:00:21+02:00",
"end": "2023-09-11T15:00:21+02:00",
"type": "Collected",
"description": "Date when the Dataset was created"
}
],
Offene Forschungsdaten des RKI werden auf Zenodo.org, GitHub.com, OpenCoDE und Edoc.rki.de bereitgestellt:
- https://zenodo.org/communities/robertkochinstitut
- https://github.com/robert-koch-institut
- https://gitlab.opencode.de/robert-koch-institut
- https://edoc.rki.de/
Der Datensatz "Influenza-Infektionen in Deutschland" ist lizenziert unter der Creative Commons Namensnennung 4.0 International Public License | CC-BY .
Die im Datensatz bereitgestellten Daten sind, unter Bedingung der Namensnennung des Robert Koch-Instituts als Quelle, frei verfügbar. Das bedeutet, jede Person hat das Recht, die Daten zu verarbeiten und zu verändern, Derivate des Datensatzes zu erstellen und sie für kommerzielle und nicht kommerzielle Zwecke zu nutzen. Weitere Informationen zur Lizenz finden sich in der LICENSE bzw. LIZENZ Datei des Datensatzes.