Datensatzdokumentation
Robert Koch-Institut | RKI
Nordufer 20
13353 Berlin
Luise Goerlitz¹, Kristin Tolksdorf¹, Kerstin Prahm¹, Ute Preuß¹, Walter Haas¹ und Silke Buda¹
¹ Robert Koch-Institut | Fachgebiet 36
Zitieren
Goerlitz L, Tolksdorf K, Prahm K, Preuß U, Haas W und Buda S (2024): COVID-ARE-Konsultationsinzidenz, Berlin:Zenodo. DOI:10.5281/zenodo.14523842
Zur Einschätzung der Krankheitslast symptomatischer Atemwegsinfektionen im ambulanten Bereich wird die Inzidenz der Arztbesuche wegen einer akuten respiratorischen Erkrankung mit zusätzlicher COVID-19-Diagnose pro 100.000 Einwohner mithilfe von Daten aus dem SEEDARE-Modul der Arbeitsgemeinschaft Influenza wöchentlich berechnet (COVID-ARE-Konsultationsinzidenz). Zeitnahe und valide Daten über die Häufigkeit von akuten Atemwegserkrankungen mit COVID-19 sind essenziell für die Einschätzung der epidemiologischen Lage und die Anpassung der Maßnahmen während der COVID-19-Pandemie.
Die zugrundeliegenden Daten werden von den Sentinel-Praxen über das SEEDARE-Modul im Arztinformationssystem elektronisch erfasst und an das Robert Koch-Institut (RKI) übermittelt. Die Konzeptionierung der Datenerhebung, das Datenmanagement, die Validierung der Daten und die fachliche Bewertung der Ergebnisse erfolgen im Fachgebiet 36 | Respiratorisch übertragbare Erkrankungen des RKI.
Die Veröffentlichung der validierten und aufbereiteten Daten, die Kuration sowie das Qualitätsmanagement der Meta-Daten erfolgt durch das Fachgebiet MF 4 | Fach- und Forschungsdatenmanagement. Fragen zum Datenmanagement können an das Open Data-Team des Fachgebiets MF4 gerichtet werden OpenData@rki.de.
Die syndromische Surveillance akuter respiratorischer Erkrankungen informiert über die aktuelle Krankheitsschwere und -häufigkeit. Dafür werden zeitnah erregerübergreifend akute Atemwegsinfektionen anhand von Symptomen bzw. den entsprechenden ärztlichen Diagnosen direkt an das RKI berichtet. Die syndromische Surveillance beruht auf systematisch und strukturiert erfassten Daten aus einer Stichprobe z.B. aus Arztpraxen (Sentinel).
In Deutschland erfolgt die syndromische Surveillance akuter Atemwegserkrankungen im ambulanten Bereich durch die Arbeitsgemeinschaft Influenza (AGI) des RKI. Dabei engagieren sich Praxen der Primärversorgung (Hausarzt- und Kinderarztpraxen) über ihre Arbeit im individualmedizinischen Bereich hinaus unentgeltlich für diesen bevölkerungsbezogenen Ansatz der Krankheitsüberwachung, -prävention und -kontrolle. Die Ergebnisse der Arbeitsgemeinschaft Influenza tragen seit Jahren zum Verständnis der Epidemiologie der Influenza und weiterer respiratorischer Erreger sowie zur Entwicklung von Präventionsstrategien bei.
Zur Stärkung der syndromischen Surveillance hat das RKI neben dem klassischen Meldeweg (per Fax oder Online-Eingabe) das "Sentinel zur Elektronischen Erfassung von Diagnosecodes Akuter Respiratorischer Erkrankungen" etabliert (SEEDARE). Der Vorteil des SEEDARE-Systems wird unter anderem in der geringen Arbeitsbelastung für Ärzt:innen und das Praxispersonal gesehen, da es sich um eine automatisiertes Erfassungssystem handelt. Das RKI stellt dafür eine Schnittstelle zur Verfügung, womit syndromische Surveillancedaten direkt über das Arztinformationssystem elektronisch erfasst und an das RKI übermittelt werden können, sodass keine separate Dokumentation mehr notwendig ist. Dadurch kann die zeitnahe und stabile Datenerfassung zum Beispiel auch während einer Pandemie gewährleistet werden.
Bei den Daten handelt es sich um fallbasierte anonymisierte Daten von gesetzlich versicherten Patient:innen mit einer akuten Atemwegserkrankung, die infolge einer ärztlichen Konsultation diagnostiziert wurde. Die Datensätze erhalten eine zufallsgenerierte, eindeutige Patient:innen-ID, eine Re-Identifizierung ist damit nicht mehr möglich. Für alle Patient:innen mit einer akuten respiratorischen Erkrankung werden Alter, Geschlecht, Konsultationsdatum und die jeweiligen ICD-10-Codes erhoben. Zusätzlich werden Angaben erfasst, ob eine Arbeitsunfähigkeit vorlag, eine Krankenhauseinweisung erfolgte oder der/die Patient:in in derselben Praxis eine Grippeschutzimpfung erhalten hat. Zusätzlich wird die aggregiert Anzahl aller Patient:innen nach Altersgruppen erfasst, die sich an einem Tag in der Praxis vorgestellt haben. Diese Daten werden von den Sentinel-Praxen als verschlüsselte Datei exportiert und an das RKI übermittelt.
Weitere Informationen zum SEEDARE-Modul sind in der Schnittstellendokumentation und der Bedienungsanleitung enthalten unter:
https://www.rki.de/DE/Content/Institut/OrgEinheiten/Abt3/FG36/SEED.pdf https://influenza.rki.de/Content/Bedienungsanleitung_CGM-Assist_SEEDare.pdf
Zur Einschätzung der Krankheitslast symptomatischer Erkrankungen im ambulanten Bereich wird die Inzidenz der Arztbesuche wegen einer akuten respiratorischen Erkrankung mit COVID-19 wöchentlich mithilfe der SEEDARE-Daten berechnet (COVID-ARE-Konsultationsinzidenz). Dabei werden ICD-10-Code-basierte Daten von Patient:innen mit akuter Atemwegserkrankung (J00 – J22, J44.0, B34.9) und zusätzlicher COVID-19-Diagnose (U07.1) erfasst. Die Berechnung der COVID-ARE-Konsultationsinzidenz erfolgte wie von Goerlitz et al. (2021) beschrieben.
Goerlitz L, Cai W, Tolksdorf K, Prahm K, Preuß U, Wolff T, Dürrwald R, Haas W, Buda S: ICD-10-Code-basierte syndromische Surveillance akuter Atemwegserkrankungen mit COVID-19 im ambulanten Bereich Epid Bull 2021;30:3 -10 | DOI: 10.25646/8849
Goerlitz L, Tolksdorf K, Buchholz U, Prahm K, Preuß U, an der Heiden M, et al. Überwachung von COVID-19 durch Erweiterung der etablierten Surveillance für Atemwegsinfektionen. Bundesgesundheitsblatt-Gesundheitsforschung-Gesundheitsschutz. 2021:1-8. | DOI: 10.1007/s00103-021-03303-2
Köpke K, Prahm K, Buda S, Haas W. Evaluation einer ICD-10-basierten elektronischen Surveillance akuter respiratorischer Erkrankungen (ARE) in Deutschland. Bundesgesundheitsblatt-Gesundheitsforschung-Gesundheitsschutz. 2016;59(11):1484-91. | DOI: 10.1007/s00103-016-2454-0
Die Daten haben zwar eine eingeschränkte geografische Auflösung, sie erlauben jedoch robuste Aussagen zur Krankheitslast akuter Atemwegserkrankungen mit COVID-19.
Der Datensatz enthält die wöchentliche COVID-ARE-Konsultationsinzidenz, erhoben mithilfe des SEEDARE-Moduls der Arbeitsgemeinschaft Influenza. Im Datensatz enthalten sind:
- wöchentliche Konsultationsinzidenz akuter respiratorischer Erkrankungen mit zusätzlicher COVID-19-Diagnose pro 100.000 Einwohner in Deutschland
- Lizenz-Datei mit der Nutzungslizenz des Datensatzes in Deutsch und Englisch
- Datensatzdokumentation in deutscher Sprache
- Metadaten zur automatisierten Weiterverarbeitung
Die Daten der Konsultationsinzidenz akuter respiratorischer Erkrankungen mit COVID-19 sind nach folgenden Merkmalen differenziert:
- Berichtswoche des RKI
- wöchentliche Konsultationsinzidenz akuter respiratorischer Erkrankungen mit COVID-19
Die Daten werden dienstags im Rahmen der wöchentlichen Berichterstattung ausgewertet. Das bedeutet, dass alle bis dahin im SEEDARE-Modul erfassten und an das RKI übermittelten Daten einfließen. Die Daten sind wöchentlich verfügbar und können durch Nachmeldungen noch ergänzt werden.
Die Datei COVID-ARE-Konsultationsinzidenz.csv enthält die in der folgenden Tabelle abgebildeten Variablen und deren Ausprägungen. Ein maschinenlesbares Datenschema ist im Data Package Standard in tableschema_COVID-ARE-Konsultationsinzidenz.json hinterlegt:
Variable | Typ | Ausprägungen | Beschreibung |
---|---|---|---|
date | date | Format: YYYY-Www |
Berichtswoche des RKI im IS0-8601 Format |
agegroup | string | Werte: 00-04 , 05-14 , 15-34 , 35-59 , 60+ , 00+ |
Altersgruppen in Jahren, 00+ gibt die Gesamtinzidenz über alle Altersgruppen an. |
are_covid19_incidence | number | Werte: ≥0 |
Konsultationsinzidenz akuter respiratorischer Erkrankungen mit COVID-19 |
Die Daten sind im Datensatz als kommaseparierte .csv Datei enthalten. Der verwendete Zeichensatz der .csv Datei ist UTF-8. Trennzeichen der einzelnen Werte ist ein Komma ",".
- Zeichensatz: UTF-8
- .csv Trennzeichen: Komma ","
Zur Erhöhung der Auffindbarkeit sind die bereitgestellten Daten mit Metadaten beschrieben. Über GitHub Actions werden Metadaten an die entsprechenden Plattformen verteilt. Für jede Plattform existiert eine spezifische Metadatendatei, diese sind im Metadaten-Ordner hinterlegt:
Versionierung und DOI-Vergabe erfolgt über Zenodo.org. Die für den Import in Zenodo bereitgestellten Metadaten sind in der zenodo.json hinterlegt. Die Dokumentation der einzelnen Metadatenvariablen ist unter https://developers.zenodo.org/#representation nachlesbar.
In der zenodo.json ist neben der Publikationsdatum ("publication_date"
) auch der Datenstand enthalten:
"dates": [
{
"start": "2023-09-11T15:00:21+02:00",
"end": "2023-09-11T15:00:21+02:00",
"type": "Collected",
"description": "Date when the Dataset was created"
}
],
Offene Forschungsdaten des RKI werden auf Zenodo.org, GitHub.com, OpenCoDE und Edoc.rki.de bereitgestellt:
- https://zenodo.org/communities/robertkochinstitut
- https://github.com/robert-koch-institut
- https://gitlab.opencode.de/robert-koch-institut
- https://edoc.rki.de/
Der Datensatz "COVID-ARE-Konsultationsinzidenz" ist lizenziert unter der Creative Commons Namensnennung 4.0 International Public License | CC-BY 4.0 International
Die im Datensatz bereitgestellten Daten sind, unter Bedingung der Namensnennung des Robert Koch-Instituts als Quelle, frei verfügbar. Das bedeutet, jede:r hat das Recht die Daten zu verarbeiten und zu verändern, Derivate des Datensatzes zu erstellen und sie für kommerzielle und nicht kommerzielle Zwecke zu nutzen. Weitere Informationen zur Lizenz finden sich in der LICENSE bzw. LIZENZ Datei des Datensatzes.