Open Data im Schweizer Gesundheitswesen

Als Open Data werden Daten bezeichnet, die offen zur Verfügung stehen und von jeder beliebigen Person genutzt, weiterverwendet und weiterverbreitet werden können. Dabei gibt es keine rechtlichen, finanziellen oder technischen Einschränkungen. Unter letzterem ist zu verstehen, dass die veröffentlichten Daten in einem maschinenlesbaren Format zur Verfügung gestellt werden. Dazu zählen beispielsweise Formate wie CSV, JSON oder XML. Dennoch ist heute, insbesondere bei öffentlichen Daten von Regierungsstellen, das dominierende Format PDF oder Excel. Solche Daten weiterzuverarbeiten ist deutlich aufwändiger als beispielsweise Daten im CSV Format, welches einfach maschinell integrierbar ist und keine manuellen Verarbeitungsschritte benötigt. Im Allgemeinen gilt es, die nachfolgenden zehn Prinzipien von Open Data bei einer Veröffentlichung zu beachten:

  1. Vollständigkeit: Alle öffentlichen Daten werden verfügbar gemacht
  2. Primärquelle: Die Daten werden an ihrem Ursprung gesammelt
  3. Zeitnah: Daten werden umgehend zur Verfügung gestellt
  4. Zugänglich: Daten werden allen sowie für diverse Verwendungszwecke bereitgestellt
  5. Maschinenlesbar: Daten sind in einem offenen, strukturierten Format gespeichert
  6. Nicht diskriminierend: Daten sind für alle, ohne Registrierung, verfügbar
  7. Nicht proprietär: Zur Dateninterpretation wird keine proprietäre Software benötigt. 
  8. Freie Lizenz: Daten sind unter einer freien Lizenz veröffentlicht (z.B. Open Government Licence)
  9. Permanent verfügbar: Datenbestände sind permanent online und versioniert verfügbar
  10. Kostenlos: Der Zugriff auf die Daten ist kostenlos

Zur Wahrung des Datenschutzes dürfen auch bei Open Data keine personenbezogene Daten publiziert werden, falls dafür keine Zustimmung abgegeben wurde. Darüber hinaus müssen Informationsschutz, Urheberrechtsbestimmungen sowie Geschäftsgeheimnisse stets beachtet werden.

Jegliche Akteure des öffentlichen Sektors, aber auch Akteure aus privatwirtschaftlichen Unternehmen sowie Hochschulen und Non-Profit-Organisationen, können oder sollen ihre Daten als Open Data veröffentlichen. Bei Open Government Data (OGD) hingegen handelt es sich nur um Daten des öffentlichen Sektors. Hier wird das Konzept Open Government mit den Konzepten Open Data und Government Data verbunden.

Es gibt diverse Argumente für Open (Government) Data. Beispielsweise können die Daten mittels (Teil-)Finanzierung durch öffentliche Gelder generiert werden. Deswegen müssen solche Daten auch öffentlich zugänglich sein. Durch Zweitnutzung der Daten kann wirtschaftliches Potenzial ausgeschöpft werden. Weltweit liegt dieses Potenzial bei 3 Billionen US Dollar (Schätzung des McKinsey Global Institute, 2013) und innerhalb der EU bei 140 Milliarden Euro (Schätzung der European Commission, 2011). Die Studie “Wirtschaftliche Auswirkungen von Open Government Data” (im Auftrag des Bundesarchivs, 2013) schätzt für die Schweiz einen jährlichen Wertschöpfungsanteil aus OGD in der Höhe von CHF 0.9 – CHF 1.2 Milliarden. 

Als Grundlage für OGD in der Schweiz gilt das Öffentlichkeitsgesetz inkl. Öffentlichkeitsverordnung. Dieses ist seit dem 1. Juli 2006 in Kraft. Damit wurde ein Paradigmenwechsel vom Prinzip einer Geheimhaltung mit Vorbehalt zur Öffentlichkeit zum Prinzip Öffentlichkeit mit Vorbehalt zur Geheimhaltung markiert.

An diesen Ansatz knüpft auch die aktuelle OGD Strategie Schweiz 2019 – 2023. Das Hauptziel dieser zweiten OGD Strategie ist, dass ab dem Jahr 2020 alle Bundesstellen Ihre neuen Verwaltungsdaten als offene, freie und maschinell lesbare Daten (eben als Open Government Data) auf dem zentralen Portal opendata.swiss verfügbar machen (per Verpflichtung). Die strategische Orientierung ist somit auch hier «open data by default». Damit soll die Schweiz vertrauenswürdige Datenräume für alle Interessierten schaffen. 

Bei opendata.swiss handelt es sich in der Regel nicht um eine Primärquelle (siehe Prinzip zwei der zehn Prinzipien von Open Data) . Auf der zentralen Plattform werden von Bund, Kantonen und Gemeinden Datensätze aus verschiedenen Bereichen (Gesundheit, Verkehr, Tourismus, etc.), nach der eigentlichen Publikation an anderen Stellen, zusammengeführt. Damit stellt opendata.swiss eine Sekundärquelle dar.

Bisher konnte die Plattform nicht ganzheitlich überzeugen.  Beispielsweise kritisiert die NZZ in ihrem Artikel Open-Data: eine Strategie für den Papierkorb die Seite werde zu wenig gepflegt, biete zu wenig Inhalt und bereits vorhandene Daten seien häufig veraltet.
Unter der Rubrik “Gesundheit” sind aktuell  lediglich 289 Datensätze vorhanden (von insgesamt 8’059  Datensätzen, Stand 16.12.22). Einige dieser Datensätze sind dabei nur in PDF- oder Excel-Format verfügbar. Damit genügen sie den Kriterien von Open Data nicht oder nur teilweise. Ein problemloses Filtern, Durchsuchen und Weiterverarbeiten ist somit erschwert.

Open Data noch weiter gedacht, lässt nicht nur eine maschinelle Verarbeitung der Daten zu, sondern auch die Automatisierung des Datenmanagements (Download, Versionierung, Aktualisierung, ..). Hier spielen Programmierschnittstellen, sogenannte APIs (Application Programming Interfaces), eine zentrale Rolle. Eine API ermöglicht eine automatisierte Kommunikation mit dem Server. Das Klicken eines Downloadlinks, das Anfordern der Daten per Mail oder andere Aktionen, die eine grafische Benutzeroberfläche erfordern, entfallen. Dies erleichtert die Nutzung der Daten enorm. Beispielsweise können periodische Abfragen der Daten automatisiert und eigene Datenbanken / Applikationen somit ohne viel Aufwand gepflegt werden. Von zentraler Rolle ist dabei eine gute API-Dokumentation (Dokumentation zur Anwendung der API) und das Bereitstellen einer stabilen API, welche gleichzeitig erweiterbar bleibt. Bisher werden nur sehr wenige Daten im Schweizer Gesundheitswesen per API bereitgestellt. Ein Beispiel dafür sind Daten im Rahmen von COVID-19 (https://opendata.swiss/de/dataset/covid-19-schweiz). Insbesondere Daten, welche häufig aktualisiert werden, bieten sich für eine Bereitstellung per API an. Im Falle der COVID-19 Daten sind dies die täglich aktualisierten Zahlen zum Infektionsgeschehen.

Datenbasierte Gesundheitswirtschaft in der Schweiz

In den letzten Jahren wurden in den Bereichen Künstliche Intelligenz und Datenanalytik grosse Fortschritte erzielt. Von diesen kann das Gesundheitswesen als Ganzes enorm profitieren. Beispielsweise können die technologischen Fortschritte bei faktenbasierten, medizinischen Entscheidungen unterstützen oder bestehende Leistungen effizienter, besser und wirkungsvoller gestalten. Nicht zuletzt kann die effiziente Nutzung von Daten Innovationen fördern. Veraltete Arbeits- und Behandlungsweisen können durch neue, optimierte Prozesse ersetzt werden. Werden die Gesundheitsdaten nicht in der entsprechenden Form zur Verfügung gestellt, ist es schwierig, deren Potenzial auszuschöpfen. Wir sehen insbesondere Potenzial bei Daten, welche zwar bereits öffentlich zugänglich sind und auch zu diesem Primärzweck veröffentlicht wurden, bei denen aber technische Hürden die Nutzung erschweren.

Im Folgenden werden einige Beispiele aus unserem Arbeitsalltag und die entsprechenden Probleme aufgeführt. Es handelt sich bei allen Beispielen um medizinische Kataloge oder Tarife, welche genau für diesen Zweck erstellt und veröffentlicht wurden. Es handelt sich also nicht “nur” um eine Zweitnutzung, sondern um den primären Zweck dieser Dokumente:

  • Mittel- und Gegenstände- Liste (MiGeL): Dieser Tarif wird vom Bundesamt für Gesundheit als PDF- und Excel-Datei publiziert. Um die Daten weiterverarbeiten zu können, speichern wir die jeweiligen Tabellen in den Sprachen Deutsch, Französisch und Italienisch als CSV-Dateien ab. Davor muss das Excel jedoch meist händisch bereinigt werden. Beispiele dafür sind:
    • Das Fehlen von Positionen
    • Positionen in falschen Zellen
    • Aufzählungszeichen für Listen unterscheiden sich von Version zu Version

Dabei treten die entsprechenden Inkonsistenzen je nach Sprachen unterschiedlich auf, d.h. Fehler in der einen Sprachversion sind in der anderen nicht zwangsweise gleich. Diese Korrekturarbeit ist langwierig und fehleranfällig. Durch die Bereitstellung im CSV Format (mit den immer gleichen Listen- und Unterlistentrennern) würde hier sicherlich die Arbeit der Datenbereitsteller wie auch -weiterverarbeiter erheblich erleichtern. Auch maschinell generierte Dokumente (auch Excel) würden Abhilfe schaffen, da so eine konsistente Struktur eingehalten werden kann.

  • Tarmed: Dieser Tarif wird in Form einer proprietären Microsoft Access Datenbank veröffentlicht und kann daher nur mit der entsprechenden Software geöffnet und gelesen werden. Damit man sie maschinell weiterverarbeiten kann, müssen die benötigten Tabellen aus der Access Datenbank identifiziert und im entsprechenden Format (z.B. XML) exportiert werden. Im Hinblick auf die zehn Prinzipien von Open Data erfüllt der Tarmed somit Prinzip 7 nicht.
  • CHOP: Der Katalog der schweizerischen Operationsklassifikation wird vom Bundesamt für Statistik publiziert und kann als CSV Datei heruntergeladen werden. Mit einer gezielten Google Suche gelangt man relativ schnell zur erforderlichen Seite. Die Navigation auf der Seite selbst scheint manchmal weniger intuitiv. Der Katalog selber ist klar strukturiert und weist keine Inkonsistenzen von Version zu Version auf. Wäre dieser noch per API verfügbar, hätten wir hier ein sehr gutes Beispiel einer Bereitstellung öffentlicher Daten.

Dass der Zugang sowie die Nutzung von Gesundheitsdaten auch im Interesse des Volkes stehen, zeigt sich unter anderem an der Vielzahl von Vorstössen des Parlamentes. In der Geschäftsdatenbank des Bundesparlaments sind dazu 63 Vorstösse zu finden, 30 davon aus den Jahren 2019 und 2020. Die meisten dieser Vorstösse sind noch nicht abschliessend behandelt. Jedoch wurde die staatliche Initiative “Gesundheitspolitische Strategie des Bundesrats 2020-2030” ins Leben gerufen. Die Strategie fokussiert sich unter anderem auf den technologischen und digitalen Wandel. “Potenzial der Gesundheitsdaten nutzen” und “Koordinierte Digitalisierung” sind zwei von insgesamt fünf Schwerpunkten, welche zur Erreichung des folgenden Zieles beitragen sollen: «Alle Partner des Gesundheitssystems nutzen Gesundheitsdaten und neue medizinische Technologien unter Abwägung von Chancen und Risiken». Auch im Legislaturplan 2019-2023 des Bundesrates wird die digitale Transformation im Gesundheitswesen angesprochen.

Teilen: