Mit Data-Mining kritische Ernährungsmuster und Lifestyle-Krankheiten aufspüren

Viele chronische Krankheiten sind ernährungsbedingt. Ein Team der BFH Wirtschaft verfolgt mit multidisziplinärer Forschung einen neuartigen Ansatz: Die Wissenschaftler*innen darunter unsere Autorin, decken mit Data-Mining-Methoden aussagekräftige Regeln über den Einfluss der Ernährung auf chronische Krankheiten auf.

Ernährungsmuster spielen eine wichtige Rolle für die Gesundheit. Das Thema nehmen längst auch  Supermärkte, Gesundheitspraktiker*innen, Sport-Organisationen und Regierungen ernst und immer mehr Menschen setzen sich mit ihren Essgewohnheiten auseinander. Aber oft sind sich nicht der Eigenschaften, Einschränkungen und vor allem der Bestandteile ihrer Nahrung kaum bewusst. Es gibt mittlerweile unterschiedliche Diäten und Fitnessprogramme, denen Einzelpersonen folgen, die ihnen bei einer gesunden Ernährung und Lebensweise helfen sollen. Sie beinhalten aber oft keine kritische Analyse, wie der jeweilige Speiseplan chronische Krankheiten beeinflusst. Dort setzt die Forschungsidee an: mittels grosser Datenmengen den Einfluss von Lebensmitteln auf chronischen Krankheiten aufzeigen.

Dazu wurde eine umfangreiche Datenbank aus den erhobenen schweizerischen nationalen Ernährungsdaten (menuCH) sowie den schweizerischen demographischen Daten und Gesundheitsdaten verknüpft. Die resultierende Datenbank wird verwendet, um Ernährungsmuster zu entdecken, die zu chronischen Zivilisationskrankheiten führen. Um solche versteckten Muster zu extrahieren und zu aufzudecken, verwenden wir Data-Mining-Techniken.

Data Mining wird zunehmend im Bereich der Datenanalyse eingesetzt, die in jüngerer Zeit aus der Informatik hervorgegangen ist und sich von traditionellen statistischen Analysen unterscheidet. Klassische statistische Analysetechniken werden häufig entwickelt, um Beweise zur Unterstützung oder gegen eine Hypothese aus einem begrenzteren Datensatz zu bilden. Somit wird üblicherweise bei der statistischen Analyse die Gültigkeit der Hypothese untersucht, indem statistische Tests mit Daten durchgeführt werden, die möglicherweise zu diesem Zweck erhoben wurden. Data-Mining-Techniken hingegen werden nicht so sehr verwendet, um Vertrauen in eine Hypothese zu bilden, sondern vielmehr, um unbekannte Beziehungen zu extrahieren, die im Datensatz vorhanden sind. Data Mining ist daher eine Hypothesen-freie Datenanalyse-Methode, die statistische Methoden als Werkzeuge verwenden kann, aber zunächst nicht davon ausgeht, dass eine Hypothese verifiziert oder zurückgewiesen wird.

Lebensstilkrankheiten

Lebensstilkrankheiten (Life Style Diseases) sind Krankheiten, die mit zunehmender Industrialisierung der Länder und zunehmendem Alter der Menschen immer häufiger werden. Zu diesen Krankheiten gehören Fettleibigkeit, Bluthochdruck, Herzerkrankungen, Typ-2-Diabetes, Krebs, psychische Störungen und viele andere. Sie unterscheiden sich von Infektionskrankheiten, auch übertragbare Krankheiten (CD) genannt, aufgrund ihrer nicht ansteckenden, streuenden Natur, die oft auf das Ernährungsverhalten zurückzuführen ist. Lebensstilkrankheiten zählen daher zu den sogenannten nicht übertragbaren (NC) Krankheiten. Nach Angaben der Weltgesundheitsorganisation (WHO, 2018) hängt die wachsende Epidemie chronischer Krankheiten, die sowohl Industrie- als auch Entwicklungsländer befällt, mit Ernährungs- und Lebensstiländerungen zusammen. Die schnell zunehmende Belastung durch chronische Krankheiten ist ein wesentlicher Faktor für die globale öffentliche Gesundheit.

Abbildung 1: häufige chronische Krankheiten

Knowledge Discovery in der Ernährungsforschung

Daten werden mit einer exponentiellen Rate produziert, zumal die Speicherfähigkeit heute praktisch unbegrenzt ist. Data Mining wird zunehmend in der Datenanalyse verwendet als ein aufstrebendes multidisziplinäres Feld von:

  • Statistiken,
  • maschinellem Lernen,
  • Datenbanken,
  • Informationsrückgewinnung

Die mühsamste Aufgabe einer Data-Mining-Forschung besteht jedoch darin, Daten zu extrahieren, zu laden und zu übertragen. Dieser Vorgang, der als Data-Preprocessing genannt wird, ist sehr zeit- und ressourcenintensiv und kostet fast 3/5 des Aufwandes eines solchen Data-Mining-Projekts. Data Mining kann gemäss (Fayyad et al., 1996, S. 40 f.).in 4 Schritten aufgeteilt werden: 1- Datenquellen sammeln, 2- Datenquellen bereinigen und   integrieren, 3- Data-Mining-Methoden einsetzen, um neue Regeln zu entdecken, und 4- Wissensinterpretation, um neues Wissen zu schaffen. Die folgende Grafik zeigt diese Schritte auf:

Datenquellen sammeln

Ernährungsdatenbank (menuCH)

Die Nationale Ernährungserhebung menuCH (BLV, 2021) liefert erstmals repräsentative Daten zum Lebensmittelkonsum und den Ernährungsgewohnheiten der in der Schweiz lebenden Bevölkerung. Ernährung und Bewegung haben einen direkten Einfluss auf Gesundheit und Lebensqualität. Von Januar 2014 bis Februar 2015 wurden rund 2000 Personen der Schweizer Wohnbevölkerung befragt. Männer und Frauen im Alter zwischen 18 und 75 Jahren machten Angaben zu ihrem Lebensmittelkonsum, zu Kochen, Essen und Bewegung sowie zum demografischen Verhalten. Die Befragung wurde im ersten Schritt als Fragebogen und im zweiten Schritt mündlich per Telefon durchgeführt. Der Fragebogen gibt Auskunft über Ess- und Trink- und Kochverhalten sowie die Aufnahme von Zusatzstoffen und Salzen, gemiedene Lebensmittel und Gründe für die Vermeidung von Lebensmitteln. Darüber hinaus liefert die Befragung Grundkenntnisse zu gesunder Ernährung, Aktivitätsmustern, Körpermaßen, Gewichtszufriedenheit, Ernährungsverhalten, Sozialstruktur der Befragten. Die mündliche Befragung gibt Auskunft über das Interview und den Interviewkontext; Alters- und Körperinformationen; verzehrte Nahrung (Zubereitung, Kategorie, Nährwerte, Menge und Zeitpunkt der Nahrungsaufnahme). Hinzu kommt noch eine demografische Einordnung der Befragten: Telefonnummer, Geburtsjahr, Altersgruppe, Geschlecht, Verwandtschaftsstatus, Nationalität, Geburtsland, Haushaltsgrösse, Wohnsitz in den grossen Schweizer Regionen.

Gesundheitsdatenbank

Das Schweizer Gesundheitsministerium erhebt alle fünf Jahre Daten von rund 21500 Schweizer Bürgerinnen und Bürgern, die ihnen nach einem dualen Ansatz aus einem Fragebogen und einem detaillierten Telefoninterview kategorisierte Fragen zu ihren Gesundheitsproblemen stellen. In unserer Studie wurden nur die Daten aus der Telefonumfrage abgerufen (BVG, 2021). Die Themen mit dem höchsten Bezug und Priorität zu Gesundheit und Ernährung wurden extrahiert und auf eine Tabelle mit neun Themenbereichen reduziert: Alkoholkonsum, Altersprobleme, Behinderung, Cholesterin, chronische Krankheiten, Diabetes, Drogenkonsum, Ernährung, Gesundheitszustand.

Abbildung 2 Data Mining Schritte gemäss Fayyad et al.

Datenquellen bereinigen und integrieren

In unserer vorhergehenden Studie (Mewes, 2021) haben wir eine integrierte Datenbank aus menuCH und Schweizer Gesundheitsdaten gebildet. Unser multidisziplinäres Team bestand aus einem Spezialisten für Gesundheit und Ernährung, der es uns ermöglichte, die Eigenschaften der vorhandenen Attribute angemessen zu bewerten, auszuwählen und in verschiedenen Kategorien zusammenzufassen undeiner Informatik-Fachperson für Data Mining.

Ziel dieser Kategorisierung war es, für jede Kategorie mehrere 4-8 Unterkategorien zu erstellen. Bezüglich der Gesundheitsdaten wurden Kategorien zu Blutdruck, Cholesterinspiegel, Diabetes und Alkoholkonsum erstellt. Der Blutdruck wurde in 6 Kategorien unterteilt. Die Cholesterin-Daten wurden in 4 Kategorien eingeteilt. Die Diabetesdaten wurden in 4 Kategorien eingeteilt und schliesslich wurden die Daten zum Alkoholkonsum in 4 Kategorien eingeteilt. Als Beispiel wurden die Alkoholkonsumdaten wie folgt eingeteilt:

  • Täglicher Alkoholkonsum bis zu 18 Gramm,
  • Täglicher Alkoholkonsum > 18-23 Gramm,
  • Täglicher Alkoholkonsum > 23-28 Gramm,
  • Täglicher Alkoholkonsum > 28 Gramm.

Nach der Definition der Kategorien für jede chronische Krankheit- und menuCH-Attribute wurden die Daten entsprechend der entsprechenden Kategorisierung in eine integrierte, relationale Datenbank überführt. 5 gemeinsame demografische Merkmale, die in beiden Datenbanken verfügbar sind, wurden verwendet, wie Geschlecht, Altersgruppe, Haushalt, Familienstand und Sprache, um die beiden Datenbanken zu einer integrierten relationalen Datenbank zu verknüpfen.

Data Mining

Wir haben eine Data-Mining-Methode  entsprechend dem A-priori-Algorithmus (Aggarwal, 1999) auf der integrierten Schweizer Ernährungs- und Gesundheitsdatenbank angewendet, um Regeln zu gewinnen, die die Auswirkungen von Ernährungsgewohnheiten auf die ausgewählten chronische Krankheiten wie Bluthochdruck, Diabetes und hohes Cholesterin aufzeigen. Der folgende Abschnitt beschreibt einige Assoziationsregeln und die dazugehörigen Interpretationen für die ausgewählten chronischen Krankheiten.

Assoziationsregeln und Interpretationen

Bluthochdruck Bluthochdruck ist eine Erkrankung der Organachse Herz – Gefässe – Nieren oder Lunge. Die Regeln in der Studie zeigten eine Verbindung der Hypertonie und Normaldruck mit Merkmalen (Nahrungsergänzungsmittel, Rauchen, Anzahl der warmen Mahlzeiten). In einer Gruppe reicht die Nahrungsaufnahme aus, um die Gesundheit zu erhalten. Cholesterin und Fette werden offensichtlich nicht übermässig resorbiert, so dass Gefässschäden und offensichtlich Übergewicht vermieden werden. In einer anderen Gruppe mit hypertensive Patienten mit einer Beeinträchtigung der Herz-Kreislauf-Nierenfunktionsachse, welche ältere Leute beinhaltete, könnten Nahrungsergänzungsmittel die Energieproduktion (ATP) verbessern. Durch vorheriges Rauchen könnte die Lungenfunktion beeinträchtigt sein, so dass auch der Lungenkreislauf unter hohem Druck stehen könnte. Fettleibigkeit sollte bei dieser Gruppe reduziert werden.
Diabetes Aus den Angaben der MenuCH geht nicht hervor, wie die Mahlzeiten zusammengesetzt sind und wie viel die Studienteilnehmer*innen aufnehmen. Es wurde nur die Krankheit mit Merkmalen assoziiert, nicht der Gesundheitszustand. Daher haben wir Regeln erhalten, die mit dem Kohlenhydrate- Glukosestoffwechsel zusammenhängen. Die gefundenen Regeln zeigten auf, dass im Vergleich zur Glukoseaufnahme das Rauchen für den Messstoffwechsel von Glukose wenig Bedeutung hat. Die Prognose kann sich nur bei konsumierenden Krankheiten verschlechtern. In einer Gruppe vonTyp-1-Diabetikern wurde eine ausgewogene Ernährung festgestellt, bei Typ-2-Diabetikern wurde aber eine erhöhte Nahrungsaufnahme festgestellt. Die offensichtlichenTyp-1-Diabetiker ernähren sich bewusst ausgewogen mit Glukose, brauchen keine Nahrungsergänzungsmittel und rauchen nicht. Wären es Typ-2-Diabetiker, hätten sie in der Vergangenheit zu viel Nahrung aufgenommen und Übergewicht entwickelt, was zu einem Typ-2-Diabetes mit der gefürchteten Komplikation „metabolisches Syndrom“ führt. Diese Typ-2-Diabetiker sind sich ihrer Ernährung meist nicht bewusst. Nahrungsergänzungsmittel (Vitamine, Spurenelemente) hätten nur einen Mehrwert, wenn sie mangelernährt wären.
Cholesterin Hypercholesterinämie ist eine Erkrankung des Fettstoffwechsels; Cholesterin kann rein intern biosynthetisiert werden. Aus ungenutzter Glukose oder ihrem Abbauprodukt Acetyl-CoA entsteht eine Kette, die mit Cholesterin endet. Therapeutisch kann dieser Syntheseweg mit Statinen unterbrochen werden. Die zweite Möglichkeit der Hypercholesterinämie beruht auf einer erhöhten externen Aufnahme (fettreiche Ernährung, insbesondere tierische Fette). Hier wurden Assoziationen von Kranken und Nichtkranken mit gleichen Merkmalen untersucht. Eine Gruppe mit einem normalen Cholesterinspiegel isst viel Gemüse, das auch die notwendigen Mikronährstoffe enthält. Wenn Brot oder andere Kohlenhydrate nicht übermässig konsumiert werden, bleibt die körpereigene Cholesterinproduktion niedrig. Das vorangegangene Rauchen verursachte offenbar keine Gefässveränderungen, die sich in Kombination mit einer Hypercholesterinämie verschlimmern würden. Eine zweite Gruppe mit normalem Cholesterin isst wie die vorherige Gruppe, raucht aber nicht. Durch Nikotinkonsum durch Arteriosklerose veränderte Gefässwände können ausgeschlossen werden. Es besteht kein kardiovaskuläres Risiko. Diese Gruppe leidet an Hypercholesterinämie. Allerdings ist der Gemüsekonsum unzureichend oder hat zu spät begonnen, oder Cholesterin entsteht durch zu viel Kohlenhydrataufnahme. Bei einer weiteren Gruppe reduzieren die Einnahme regelmässiger warmer Mahlzeiten mit (hoffentlich) ausgewogener Zusammensetzung und das Nichtraucherverhalten reduzieren das Arterioskleroserisiko deutlich. Hier sollten die Gefässwände weniger verändert werden.

Zusammenfassung und zukünftige Forschung

Die Interpretation der abgeleiteten Regeln offenbart interessante Aspekte der ausgewählten Schweizer Bevölkerungsgruppe. Im Allgemeinen sind die Ernährungsgewohnheiten der Schweizer*innen in Bezug auf chronische Krankheiten vernünftig. Die Ergebnisse zeigen, dass die abgeleiteten Regeln nur für einen sehr kleinen Teil der Stichprobe relevant sind. Darüber hinaus zeigen die Regeln, dass das Auftreten der voneinander unabhängigen Nährwertmerkmale in den verschiedenen Formen in den Regeln gleichmässig verteilt vorkommt, was so interpretiert werden kann, dass der Grossteil der Stichprobenpopulation den neuesten Ernährungsstandards folgt, wenig raucht und regelmässige körperliche Aktivitäten ausführt.

Dennoch weist ein kleiner Prozentsatz der Stichprobe chronische Erkrankungen aufgrund ungesunder Ernährung auf. Die Gewichtung von Merkmalen sollte in weiteren Studien berücksichtigt werden, damit Merkmale mit einem geringen Gesamtanteil in der Grundgesamtheit nicht vorzeitig im Prozess der Data Mining ausfallen.


Referenzen

  1. Aggarwal, C. C. & Yu, P. S. (1999). Data Mining Techniques for Associations, Clustering and Classification. In N. Zhong & L. Zhou (Hg.), Methodologies for Knowledge Discovery and Data Mining (S. 13–23). Springer Berlin Heidelberg.
  2. BLV, Bundesamt für Lebensmittelsicherheit und Veterinärwesen. (2021). menuCH – Nationale Ernährungserhebung. https://www.blv.admin.ch/blv/de/home/lebensmittel-und-ernaehrung/ernaehrung/menuch.html
  3. Bundesamt für Statistik. (16. Februar 2021). Schweizerische Gesundheitsbefragung. https://www.bfs.admin.ch/bfs/de/home/statistiken/gesundheit/erhebungen/sgb.html
  4. Fayyad, U., Piatetsky-Shapiro, G. & Smyth, P. (1996). From Data Mining to Knowledge Discovery in Databases, 27–34. https://doi.org/10.1145/240455.240464
  5. Mewes, I. Jenzer, H., Einsele, F. (2021). A Study about Discovery of Critical Food Consumption Patterns Linked with Lifestyle Diseases for Swiss poulation using Data Mining Methods, Online HealthInf, BIOSTEC- International Joint Conference on Biomedical Eng. Systems and Technologies.
  6. Mewes, I. Jenzer, H., Einsele, F. (2021). Building an Integrated Relational Database from Swiss Nutrition National Survey and Swiss Health Datasets for Data Mining Purposes. In World Academy of Science, Engineering and Technology, International Journal of Health and Medical Engineering Vol:15, No:1, 2021.
  7. World Health Organization. (2018). Noncommunicable diseases: Country profiles 2018. World Health Organization.

Die Co-Autorinnen

  1. Ilona Mewes hat den Bachelor Wirtschaftsinformatik an der BFH Wirtschaft abgeschlossen. Sie hat die beiden Arbeiten während Ihrer Case Arbeit (Semesterarbeit) und Bachelorthesis unter der Betreuung von Prof. Dr. Farshideh Einsele und Helena Jenzer durchgeführt.
  2. Prof. Dr. pharm. Helena Jenzer war bis 2020 Leiterin Forschung der BFH Gesundheit. Sie leitet die Spitalapotheke der Psychiatrischen Universitätsklinik Zürich.

AUTOR/AUTORIN: Farshideh Einsele

Farshideh Einsele ist promivierte Wirtschaftsinformatikerin und Dozentin an der BFH Wirtschaft. Sie forscht im Bereich Data Mining und Business Intelligenz mit Schwerpunkt Datamining im Bereich Ernährung und chronische Krankheiten.

PDF erstellen

Ähnliche Beiträge

Es wurden leider keine ähnlichen Beiträge gefunden.

0 Kommentare

Dein Kommentar

An Diskussion beteiligen?
Hinterlasse uns Deinen Kommentar!

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.