WAHLPFLICHTBEREICH FINANZMATHEMATIK UND DATA MINING

Data Mining

Für die Natur-, Ingenieurs-, Wirtschafts- und Sozialwissenschaften sind das kontrollierte Erfassen und das Auswerten von Daten grundlegend. Im Data Mining befasst man sich systematisch mit Methoden zur Gewinnung von potentiell nützlicher Information aus vorliegenden Daten. Data Mining ist daher auch kein Teilgebiet der Mathematik: einerseits spielen Informatik, Lerntheorie und künstliche Intelligenz ebenfalls eine Rolle, andererseits sind die von der jeweiligen Wissenschaft und vom Anwendungskontext abhängigen Methoden der Datenerfassung von erheblicher Bedeutung.

Im Rahmen des Wahlpflichtbereichs Finanzmathematik und Data Mining werden Lehrveranstaltungen zu den wesentlichen
mathematischen Werkzeugen für das Data Mining angeboten. Diese stammen unter anderem aus den Gebieten:

  • multivariate Statistik und Wahrscheinlichkeitstheorie,
  • statistische Lerntheorie,
  • Zeitreihenanalyse und stochastische Prozesse,
  • Funktionalanalysis.

Prinzipiell unterscheidet man zwischen Methoden zur Entdeckung bislang unbekannter Strukturen in Daten und solchen zur Bestätigung vermuteter bzw. Beschreibung bekannter Strukturen. Jede dieser beiden Methodengruppen bildet den Inhalt einer Lehrveranstaltung, nämlich in Anlehnung an Begriffe aus der statistischen Lerntheorie im ersten Fall  »Unüberwachte Data Mining Verfahren« und im zweiten Fall »Überwachte Data Mining Verfahren«.

Die Animation rechts zeigt den Ablauf eines einfachen Algorithmus' zur Clusteranalyse, mit dessen Hilfe Daten zur chemischen Zusammensetzung von etwa 570 Olivenölproben in vier Gruppen eingeteilt werden: Jeder Punkt in der Animation entspricht einer Probe. Seine Farbe zeigt die Gruppenzugehörigkeit, die zu anfang zufällig vergeben wurde.