Kurzinformation
Vom 1. Juli 1997 bis zum 30. Juni 2009 war an der (Technischen) Universität Dortmund der Sonderforschungsbereich 475 "Komplexitätsreduktion in multivariaten Datenstrukturen" eingerichtet. Hier arbeiteten Wissenschaftler der Fachrichtungen Statistik, Informatik, Mathematik, Maschinenbau, Biometrie, Medizin, Wirtschafts- und Ingenieurwissenschaften der Universitäten Dortmund, Essen und Bochum sowie der Institute für Wirtschaftsforschung (RWI Essen), für Arbeitsphysiologie (IfADo, Dortmund) und der Chirurgischen Klinik (Dortmund) interdisziplinär zusammen.
Auf den Kapital- und Arbeitsmärkten, in der intensivmedizinischen Forschung und der Genetik sowie bei Produktionsverläufen in der Technik entstehen immer mehr Datenstrukturen, die nach allgemeinem Verständnis äußerst komplex sind: Sie sind hochdimensional, geprägt von individueller Dynamik und einer unübersichtlichen Abhängigkeitsstruktur zwischen einzelnen Komponenten. Zum Verständnis und damit zur möglichen Beeinflussung der zugrunde liegenden datenerzeugenden Mechanismen sind die Analyse, geeignete Approximation und sparsame Modellbildung solcher komplexer Daten wesentliche und dringliche Aufgaben. Klassische statistische Verfahren lassen sich nicht in konventioneller Weise auf solche hochdimensionalen und komplexen Daten anwenden oder verallgemeinern, z.T. wegen grundsätzlicher Hindernisse wie dem Fluch der hohen Dimension aber auch aufgrund algorithmischer Schwierigkeiten. Das projektübergreifende Hauptforschungsfeld des SFB 475 begegnete diesen Herausforderungen und befasste sich seit seiner Einrichtung im Juli 1997 mit der Komplexitätsreduktion für multivariate Daten. Durch die (Weiter)Entwicklung statistischer Methodik und deren Verknüpfung mit Expertenwissen aus den Sachdisziplinen ist es gelungen, dass komplexe, multivariate Datenstrukturen aus unterschiedlichen Anwendungsgebieten einer Komplexitätsreduktion unterworfen werden können, die zu redundanzarmen, adäquaten und gegenüber Ausreißern oder Fehlern in den Daten robusten Modellen führt. Die algorithmische Umsetzung sicherte schließlich die Anwendbarkeit dieser neuen statistischen Verfahren ab. In der zwölfjährigen Laufzeit des SFB sind ausgehend vom eigentlichen Modellbildungsprozess weitere gemeinsame Forschungsziele hinzugekommen, wie z. B. die Modellierung (multivariater) Dynamik und komplexer Regressionszusammenhänge, insbesondere unter dem Aspekt der Dimensionsreduktion und der Robustheit der neu entwickelten Verfahren.
Aufgrund der direkten interdisziplinären Zusammenarbeit der Statistik und Informatik mit Bio-, Wirtschafts- und Ingenieurwissenschaften wurde der SFB 475 zu einem wichtigen Element in der statistischen Grundlagenforschung und konnte zudem bedeutende Forschungserfolge in den beteiligten Sachdisziplinen erlangen. Damit trug der SFB 475 einen wesentlichen Anteil zur Sichtbarkeit des Wissenschaftsstandorts Dortmund bei. Zahlreiche Rufe der beteiligten (Nachwuchs-) Wissenschaftler sowie deren Präsenz auf internationalen Tagungen und die hohe Anzahl an Veröffentlichungen in Fachzeitschriften belegen den wissenschaftlichen Erfolg des SFB 475. So leistete der Sonderforschungsbereich 475 in interdisziplinärer Zusammenarbeit von Statistik und Informatik mit Wirtschafts-, Natur- und Ingenieurwissenschaften wesentliche Beiträge wie z. B.:
- neue Verfahren der Dimensionsreduktion, der Regression und Bildanalyse,
- algorithmische Umsetzung, Implementierung und Anwendung der "Support Vector Machine" und komplexer, robuster statistischer Verfahren, etwa der Online-Signal-Extraktion für hochdimensionale, dynamische Daten, z. B. aus der Intensivmedizin,
- neue Modellierungsansätze für Volatilitäten, für Konjunkturzyklen und Risikoallokation auf Finanz- und Arbeitsmärkten,
- neue Methoden der Klassifikation und Clusteranalyse, u. a. zur Untersuchung der Genese komplexer Erkrankungen, aber auch zur Text- und Musikanalyse,
- eine abschließende Durchdringung des Robustheitsbegriffes "Bruchpunkt".
Die Struktur des Sonderforschungsbereichs hat sich während des gesamten Förderzeitraums bewährt: Der Projektbereich A: "Anwendungsübergreifende Methoden" bearbeitete die theoretischen, methodischen Grundlagen für die statistische Modellbildung, Maschinelles Lernen und deren algorithmische Umsetzung. Der Projektbereich B: "Ökonometrie" beheimatete die Projekte mit wirtschaftswissenschaftlichen Fragestellungen und der Projektbereich C: "Bio- und Technometrie" umfasste Projekte mit medizinischem Hintergrund und Projekte mit ingenieurwissenschaftlicher Problematik. In der letzten Förderphase wurde der SFB ergänzt durch den Transferbereich. Zusammen mit Industriepartnern wurden in diesem Projektbereich Ergebnisse aus dem SFB in die Praxis überführt und zusätzlich wurden durch Rückkopplungseffekte Anregungen zur weiteren Methodenverbesserung an den SFB übermittelt.
Der Sonderforschungsbereich verfügte in den insgesamt 12 Jahren über eine Fördersumme von etwa 17 Millionen €. Davon entfielen fast 15,5 Millionen € auf die Finanzierung von zusätzlichen Mitarbeitern.