Forschung und Innovation im safeFBDC

Wir sehen die transformative Kraft der künstlichen Intelligenz, deshalb entwickeln wir KI-Lösungen, die einen positiven Einfluss auf die Gesellschaft haben.

Mit Blick auf sehr datenreiche Kontexte wie digitale Plattformen oder Social Media sind unsere Handlungsfelder vergleichsweise datenarm oder die Daten fallen an unterschiedlichen Stellen an, sind stark fragmentiert, hoch sensibel und weisen sehr heterogene Formate auf. Das hat unmittelbare Konsequenzen für die Innovationsaufgabe. Hier setzt unserer Forschung an: Unsere Kernaufgabe ist es, entlang der Anwendungsfälle überhaupt erst die relevanten Daten(quellen) zu identifizieren,  die Daten institutsübergreifend zusammenzuführen und die Analyseergebnisse interpretierbar zu machen. Dies muss vor dem Hintergrund des Spannungsfeldes zwischen der generellen Zugänglichkeit zu Daten auf der einen Seite und der Berücksichtigung des Datenschutzes sowie der Datensicherheit auf der anderen Seite erfolgen.

Teilnehmer des Präsenzteil des steerco des safeFBDC im Juli 2022

Die Innovationsaufgabe unserer Forschung liegt in der Mobilisierung sensitiver Finanzdaten. Erst wenn uns das gelingt und die Datensouveränität zu jedem Zeitpunkt gewahrt bleibt, können wir das volle Potenzial von künstlicher Intelligenz und Maschinellem Lernen in der Finanzbranche und darüber hinaus ausschöpfen.

Forschung im safeFBDC

Dateninfrastrukturen und Datenmanagement

Beim organisationsübergreifenden Austausch von Daten (engl. “Data Sharing”) müssen sowohl unternehmensintern als auch unternehmensübergreifend strategische Frameworks und Strukturen konzipiert werden, die dazu beitragen, den Datenaustausch und das Datenmanagement in verantwortlicher Weise zu gestalten und Kompetenzen im Umgang mit Daten aufzubauen.

Die Herausforderung von safeFBDC liegt darin, dass es sich in vielen Fällen um Daten mit besonders hoher Sensitivität handelt, die zwischen Organisationen gepoolt werden sollen, wobei dem jeweiligen Datenanbieter auch während und nach der Übertragung die Kontrolle über seine Daten zu gewähren ist. Von zentraler Bedeutung ist daher die Anwendung von Techniken und Methoden, mit denen die Daten gemeinschaftlich genutzt werden können, sodass die rechtlichen Einschränkungen im Umgang mit diesen Daten zu jederzeit gewahrt bleiben (z.B. Privacy Enhancing Techniques, Confidential Computing). Der Grad der Zugriffseinschränkungen denen diese Daten unterliegen, nimmt Wiederrum Einfluss auf die Organisations- und Governance-Strukturen, sowie die zugrundeliegende technische Infrastruktur.

Vor diesem Hintergrund soll safeFBDC auf Basis der Ausarbeitungen und Begleitung der Use Cases sukzessive eine Referenzarchitektur herausbilden, die zukünftigen Anwendungsfällen einen Rahmen für die Entwicklung KI-basierter Prognosemodelle bietet.

Organisation und Governance

Die aktuellen Entwicklungen in Europa zum Aufbau von gemeinschaftlichen Dateninfrastrukturen und Datenräumen haben das Ziel, mit der typischerweise in der Plattformökonomie anzufindenden ökonomischen Machtkonzentration zu brechen.

Im Rahmen von safeFBDC sollen verschiedenen Zielszenarien hinsichtlich der Organisation und Governance von entstehenden Datenökosystemen untersucht und evaluiert werden. Die Zielszenarien orientieren sich dabei zunächst an der Gestaltung des Datenaustauschs, etwa findet dieser Peer-to-Peer oder über eine zentrale Vertrauensinstanz statt. Grundlegendes Entwurfsprinzip ist dabei die Verteiltheit der Systeme – und zwar sowohl in Bezug auf die informationstechnische Lösung, die das Datenmanagement inkludiert, als auch in Bezug auf die Trägerorganisation, Steuerung und Corporate Governance.

Bei der Umsetzung aber auch bei der Verstetigung ergeben sich dadurch viele organisatorische, betriebswirtschaftliche und ethische Fragestellungen. 

Analytics und künstliche Intelligenz

Die zentrale Voraussetzung bei der Anwendung tiefer neuronaler Netze im Speziellen und maschinellem Lernen im Allgemeinen ist die Verfügbarkeit großer Datenmengen und Rechenleistung. 

Im Rahmen der Forschung des safeFBDC werden verschiedene Use Cases mit maschinellem Lernen durchgeführt, um anwendungsfallspezifische Repräsentationen aus Daten der teilnehmenden Organisationen zu entwickeln. Anhand der entwickelten Wissensrepräsentationen kann ein Modell dann Vorhersagen, Empfehlungen oder sogar Entscheidungen treffen. Hierbei werden auch neue Ansätze und Verfahren des föderierten maschinellen Lernens untersucht. Dieses Konzept beschreibt ein Modell, das über viele verschiedene Klienten hinweg trainiert und auf einem zentralen Server zu einem globalen Modell zusammengeführt wird. Bei diesem Vorgehen verlassen die Daten niemals den Klienten, denn zwischen dem Klienten und dem Server wird ausschließlich ein parametrisiertes Modell getauscht. Dies ist eine Option sicherzustellen, dass die Datensouveränität gewahrt bleibt, da die Daten selbst niemals weitergegeben werden. Allerdings bringt dieses Modell auch gravierende Nachteile mit sich, wie etwa ein Verzerren der Datensätze der beteiligten Organisationen. Würden die Daten zusammengeführt, könnte man institutsspezifische Besonderheiten und die damit verbundenen statistischen Eigenschaften (zumindest teilweise) ausgleichen.

Detaillierte Informationen zu unseren Use Cases finden Sie hier!