Vortrag am Massachusetts Institute of Technology

Tools zur automatisierten Bewertung von Datenqualität

Portrait einer Frau mit dunklen Haaren
© SCCH

18.06.2019

DI Lisa Ehrlinger hält am 02. August 2019 im Zuge des renommierten 13th Annual MIT Chief Data Officer and Information Quality (MIT CDOIQ) Symposium am Massachusetts Institute of Technology (MIT) einen Vortrag über die automatisierte Bewertung von Datenqualität mithilfe von modernen Softwareprogrammen.

TOOLS FÜR DIE VERBESSERTE DATENQUALITÄT

In den letzten Jahren wurde eine Vielzahl an Programmen zur Bewertung von Datenqualität (DQ) entwickelt, die sich in vielen Aspekten unterscheiden (z.B. kommerziell/forschungsorientiert, quelloffen oder nicht, Fokus auf bestimmte Anwendungsbereiche). Eine Übersicht über die aktuelle Systemlandschaft ist meist nur partiell vorhanden, und ohne den nötigen Detaillierungsgrad, der eine Entscheidung ermöglicht welche DQ Werkzeuge am idealsten zu den jeweiligen Anforderungen in Unternehmen passen. In einer systematischen Suche konnten Lisa Ehrlinger und ihre Kollegen 667 Softwareprogramme identifizieren, die dem Thema "Datenqualität" zugeordnet werden können. In einem weiteren Schritt wurden davon mittels vordefinierten Ausschlusskriterien 12 Werkzeuge für eine vertiefende Untersuchung ausgewählt. Es wurden unter anderem DQ Werkzeuge wie Informatica Data Quality, Experian Pandora, Talend Open Studio, Oracle EDQ, SAS Data Quality und Quadient Data Cleaner untersucht. Die Studie umfasste einen detaillierten Anforderungskatalog, welcher die drei Kategorien (1) Data Profiling, (2) Datenqualitätsbewertung, und (3) kontinuierliches DQ Monitoring umfasst. In ihrem Vortrag am Massachusetts Institute of Technology (MIT) gibt Ehrlinger einen Einblick zur Durchführung der Studie, eine Übersicht über aktuelle DQ Tools am Markt sowie eine Zusammenfassung der Stärken und Schwächen der einzelnen Tools.

FORSCHUNGSKOOPERATION MIT DER JOHANNES KEPLER UNIVERSITÄT LINZ (JKU)

Die Arbeit entstand im Rahmen der Dissertation von DI Lisa Ehrlinger, die sich inhaltlich mit der automatisierten Überwachung der Datenqualität in Informationssystemen beschäftigt. Betreut wird die Dissertation von a.Univ.-Prof. Dr. Wolfram Wöß vom Institut für Anwendungsorientierte Wissensverarbeitung (FAW) der Johannes Kepler Universität Linz.
Am Software Competence Center Hagenberg ist Ehrlinger Projektleiterin im COMET-Projekt Sebista (Secure Big Stream Data Processing), dessen Fokus auf der Entwicklung neuer Methoden zur systematischen und automatisierten Speicherung und Auswertung von großen Datenmengen liegt, welche die Basis für Machine Learning und Artificial Intelligence darstellt.

Kontakt

Software Competence Center Hagenberg GmbH (SCCH) 
Softwarepark 21
4232 Hagenberg
www.scch.at


Das könnte Sie auch interessieren: