Eingang zum Volltext in OPUS

Home | Suche | Browsen

Lizenz

Bitte beziehen Sie sich beim Zitieren dieses Dokumentes immer auf folgende
URN: urn:nbn:de:kobv:517-opus-62089
URL: http://opus.kobv.de/ubp/volltexte/2012/6208/


Bauckmann, Jana ; Abedjan, Ziawasch ; Leser, Ulf ; Müller, Heiko ; Naumann, Felix

Covering or complete? : Discovering conditional inclusion dependencies

pdf-Format:
Dokument 1.pdf (795 KB) (SHA-1:d719ff885f59b4c57658307a66f0ad941174073b)


Kurzfassung in Englisch

Data dependencies, or integrity constraints, are used to improve the quality of a database schema, to optimize queries, and to ensure consistency in a database. In the last years conditional dependencies have been introduced to analyze and improve data quality. In short, a conditional dependency is a dependency with a limited scope defined by conditions over one or more attributes. Only the matching part of the instance must adhere to the dependency. In this paper we focus on conditional inclusion dependencies (CINDs).
We generalize the definition of CINDs, distinguishing covering and completeness conditions. We present a new use case for such CINDs showing their value for solving complex data quality tasks. Further, we define quality measures for conditions inspired by precision and recall. We propose efficient algorithms that identify covering and completeness conditions conforming to given quality thresholds. Our algorithms choose not only the condition values but also the condition attributes automatically. Finally, we show that our approach efficiently provides meaningful and helpful results for our use case.

Kurzfassung in Deutsch

Datenabhängigkeiten (wie zum Beispiel Integritätsbedingungen), werden verwendet, um die Qualität eines Datenbankschemas zu erhöhen, um Anfragen zu optimieren und um Konsistenz in einer Datenbank sicherzustellen. In den letzten Jahren wurden bedingte Abhängigkeiten (conditional dependencies) vorgestellt, die die Qualität von Daten analysieren und verbessern sollen. Eine bedingte Abhängigkeit ist eine Abhängigkeit mit begrenztem Gültigkeitsbereich, der über Bedingungen auf einem oder mehreren Attributen definiert wird. In diesem Bericht betrachten wir bedingte Inklusionsabhängigkeiten (conditional inclusion dependencies; CINDs).
Wir generalisieren die Definition von CINDs anhand der Unterscheidung von überdeckenden (covering) und vollständigen (completeness) Bedingungen. Wir stellen einen Anwendungsfall für solche CINDs vor, der den Nutzen von CINDs bei der Lösung komplexer Datenqualitätsprobleme aufzeigt. Darüber hinaus definieren wir Qualitätsmaße für Bedingungen basierend auf Sensitivität und Genauigkeit. Wir stellen effiziente Algorithmen vor, die überdeckende und vollständige Bedingungen innerhalb vorgegebener Schwellwerte finden. Unsere Algorithmen wählen nicht nur die Werte der Bedingungen, sondern finden auch die Bedingungsattribute automatisch. Abschließend zeigen wir, dass unser Ansatz effizient sinnvolle und hilfreiche Ergebnisse für den vorgestellten Anwendungsfall liefert.

Freie Schlagwörter (Deutsch): Datenabhängigkeiten , Bedingte Inklusionsabhängigkeiten , Erkennen von Meta-Daten , Linked Open Data , Link-Entdeckung , Assoziationsregeln
Freie Schlagwörter (Englisch): Data Dependency , Conditional Inclusion Dependency , Metadata Discovery , Linked Open Data , Link Discovery , Association Rule Mining
RVK - Regensburger Verbundklassifikation: ST 230
Institut 1: Extern
Institut 2: Hasso-Plattner-Institut für Softwaresystemtechnik GMBH
DDC-Sachgruppe: Informatik
Dokumentart: b Monographie
Schriftenreihe: Technische Berichte des Hasso-Plattner-Instituts für Softwaresystemtechnik an der Universität Potsdam, ISSN 2191-1665
Bandnummer: 62
Sprache: Englisch
Erstellungsjahr: 2012
Publikationsdatum: 20.11.2012
Bemerkung:
In Printform erschienen im Universitätsverlag Potsdam:

Covering or Complete? Discovering conditional inclusion dependencies / Jana Bauckmann ; Ziawasch Abedjan ; Ulf Leser ; Heiko Müller ; Felix Naumann. - Potsdam : Universitätsverlag Potsdam, 2012. - 34 S. : graph. Darst.
(Technische Berichte des Hasso-Plattner-Instituts für Softwaresystemtechnik an der Universität Potsdam ; 62)
ISSN (print) 1613-5652
ISSN (online) 2191-1665
ISBN 978-3-86956-212-4
--> bestellen
Lizenz: Diese Nutzungsbedingung gilt nicht, wenn in den Metadaten eine modifizierende Lizenz genannt ist. Keine Nutzungslizenz vergeben - es gilt das deutsche Urheberrecht


Home | Leitlinien | Impressum | Haftungsausschluss | Statistik | Universitätsverlag | Universitätsbibliothek
Ihr Kontakt für Fragen und Anregungen:
Universitätsbibliothek Potsdam
powered by OPUS  Hosted by KOBV  Open
Archives Initiative  DINI Zertifikat 2007  OA Netzwerk