Zitierfähige Version
- Revision von Knowledge Discovery in Databases (KDD) vom 19.02.2018 - 13:18
- Revision von Knowledge Discovery in Databases (KDD) vom 24.10.2017 - 15:13
- Revision von Knowledge Discovery in Databases (KDD) vom 22.07.2014 - 13:27
- Revision von Knowledge Discovery in Databases (KDD) vom 10.06.2013 - 11:57
- Revision von Knowledge Discovery in Databases (KDD) vom 08.01.2013 - 15:09
- Revision von Knowledge Discovery in Databases (KDD) vom 18.06.2009 - 16:27
Knowledge Discovery in Databases (KDD)
Geprüftes Wissen
GEPRÜFTES WISSEN
Über 200 Experten aus Wissenschaft und Praxis.
Mehr als 25.000 Stichwörter kostenlos Online.
Das Original: Gabler Wirtschaftslexikon
zuletzt besuchte Definitionen...
Knowledge-Discovery-in-Databases (KDD)-Prozess; umfassender Datenanalyseprozess, in dessen Kern Verfahren des Data Mining zur Anwendung kommen. Der-Knowledge-Discovery-in-Databases (KDD)-Prozess umfasst folgende Phasen:
(1) Problemabgrenzung: Zunächst muss sich der Analytiker mit dem Anwendungsbereich vertraut machen und das Problem eingrenzen.
(2) Definition der Data-Mining-Aufgabe: Der Analytiker muss festlegen, welche Daten für das untersuchte Problem relevant sind, welche Arten von Aussagen (Modelltypen) das Data Mining liefern soll und wie die Interessantheit dieser Aussagen bewertet werden soll.
(3) Datenvorverarbeitung: Die zuvor für problemrelevant befundene Datenbasis wird aus unterschiedlichen Datenbeständen (z.B. Scannerdaten unterschiedlicher Filialen) extrahiert und zu einem gemeinsamen Datenbestand zusammengeführt. Fehlende, widersprüchliche und als falsch identifizierte Daten werden aus den Datenbeständen entfernt.
(4) Codierung: Viele Verfahren benötigen die Daten in einer bestimmten Form; neuronale Netze z.B. häufig in einer dichotomen (0,1 oder -1,1) oder stetigen Form (nur Werte der Intervalle (0,1) oder ( –1,1)), sodass die Daten u.U. codiert werden müssen.
(5) Data Mining.
(6) Modellvalidierung: Das im Data Mining generierte Modell muss anhand von neuen Daten, die nicht für die Modellgenerierung herangezogen wurden, überprüft werden.
(7) Decodierung: Eine Decodierung der Ergebnisse aus der Data-Mining-Phase ist dann erforderlich, wenn in Phase 4 eine Codierung erfolgte.
(8) Filterung: Die extrahierten Aussagen werden nach verschiedenen Kriterien geordnet, selektiert und verdichtet.
(9) Präsentation der Ergebnisse: Die letztendlich für interessant befundenen Aussagen werden präsentiert.
GEPRÜFTES WISSEN
Über 200 Experten aus Wissenschaft und Praxis.
Mehr als 25.000 Stichwörter kostenlos Online.
Das Original: Gabler Wirtschaftslexikon