Unter Data-Mining wird die systematische Analyse von großen Datenmengen verstanden, um Trends, Muster und Zusammenhänge zu erkennen. Das Verfahren nutzt KI-Algorithmen, um selbstständig relevante Informationen zu entdecken.
Im Zusammenhang mit Data-Mining ist oft von Big Data die Rede. Beide Begriffe werden zum Teil als Synonyme verwendet, was aber falsch ist. Der Unterschied liegt im Detail:
Data-Mining ist im Prinzip nicht auf Big Data beschränkt. Das Verfahren zeigt aber insbesondere bei extrem großen Datenmengen seine Stärken und kommt deshalb hauptsächlich dort zur Anwendung.
Daher stammt auch der Ursprung des Begriffs: Im Bergbau (engl. mining) kommt es darauf an, extrem große Mengen an Gestein abzubauen und aufzubereiten, um die gewünschten Metalle oder Edelsteine zu gewinnen.
Data-Mining nutzt insbesondere statistische Verfahren zur Gewinnung von Informationen. Hierbei werden auch Algorithmen eingesetzt, die auf Künstlicher Intelligenz beruhen. Dazu gehören zum Beispiel folgende Methoden:
Data-Mining eignet sich vor allem für Risikoanalysen im Finanz- und Versicherungswesen sowie für die Vorhersage von Kundenreaktionen im Online-Handel. Auch in der Medizin gibt es zahlreiche Einsatzbereiche von Data-Mining.