Data Science
Übersicht
zuletzt besuchte Definitionen...
Inhaltsverzeichnis
Allgemein
Data Science (dt. "Datenwissenschaft") ist eine Disziplin, die die Erfassung, Gewinnung, Nutzung, Zusammenfügung, Verarbeitung, Untersuchung und Auswertung von Daten durch computerbasierte Systeme unterstützt, ermöglicht und erforscht. Es entstehen Informationen und Wissen über gegenwärtige und künftige Strukturen und Prozesse und damit Grundlagen für Anpassungen und Anwendungen, etwa im E-Commerce, im Straßenverkehr oder beim Klimawandel. Es gibt Verbindungen zur Informationswissenschaft und vor allem zur Statistik. Zudem bedient man sich der Methoden und Instrumente der Informatik (engl. "computer science", dt. wörtlich "Computerwissenschaft" oder "Computerwissenschaften"), einschließlich der Künstlichen Intelligenz (KI), und der Wirtschaftsinformatik. Der Data Scientist (Datenwissenschaftler) ist in Wissenschaft, Wirtschaft und Verwaltung gefragt.
Entwicklung
Der dänische Astronom und Informatiker Peter Naur ersetzte ab 1960 "computer science" durch "data science" und "datalogy" (in Dänemark und Schweden als "datalogi" adaptiert). Die Grundzüge der Disziplin wurden beim zweiten Japanese-French Scientific Seminar in Montpellier im Jahre 1992 entworfen. Die Columbia University rief 2003 The Journal of Data Science ins Leben. Zahlreiche weitere Publikationsorgane folgten, etwa das International Journal of Data Science and Analytics von Springer oder die Open-Access-Plattform Harvard Data Science Review. Zur gleichen Zeit wurden die ersten Data-Science-Studiengänge gegründet. Einen regelrechten Boom gab es im deutschsprachigen Raum ab 2016. In Deutschland, in Österreich und in der Schweiz kann man sich an Universitäten und Fachhochschulen für das Fach einschreiben, sowohl für einen Bachelor- als auch für einen Masterabschluss.
Kritik und Ausblick
Während Data Science – nicht zuletzt dank der Fortschritte in der KI – einen Aufschwung erlebt, ist die Informationswissenschaft im deutschsprachigen Raum auf dem Rückzug. Im Prinzip besteht das Risiko, dass Daten überschätzt und Informationen und Wissen unterschätzt werden. Durch die Betonung der Bedeutung der Interpretation und die Integration der Sozial- und Geisteswissenschaften wirken dem aber Fachvertreter und Studiengänge entgegen. Die Informationsethik (mitsamt der Datenethik) widmet sich u.a. der informationellen Autonomie und speziell der Frage, ob man Einzel- oder Gruppeninteressen für das Gemeinwohl zurückstellen muss. In der Maschinenethik baut man moralische Maschinen, die mit Daten in bestimmter Weise verfahren. In betrieblichen Kontexten ist zudem die Wirtschaftsethik von Belang, etwa mit Blick auf die Verarbeitung von Daten durch IT- und Internetkonzerne.