Benutzerspezifische Werkzeuge
Sie sind hier: Startseite Lexikon Technologische und methodische Grundlagen Statistik

Statistik

Ausgehend von Anmerkungen zum Begriff Statistik und seiner Geschichte werden zentrale Teilgebiete der statistischen Methodenlehre umrissen. Dabei wird insbesondere auf praktische Fragen der empirischen Datenanalyse eingegangen.

Historische Anmerkungen

Die etymologischen Wurzeln des Begriffes "Statistik" finden sich im neulateinischen "statistica, statisticum" (den Staat und seinen Status betreffend), und im ital. "statista" (Staatsmann, Politiker). Im 17. und seit Beginn des 18. Jh. (vgl. Achenwall 1749) wurde Statistik für Beschreibung des Zustandes eines Staates (ital. "statistica") benutzt. Heute lassen sich zwei Bedeutungen im Gebrauch des Begriffes Statistik unterscheiden: zum einen (insbesondere in der Fachsprache) die Wissenschaft von der Entwicklung und Anwendung empirischer Methoden zur Analyse von Massendaten in Natur und Gesellschaft, zum anderen (insbesondere umgangssprachlich) die Ergebnisse dieser Analysen und deren Präsentation in Form von Tabellen, Graphiken und Kennziffern (Maßzahlen, Statistiken).

Definition

"Dabei sind empirische Ergebnisse von großer Wichtigkeit, um Zusammenhänge zu verstehen, Theorien zu generieren, Hypothesen zu testen oder Meinungsbilder zu gewinnen."
[DAGStat-Bulletin 2008, Nr. 1, S. 5].

Die Statistik liefert Verfahren der quantitativen empirischen Analyse und wird in vielen wissenschaftlichen Disziplinen als Methode eingesetzt. Dabei befasst sie sich im Einzelnen mit Verfahren zu Datenerhebungen, der Aufbereitung und Darstellung der Daten zum Zwecke der Informationsgewinnung, der Datenanalyse unter Verwendung stochastischer Modelle und unter Berücksichtigung der spezifischen datengenerierenden Prozesse sowie mit der Interpretation der empirischen Analysen zur Entwicklung von Handlungsempfehlungen in Entscheidungssituationen, zur Überprüfung von Hypothesen und für Prognosen. Statistische Untersuchungen umfassen folglich Projektplanung, Datenerhebung, Datenaufbereitung, Analyse, Interpretation und Dokumentation. Wie jede andere wissenschaftliche Disziplin hat sich die Statistik im Laufe der Jahre immer weiter ausdifferenziert.

Teilgebiete

Wie viele andere wissenschaftliche Disziplinen hat sich die Statistik im Laufe der Jahre immer weiter ausdifferenziert. Wichtige Teilgebiete der modernen Statistik sind: Deskriptive (beschreibende) Statistik, Explorative (hypothesen-entdeckende) Statistik, Induktive (schließende) Statistik und weitere inferenzstatistische Methoden, Statistische Entscheidungstheorie, Rechnergestützte Statistik (Computational Statistics), Data Mining.

Deskriptive Statistik

Die deskriptive Statistik befasst sich mit der Aufbereitung und Beschreibung der Daten. Dazu gehören Fragen der Kodierung, der problemadäquaten Variablendefinitionen, der Identifikation von Messfehlern und Ausreisserwerten sowie die Behandlung fehlender Werte, die Informationsverdichtung in Form von Tabellen, Graphiken und Maßzahlen unter Berücksichtigung der Variablentypen. Als Datenquellen kommen Erhebungen der amtlichen Statistik (wie z.B. Statistisches Bundesamt, Statistische Landesämter, Bundesbank, Eurostat, OECD, UNO, IWF, Weltbank), der nichtamtlichen Statistik (Forschungsinstitute wie z.B. DIW, HWWA, IAW, IFO, IfW, IWH, IWW, IZA, RWI, ZEW, GfK, Allensbach) oder eigene Erhebungen in Form von Umfragen, Beobachtungen oder Experimenten in Betracht. In neuerer Zeit hat die Bedeutung von Internetquellen für die angewandte Statistik ständig zugenommen. Allerdings bleiben dabei häufig Fragen nach der Seriosität der Datenproduzenten und der Datenqualität (Repräsentativität, Objektivität, Validität und Reliabilität) offen. Wird bei der statistischen Analyse auf vorhandene Datenquellen zurückgegriffen, spricht man von Sekundärerhebungen, werden eigene Erhebungen durchgeführt, spricht man von Primärerhebungen. Werden alle für eine Fragestellung relevanten Objekte erfasst, spricht man von Vollerhebung. Kostengründe sprechen aber häufig für Teilerhebungen.

Induktive Statistik und weitere statistische Inferenzmethoden

Mit der Frage, wie sich aufgrund von Informationen aus Teilerhebungen Aussagen für die insgesamt interessierende Grundgesamtheit gewinnen lassen, beschäftigt sich die induktive Statistik Durch die Benutzung spezieller wahrscheinlichkeitstheoretischer Modelle und statistischer Methoden der Schätz- und Testtheorie lassen sich entsprechende Aussagen treffen, die mit Unsicherheit behaftet sind, deren Unsicherheit aber abgeschätzt und quantifiziert werden kann. Mit Hilfe explorativer Methoden, dazu gehören im weitesten Sinne auch Methoden des Data Mining, sollen in großen Datensätzen unter intensiver Nutzung spezifischer Software und Computerunterstützung Muster und Regelmäßigkeiten, Regeln und Zusammenhänge zwischen Objekten und/oder Variablen aufgedeckt und für weitere wissenschaftliche Untersuchungen bereitgestellt werden. Während die induktive Statistik hauptsächlich modellorientiert und hypothesen-überprüfend vorgeht, zählen die meisten explorativen Methoden zu den datenorientierten hypothesen-erzeugenden Verfahren. Eine strikte Trennung dieser Vorgehensweisen ist aber in der Praxis wenig hilfreich, "Lernen aus Daten" ist schließlich das Ziel statistischen Arbeitens in allen Fachdisziplinen. Dabei muss auch den Besonderheiten der Fragestellungen und der Datenbeschaffenheit jeweils Rechnung getragen werden. Entsprechende Spezialisierungen führten zu Teildisziplinen wie Ökonometrie (Statistische Datenanalyse in der Ökonomik) oder Biometrie (Statistische Methoden der Biologie). Hinsichtlich der Datenstrukturen sind auch Querschnitts-, Längsschnitt- und Paneldatenanalysen zu unterscheiden, die ebenfalls zu entsprechenden Spezialisierungen in der statistischen Arbeit führten. Nach wie vor sind auch Grundlagenfragen der statistischen Inferenz, der Modellierung und der Messung von Unsicherheit und Risiko Gegenstand lebhafter Kontroversen innerhalb der Statistik.

Literatur

Achenwall, Gottfried: Statsverfassung der heutigen vornehmsten europäischen Reiche und Völker im Grundrisse. Göttingen 1749.

Anderson, David R. et al.: Statistics for Business and Economics. Thomson : London 2007.

Bamberg, Günter ; Baur, Franz ; Krapp, Michael: Statistik. 16., korrigierte Auflage. Oldenbourg : München et al. 2011.

Bortz, Jürgen: Statistik für Human- und Sozialwissenschaftler. 7., vollständig überarbeitete und aktualisierte Auflage. Springer : Berlin et al. 2010.

Fahrmeir, Ludwig ; Künstler, Rita ; Pigeot, Iris ; Tutz, Gerhard: Statistik. Der Weg zur Datenanalyse. 7., überarbeitete Auflage. Springer : Berlin et al. 2010.

Hartung, Joachim ; Elpelt, Bärbel ; Klösener, Karl-Heinz: Statistik. Lehr- und Handbuch der angewandten Statistik. 15., unwesentlich veränderte Auflage. Oldenbourg : München et al. 2009.

Schira, Josef: Statistische Methoden der VWL und BWL. 3. Aktualisierte Auflage. Pearson Studium: 2009.

Schwarze, Jochen: Grundlagen der Statistik Band 1: Beschreibende Verfahren.11. vollständig überarbeitete Auflage. Verlag nwb Herne: 2009.

Schwarze, Jochen: Grundlagen der Statistik Band 2: Wahrscheinlichkeitsrechnung und induktive Statistik. 9. Auflage. Verlag nwb Herne: 2009.

Einordnung: ,
Zuletzt bearbeitet: 12.09.2011 11:44
Letzter Abruf: 07.02.2012 20:22
Artikelaktionen