Direkt zum Inhalt

Wikipedia Version

Dieser Text basiert auf dem Artikel Konfidenzintervall aus der freien Enzyklopädie Wikipedia und steht unter der Doppellizenz GNU-Lizenz für freie Dokumentation und Creative Commons CC-BY-SA 3.0 Unported (Kurzfassung (de)). In der Wikipedia ist eine Liste der Autoren verfügbar.
Wikipedia-Version zuletzt aktualisiert am 23.09.19.

Konfidenzintervall

Konfidenzintervalle zum Niveau 95 % für 100 Stichproben vom Umfang 30 aus einer normalverteilten Grundgesamtheit. Davon überdecken 94 Intervalle den exakten Erwartungswert μ = 5; die übrigen 6 tun das nicht.

Ein Konfidenzintervall, kurz KI, (auch Vertrauensintervall, Vertrauensbereich und Erwartungsbereich genannt) ist ein Intervall aus der Statistik, das die Präzision der Lageschätzung eines Parameters (zum Beispiel eines Mittelwerts) angeben soll. Das Konfidenzintervall gibt den Bereich an, der bei unendlicher Wiederholung eines Zufallsexperiments mit einer gewissen Wahrscheinlichkeit (dem Konfidenzniveau) die wahre Lage des Parameters einschließt.

Ein häufig verwendetes Konfidenzniveau ist 95 %, so dass in diesem Fall (mindestens) 95 % aller auf Grundlage von gemessenen Daten berechneten Konfidenzintervalle den wahren Wert des zu untersuchenden Systems beinhalten. Die häufig anzutreffende Formulierung, dass der wahre Wert mit 95 % Wahrscheinlichkeit im Konfidenzintervall liegt, d. h., im vorliegenden berechneten Intervall, ist streng genommen nicht korrekt,[1][2] da der wahre Wert als gegeben (fix) und nicht stochastisch angenommen wird. Bei näherer Betrachtung sind die obere und untere Intervallgrenze des Konfidenzintervalls stochastisch, da diese Zufallsvariablen beinhalten. Folglich lautet die korrekte Formulierung: Bei der Berechnung eines Konfidenzintervalls umschließen dessen Intervallgrenzen in 95 % der Fälle den wahren Parameter und in 5 % der Fälle nicht. Das Konfidenzintervall ist so konstruiert, dass der wahre Parameter βj{\displaystyle \beta _{j}} mit Wahrscheinlichkeit (1−α){\displaystyle (1-\alpha )} überdeckt wird, wenn das Schätzverfahren für viele Stichproben wiederholt wird.

Das Schätzen von Parametern mit Hilfe von Konfidenzintervallen wird Intervallschätzung genannt, die entsprechende Schätzfunktion ein Bereichs- oder Intervallschätzer. Ein Vorteil gegenüber Punktschätzern ist, dass man an einem Konfidenzintervall direkt die Signifikanz ablesen kann. Ein für ein vorgegebenes Konfidenzniveau breites Intervall weist auf einen geringen Stichprobenumfang oder eine starke Variabilität in der Grundgesamtheit hin.

Definition

Für ein fest vorgegebenes γ∈(0,1){\displaystyle \gamma \in (0,1)} ist ein γ⋅100%{\displaystyle \gamma \cdot 100\,\%}-Konfidenzintervall für ϑ{\displaystyle \vartheta } zum Konfidenzniveau γ{\displaystyle \gamma } (auch: ein γ{\displaystyle \gamma }-Konfidenzintervall) durch die beiden – auf einer Zufallsstichprobe basierenden – Statistiken Tu=hu(X1:n){\displaystyle T_{u}=h_{u}(X_{1:n})} und Tv=hv(X1:n){\displaystyle T_{v}=h_{v}(X_{1:n})} definiert, welche[3]

P(Tu≤ϑ≤Tv)=γfu¨ralleϑ∈Θ{\displaystyle P\left(T_{u}\leq \vartheta \leq T_{v}\right)=\gamma \quad \mathrm {f{\ddot {u}}r\;alle\;} \vartheta \in \Theta }

erfüllen. Die Statistiken Tu{\displaystyle T_{u}} und Tv{\displaystyle T_{v}} sind die Grenzen des Konfidenzintervalls, für die stets Tu<Tv{\displaystyle T_{u}<T_{v}} angenommen wird. Das Konfidenzniveau γ{\displaystyle \gamma } wird auch Überdeckungswahrscheinlichkeit genannt. Die Realisierungen tu{\displaystyle t_{u}} und tv{\displaystyle t_{v}} von Tu{\displaystyle T_{u}} bzw. Tv{\displaystyle T_{v}} bilden das Schätzintervall [tu,tv]{\displaystyle [t_{u},t_{v}]}. Die Grenzen des Konfidenzintervalls sind Funktionen der Zufallsstichprobe X1:n{\displaystyle X_{1:n}} und daher ebenfalls zufällig. Im Gegensatz dazu ist der unbekannte Parameter ϑ{\displaystyle \vartheta } fest. Wenn man das Zufallsexperiment auf identische Art und Weise wiederholt, dann wird ein γ⋅100%{\displaystyle \gamma \cdot 100\,\%}-Konfidenzintervall den unbekannten Parameter ϑ{\displaystyle \vartheta } in γ⋅100%{\displaystyle \gamma \cdot 100\,\%} aller Fälle überdecken. Da der unbekannte Parameter ϑ{\displaystyle \vartheta } keine Zufallsvariable ist, kann man allerdings nicht sagen, dass ϑ{\displaystyle \vartheta } in einem γ⋅100%{\displaystyle \gamma \cdot 100\,\%}-Konfidenzintervall mit Wahrscheinlichkeit γ{\displaystyle \gamma } liegt. Solch eine Interpretation ist dem bayesschen Pendant von Konfidenzintervall, den sogenannten Glaubwürdigkeitsintervallen vorbehalten.[4]

Formelle Definition

Rahmenbedingungen

Gegeben sei ein statistisches Modell (X,A,(Pϑ)ϑ∈Θ){\displaystyle (X,{\mathcal {A}},(P_{\vartheta })_{\vartheta \in \Theta })} sowie eine zu schätzende Funktion

g:Θ→Γ{\displaystyle g\colon \Theta \to \Gamma },

die im parametrischen Fall auch Parameterfunktion genannt wird. Die Menge Γ{\displaystyle \Gamma } enthält die Werte, die Ergebnis einer Schätzung sein können. Meist ist Γ⊂Rn{\displaystyle \Gamma \subset \mathbb {R} ^{n}}

Konfidenzbereich

Eine Abbildung

C:X→P(Γ){\displaystyle C\colon X\to {\mathcal {P}}(\Gamma )}

heißt ein Konfidenzbereich, Vertrauensbereich,[5] Bereichsschätzfunktion[6] oder ein Bereichsschätzer,[5] wenn sie die folgende Bedingung erfüllt:

  • Für alle γ∈Γ{\displaystyle \gamma \in \Gamma } ist die Menge A(γ):={x∈X∣γ∈C(x)}{\displaystyle A(\gamma ):=\{x\in X\mid \gamma \in C(x)\}} in A{\displaystyle {\mathcal {A}}} enthalten. (M)

Ein Konfidenzbereich ist also eine Abbildung, die jeder Beobachtung x∈X{\displaystyle x\in X} eine vorerst beliebige Teilmenge von Γ{\displaystyle \Gamma } zuordnet (P(Γ){\displaystyle {\mathcal {P}}(\Gamma )} ist hier die Potenzmenge der Menge Γ{\displaystyle \Gamma }, also die Menge aller Teilmengen von Γ{\displaystyle \Gamma })

Die Bedingung (M) stellt sicher, dass allen Mengen A(γ){\displaystyle A(\gamma )} eine Wahrscheinlichkeit zugeordnet werden kann. Dies wird zur Definition des Konfidenzniveaus benötigt.

Konfidenzintervall

Ist Γ⊂R{\displaystyle \Gamma \subset \mathbb {R} } und ist C(x){\displaystyle C(x)} für jedes x∈X{\displaystyle x\in X} immer ein Intervall, so heißt C{\displaystyle C} auch ein Konfidenzintervall.[5]

Werden Konfidenzintervalle in der Form

C1(x)=(−∞,b+(x)],C2(x)=[b−(x),b+(x)]oderC3(x)=[b−(x),+∞){\displaystyle C_{1}(x)=(-\infty ,b^{+}(x)],\;C_{2}(x)=[b^{-}(x),b^{+}(x)]\;\;{\text{oder}}\;\;C_{3}(x)=[b^{-}(x),+\infty )},

definiert, so nennt man b+(x){\displaystyle b^{+}(x)} auch die obere Konfidenzschranke und b−(x){\displaystyle b^{-}(x)} die untere Konfidenzschranke.[7]

Konfidenzniveau und Irrtumsniveau

Gegeben sei ein Konfidenzbereich C{\displaystyle C}. Dann heißt C{\displaystyle C} ein Konfidenzbereich zum Konfidenzniveau[6] oder Sicherheitsniveau[5]1−α{\displaystyle 1-\alpha }, wenn

Pϑ({x∈X∣g(ϑ)∈C(x)})≥1−αfu¨ralleϑ∈Θ{\displaystyle P_{\vartheta }(\{x\in X\mid g(\vartheta )\in C(x)\})\geq 1-\alpha \quad \mathrm {f{\ddot {u}}r\;alle\;} \vartheta \in \Theta }.

Der Wert α{\displaystyle \alpha } wird dann auch das Irrtumsniveau[5] genannt. Eine allgemeinere Formulierung ist mit Formhypothesen möglich (siehe Formhypothesen#Konfidenzbereiche zu Formhypothesen).

Für die oben genannten Spezialfälle bei Konfidenzbereichen mit oberer und unterer Konfidenzschranke ergibt sich somit

Pϑ(g(ϑ)≤b+(x))≥1−α{\displaystyle P_{\vartheta }(g(\vartheta )\leq b^{+}(x))\geq 1-\alpha }

bzw.

Pϑ(b−(x)≤g(ϑ)≤b+(x))≥1−α{\displaystyle P_{\vartheta }(b^{-}(x)\leq g(\vartheta )\leq b^{+}(x))\geq 1-\alpha }

und

Pϑ(b−(x)≤g(ϑ))≥1−αfu¨ralleϑ∈Θ{\displaystyle P_{\vartheta }(b^{-}(x)\leq g(\vartheta ))\geq 1-\alpha \quad \mathrm {f{\ddot {u}}r\;alle\;} \vartheta \in \Theta }

Beschreibung des Verfahrens

Man interessiert sich für den unbekannten Parameter ϑ{\displaystyle \vartheta } einer Grundgesamtheit. Dieser wird durch eine Schätzfunktion aus einer Stichprobe vom Umfang n{\displaystyle n} geschätzt. Es wird davon ausgegangen, dass die Stichprobe eine einfache Zufallsstichprobe ist, in etwa die Grundgesamtheit widerspiegelt und dass deshalb die Schätzung in der Nähe des wahren Parameters liegen müsste. Die Schätzfunktion ist eine Zufallsvariable mit einer Verteilung, die den Parameter ϑ{\displaystyle \vartheta } enthält.

Man kann zunächst mit Hilfe der Verteilung ein Intervall angeben, das den unbekannten wahren Parameter ϑ{\displaystyle \vartheta } mit einer Wahrscheinlichkeit γ=1−α{\displaystyle \gamma =1-\alpha } überdeckt. Ermitteln wir z. B. das 95 %-Konfidenzintervall für den wahren Erwartungswert μ{\displaystyle \mu } einer Grundgesamtheit, dann bedeutet dies, dass wir ein Konfidenzintervall ermitteln, das bei durchschnittlich 95 von 100 gleich großen Zufallsstichproben den Erwartungswert enthält.

Beispiel

Das Verfahren kann anhand eines normalverteilten Merkmals mit dem unbekannten Erwartungswert μ{\displaystyle \mu } und der bekannten Varianz σ2{\displaystyle \sigma ^{2}} demonstriert werden: Es soll der Erwartungswert μ{\displaystyle \mu } dieser Normalverteilung geschätzt werden. Verwendet wird die erwartungstreue Schätzfunktion: der Stichprobenmittelwert X¯{\displaystyle {\overline {X}}}.

Zentrales Schwankungsintervall von X¯{\displaystyle {\overline {X}}}

Der Erwartungswert der Grundgesamtheit wird anhand unserer Stichprobe geschätzt

Schätzfunktion: X¯=1n∑i=1nXi{\displaystyle {\overline {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}}
Punktschätzung: μ^=x¯=1n∑i=1nxi,{\displaystyle {\hat {\mu }}={\overline {x}}={\frac {1}{n}}\sum _{i=1}^{n}x_{i}\,,}

wobei die Zufallsvariable Xi{\displaystyle X_{i}} (i=1,…,n){\displaystyle (i=1,\dotsc ,n)} für die i-te Beobachtung (vor der Ziehung der Stichprobe) steht. Der Stichprobenmittelwert folgt einer Normalverteilung mit Erwartungswert μ{\displaystyle \mu } und Varianz σ2n{\displaystyle {\frac {\sigma ^{2}}{n}}}

X¯∼N(μ,σ2n){\displaystyle {\overline {X}}\sim {\mathcal {N}}\left(\mu ,{\frac {\sigma ^{2}}{n}}\right)\,}.

Die Grenzen des zentralen Schwankungsintervalls

[x¯u;x¯o]{\displaystyle [{\overline {x}}_{u};{\overline {x}}_{o}]},

das μ{\displaystyle \mu } mit der Wahrscheinlichkeit 1−α{\displaystyle 1-\alpha } überdeckt, bestimmen sich aus der Beziehung

P(x¯u≤X¯≤x¯o)=1−α{\displaystyle P({\overline {x}}_{u}\leq {\overline {X}}\leq {\overline {x}}_{o})=1-\alpha }.

Man standardisiert zur Standardnormalverteilung N(0,1){\displaystyle {\mathcal {N}}(0,1)} und erhält für die standardisierte Zufallsvariable

Z=X¯−μσ/n{\displaystyle Z={\frac {{\overline {X}}-\mu }{\sigma /{\sqrt {n}}}}}

die Wahrscheinlichkeit

P(−z(1−α2)≤X¯−μσ/n≤z(1−α2))=1−α{\displaystyle P\left({-z_{\left(1-{\tfrac {\alpha }{2}}\right)}\leq {\frac {{\overline {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq z_{\left(1-{\tfrac {\alpha }{2}}\right)}}\right)=1-\alpha },

wobei z(1−α2){\displaystyle \textstyle z_{\left(1-{\frac {\alpha }{2}}\right)}} das (1−α2){\displaystyle (1-{\tfrac {\alpha }{2}})}-Quantil der Standardnormalverteilung ist. Löst man nach dem unbekannten Parameter μ{\displaystyle \mu } auf, so ergibt sich aus

P(X¯−z(1−α2)σn≤μ≤X¯+z(1−α2)σn)=1−α{\displaystyle P\left({{\overline {X}}-z_{\left(1-{\tfrac {\alpha }{2}}\right)}{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\overline {X}}+z_{\left(1-{\tfrac {\alpha }{2}}\right)}{\frac {\sigma }{\sqrt {n}}}}\right)=1-\alpha }

das (1−α){\displaystyle (1-\alpha )}-Konfidenzintervall für μ{\displaystyle \mu }

Mögliche Lage des unbekannten Parameter μ{\displaystyle \mu } im Schätzintervall um das beobachtete x¯{\displaystyle {\overline {x}}}.
KI1−α(μ)=[X¯−z(1−α2)σn; X¯+z(1−α2)σn].{\displaystyle KI_{1-\alpha }(\mu )=\left[{{\overline {X}}-z_{\left(1-{\tfrac {\alpha }{2}}\right)}{\frac {\sigma }{\sqrt {n}}};\ {\overline {X}}+z_{\left(1-{\tfrac {\alpha }{2}}\right)}{\frac {\sigma }{\sqrt {n}}}}\right].}

Das Schätzintervall, die Realisierung eines Konfidenzintervalles anhand einer konkreten Stichprobe, ergibt sich dann als

[x¯−z(1−α2)σn; x¯+z(1−α2)σn].{\displaystyle \left[{{\overline {x}}-z_{\left(1-{\tfrac {\alpha }{2}}\right)}{\frac {\sigma }{\sqrt {n}}};\ {\overline {x}}+z_{\left(1-{\tfrac {\alpha }{2}}\right)}{\frac {\sigma }{\sqrt {n}}}}\right].}

Die Grenzen des Schätzintervalles hängen jedoch von x¯{\displaystyle {\overline {x}}} ab und ändern sich damit von Stichprobe zu Stichprobe. Ist die Stichprobe aber extrem ausgefallen, überdeckt das Intervall den Parameter nicht. Dies ist in 100α % aller Stichproben der Fall, d. h., das durch x¯{\displaystyle {\overline {x}}} bestimmte Intervall überdeckt den wahren Parameter μ{\displaystyle \mu } also mit einer Wahrscheinlichkeit von 1−α{\displaystyle 1-\alpha }.

Von besonderem Interesse ist die Breite des Konfidenzintervalls. Diese bestimmt sich durch die Standardabweichung der Schätzfunktion und das gewählte Konfidenzniveau. Durch Erhöhung des Stichprobenumfangs kann die Breite verringert werden. Erwünscht ist in der Regel ein möglichst schmales Konfidenzintervall, denn dies weist bei konstantem Konfidenzniveau auf eine genaue Schätzung hin.

Als absoluter Fehler e{\displaystyle e} wird die halbe Breite des Konfidenzintervalls bezeichnet. Im obigen Fall gilt also

e=z(1−α2)σn.{\displaystyle e=z_{\left(1-{\frac {\alpha }{2}}\right)}{\frac {\sigma }{\sqrt {n}}}\,.}

Der absolute Fehler ist ein Maß für die Genauigkeit der Schätzung (Breite des Konfidenzintervalls: 2e{\displaystyle 2e}).

Der absolute Fehler ist von Bedeutung, wenn bei einem gegebenen Konfidenzintervall und einer gegebenen Konfidenzintervalllänge der benötigte Stichprobenumfang n{\displaystyle n} ermittelt werden soll. Die Frage lautet also: Welchen Stichprobenumfang benötigt man, um einen Parameter (z. B. arithmetisches Mittel) mit vorgegebener Genauigkeit und vorgegebenem Sicherheitsgrad zu schätzen?

Ausgewählte Schätzintervalle

Übersicht für stetige Verteilungen

Eine Übersicht über alle Fälle bei normalverteilten Merkmalen findet sich im Artikel Normalverteilungsmodell.

Erwartungswert eines normalverteilten Merkmals mit bekannter Varianz σ2{\displaystyle \sigma ^{2}}:

z(1−α2){\displaystyle \textstyle z_{(1-{\tfrac {\alpha }{2}})}} ist das (1−α/2){\displaystyle (1-\alpha /2)}-Quantil der Standardnormalverteilung.

[x¯−z(1−α2)σn ; x¯+z(1−α2)σn]{\displaystyle \left[{{\overline {x}}-z_{(1-{\tfrac {\alpha }{2}})}{\frac {\sigma }{\sqrt {n}}}\ ;\ {\overline {x}}+z_{(1-{\tfrac {\alpha }{2}})}{\frac {\sigma }{\sqrt {n}}}}\right]}
Erwartungswert eines normalverteilten Merkmals mit unbekannter Varianz:
Die Varianz der Grundgesamtheit wird durch die korrigierte Stichprobenvarianz
s2=1n−1∑(xi−x¯)2{\displaystyle s^{2}={\tfrac {1}{n-1}}\sum (x_{i}-{\overline {x}})^{2}}

geschätzt.

t(1−α2;n−1){\displaystyle \textstyle t_{(1-{\tfrac {\alpha }{2}};n-1)}} ist das (1−α/2){\displaystyle (1-\alpha /2)}-Quantil der t-Verteilung mit (n−1){\displaystyle (n-1)} Freiheitsgraden.

Für n>30{\displaystyle n>30} kann das Quantil der t-Verteilung näherungsweise durch das entsprechende Quantil der Standardnormalverteilung ersetzt werden.

[x¯−t(1−α2;n−1)sn ; x¯+t(1−α2;n−1)sn]{\displaystyle \left[{{\overline {x}}-t_{(1-{\tfrac {\alpha }{2}};n-1)}{\frac {s}{\sqrt {n}}}\ ;\ {\overline {x}}+t_{(1-{\tfrac {\alpha }{2}};n-1)}{\frac {s}{\sqrt {n}}}}\right]}
Erwartungswert eines unbekannt verteilten Merkmals mit unbekannter Varianz:
Falls n{\displaystyle n} genügend groß ist, kann aufgrund des zentralen Grenzwertsatzes das Konfidenzintervall bestimmt werden.
[x¯−z(1−α2)sn ; x¯+z(1−α2)sn]{\displaystyle \left[{{\overline {x}}-z_{(1-{\tfrac {\alpha }{2}})}{\frac {s}{\sqrt {n}}}\ ;\ {\overline {x}}+z_{(1-{\tfrac {\alpha }{2}})}{\frac {s}{\sqrt {n}}}}\right]}
Standardabweichung eines normalverteilten Merkmals:

χ(p;k)2{\displaystyle {\mathcal {\chi }}_{(p;k)}^{2}} ist das p-Quantil der Chi-Quadrat-Verteilung mit k{\displaystyle k} Freiheitsgraden.

[ sn−1χ(1−α2;n−1)2;sn−1χ(α2;n−1)2 ]{\displaystyle \left[\ s{\sqrt {\frac {n-1}{\chi _{(1-{\tfrac {\alpha }{2}};n-1)}^{2}}}};s{\sqrt {\frac {n-1}{\chi _{({\tfrac {\alpha }{2}};n-1)}^{2}}}}\ \right]}

Diskrete Verteilungen

Konfidenzintervalle für den Parameter p der Binomialverteilung sind beschrieben in dem

Das sogenannte Clopper-Pearson-Konfidenzintervall kann mit Hilfe der Beta- oder F-Verteilung bestimmt werden. Dieses Konfidenzintervall wird auch exakt genannt, da das geforderte Konfidenzniveau tatsächlich eingehalten wird. Bei Näherungsmethoden, die (meistens) auf der Approximation der Binomialverteilung durch die Normalverteilung basieren, wird das Konfidenzniveau oft nicht eingehalten.

Ist die Zahl der Elemente in der Grundgesamtheit bekannt, kann für den Parameter (mit Hilfe eines Korrekturfaktors) auch ein Konfidenzintervall für ein Urnenmodell ohne Zurücklegen angegeben werden.[8]

Konfidenzintervalle und Hypothesentests

Die Begriffe Konfidenzbereich und statistischer Test sind dual zueinander, unter allgemeinen Bedingungen können aus einem Konfidenzbereich für einen Parameter statistische Tests für entsprechende Punkthypothesen gewonnen werden und umgekehrt:

Testet man von einem Parameter ϑ{\displaystyle \vartheta } die Nullhypothese: ϑ=ϑ0{\displaystyle \vartheta =\vartheta _{0}}, dann wird die Nullhypothese bei einem Signifikanzniveau α{\displaystyle \alpha } nicht abgelehnt, wenn das entsprechende (1−α/2){\displaystyle (1-\alpha /2)}-Konfidenzintervall, berechnet mit den gleichen Daten, den Wert ϑ0{\displaystyle \vartheta _{0}} enthält. Daher ersetzen Konfidenzintervalle gelegentlich auch Hypothesentests.

Beispielsweise testet man in der Regressionsanalyse, ob im multiplen linearen Regressionsmodell mit der geschätzten Regressionshyperebene

y^=b0+b1x1+b2x2+…+bkxk{\displaystyle {\hat {y}}=b_{0}+b_{1}\,x_{1}+b_{2}\,x_{2}+\ldots +b_{k}\,x_{k}}

die wahren Regressionskoeffizienten βj (j=1,…,k){\displaystyle \beta _{j}\ (j=1,\ldots ,k)} gleich Null sind (siehe Globaler F-Test). Wenn die Hypothese nicht abgelehnt wird, sind die entsprechenden Regressoren xj (j=1,…,k){\displaystyle x_{j}\ (j=1,\ldots ,k)} vermutlich für die Erklärung der abhängigen Variablen y{\displaystyle y} unerheblich. Eine entsprechende Information liefert das Konfidenzintervall für einen Regressionskoeffizienten: Überdeckt das Konfidenzintervall die Null (0∈KI1−α(βj)){\displaystyle \left(0\in KI_{1-\alpha }(\beta _{j})\right)}, so ist bei einem Signifikanzniveau α{\displaystyle \alpha } der Regressionskoeffizient statistisch nicht verschieden von 0{\displaystyle 0}.

Die Begriffe der Unverfälschtheit und des gleichmäßig besten Tests lassen sich hierüber auf Konfidenzbereiche übertragen.

Beispiele für ein Konfidenzintervall

Beispiel 1

Ein Unternehmen möchte ein neues Spülmittel einführen. Um die Käuferakzeptanz auszuloten, wird das Spülmittel in einem Test-Supermarkt platziert. Mit dieser Aktion soll der durchschnittliche tägliche Absatz in einem Supermarkt dieser Größe geschätzt werden. Man definiert nun den täglichen Absatz als Zufallsvariable X{\displaystyle X} [Stück] mit den unbekannten Parametern Erwartungswert μ{\displaystyle \mu } und Varianz σ2{\displaystyle \sigma ^{2}}. Man geht auf Grund langjähriger Beobachtungen hier davon aus, dass X{\displaystyle X} annähernd normalverteilt ist. Die Marktforschungsabteilung hat ein Konfidenzniveau von 0,95 (95 %) als ausreichend erachtet. Dann wird 16 Tage lang der tägliche Absatz erfasst. Es ergibt sich

Tag 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Absatz x{\displaystyle x} 110 112 106 90 96 118 108 114 107 90 85 84 113 105 90 104

Bei normalverteilter Grundgesamtheit mit unbekannter Varianz wird das Konfidenzintervall für den Erwartungswert angegeben als

[x¯−t(1−α2;n−1)sn ; x¯+t(1−α2;n−1)sn]{\displaystyle \left[{{\overline {x}}-t_{\left(1-{\frac {\alpha }{2}};n-1\right)}{\frac {s}{\sqrt {n}}}\ ;\ {\overline {x}}+t_{\left(1-{\frac {\alpha }{2}};n-1\right)}{\frac {s}{\sqrt {n}}}}\right]}

Es ist das Mittel der Stichprobe

x¯=116⋅(110+112+⋯+104)=116⋅1632=102{\displaystyle {\overline {x}}={\frac {1}{16}}\cdot (110+112+\dotsb +104)={\frac {1}{16}}\cdot 1632=102}

und die Varianz der Stichprobe

s2=1n−1∑i=1n(xi−x¯)2=115((110−102)2+(112−102)2+⋯+(104−102)2)=115⋅1856=123,73{\displaystyle {\begin{aligned}s^{2}&={\frac {1}{n-1}}\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}\\&={\frac {1}{15}}\left((110-102)^{2}+(112-102)^{2}+\dotsb +(104-102)^{2}\right)\\&={\frac {1}{15}}\cdot 1856=123{,}73\end{aligned}}}

Es ist das (1−α/2){\displaystyle (1-\alpha /2)}-Quantil der t-Verteilung mit 15 Freiheitsgraden

t(1−α2;n−1)=t(0,975;15)=2,131{\displaystyle t_{\left(1-{\frac {\alpha }{2}};n-1\right)}=t_{\left(0{,}975;15\right)}=2{,}131}

Der Wert für t ist nicht trivial zu errechnen und muss daher aus einer Tabelle abgelesen werden.

Das 95 %-Konfidenzintervall berechnet sich dann als

[102−2,131123,7316;102+2,131123,7316]=[102−5,93;102+5,93]=[96,07;107,93]{\displaystyle \left[{102-2{,}131{\frac {\sqrt {123{,}73}}{\sqrt {16}}};102+2{,}131{\frac {\sqrt {123{,}73}}{\sqrt {16}}}}\right]=[102-5{,}93;102+5{,}93]=[96{,}07;107{,}93]}

Im Mittel enthalten 95 % der so geschätzten Intervalle den wahren Mittelwert μ{\displaystyle \mu }, also den durchschnittlichen Tagesabsatz an Spülmittelflaschen in vergleichbaren Supermärkten. Für dieses konkrete Intervall trifft die Aussage, dass es mit 95 % Wahrscheinlichkeit den wahren Mittelwert enthält, jedoch nicht zu. Man weiß lediglich, dass dieses Intervall aus einer Menge (von Intervallen) stammt, von denen 95 % den wahren Mittelwert enthalten.

Beispiel 2

Ein Unternehmen lieferte ein Los (eine Charge) von 6000 Stück (z. B. Schrauben) an den Kunden. Dieser führt mittels Stichprobennahme gemäß der internationalen Norm ISO 2859-1[9] eine Eingangsprüfung durch. Dabei werden z. B. 200 Schrauben (je nach gewähltem AQL) zufällig über das gesamte Los gezogen und auf Übereinstimmung mit den vereinbarten Anforderungen (Qualitätsmerkmalen) geprüft. Von den 200 geprüften Schrauben erfüllen 10 Stück die gestellten Anforderungen nicht. Mittels der Berechnung des Konfidenzintervalls (Excel-Funktion BETAINV) kann der Kunde abschätzen, wie groß der zu erwartende Anteil fehlerhafter Schrauben im ganzen Los ist: bei einem Konfidenzniveau von 95 % berechnet man das Clopper-Pearson-Konfidenzintervall [2,4 %, 9 %] für den Anteil fehlerhafter Schrauben im Los (Parameter: n=200, k=10).

Siehe auch

Literatur

  • Ulrich Krengel: Einführung in die Wahrscheinlichkeitstheorie und Statistik. 8. Auflage. Vieweg, 2005.
  • Joachim Hartung: Statistik. 14. Auflage. Oldenbourg, 2005.

Weblinks

Einzelnachweise

  1. Significance Test Controversy (englisch)
  2. What is the Real Result in the Target Population? In: Statistics in Brief: Confidence Intervals. PMC 2947664 (freier Volltext) (englisch)
  3. Leonhard Held und Daniel Sabanés Bové: Applied Statistical Inference: Likelihood and Bayes. Springer Heidelberg New York Dordrecht London (2014). ISBN 978-3-642-37886-7, S. 56.
  4. Leonhard Held und Daniel Sabanés Bové: Applied Statistical Inference: Likelihood and Bayes. Springer Heidelberg New York Dordrecht London (2014). ISBN 978-3-642-37886-7, S. 57.
  5. abcde Hans-Otto Georgii: Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7, S. 229, doi:10.1515/9783110215274. 
  6. ab Ludger Rüschendorf: Mathematische Statistik. Springer Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-41996-6, S. 230–231, doi:10.1007/978-3-642-41997-3. 
  7. Ludger Rüschendorf: Mathematische Statistik. Springer Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-41996-6, S. 245, doi:10.1007/978-3-642-41997-3. 
  8. Siehe zum Beispiel Kap. IV, Abschnitte 3.1.1 und 3.2 bei Hartung. Hier werden die Wilson- und Clopper-Pearson-Intervalle, sowie der Korrekturfaktor für die hypergeometrische Verteilung besprochen.
  9. Annahmestichprobenprüfung anhand der Anzahl fehlerhaften Einheiten oder Fehler [Attributprüfung] - Teil 1: Nach der annehmbaren Qualitätsgrenzlage AQL geordnete Stichprobenpläne für die Prüfung einer Serie von Losen

zuletzt besuchte Definitionen...

    GEPRÜFTES WISSEN
    Über 200 Experten aus Wissenschaft und Praxis.
    Mehr als 25.000 Stichwörter kostenlos Online.
    Das Original: Gabler Wirtschaftslexikon

    zuletzt besuchte Definitionen...

      Literaturhinweise SpringerProfessional.de

      Bücher auf springer.com