374 Shares 2114 views

Konfidenzintervall. Was ist das und wie kann es eingesetzt werden?

Konfidenzintervall, kam zu uns aus dem Gebiet der Statistik. Dieser bestimmte Bereich, der den unbekannten Parameter mit einem hohen Grad an Zuverlässigkeit zu schätzen, dient. Der einfachste Weg, dies zu erklären, ist mit einem Beispiel.

Angenommen, Sie einen beliebigen Wert zu erkunden, beispielsweise eine Antwortzeit des Servers auf eine Client-Anfrage. Jedes Mal, wenn der Benutzer eine bestimmte Adresse, antwortet der Server auf sie mit unterschiedlichen Geschwindigkeiten. Somit ist die Testreaktionszeit zufällig. Also, um das Konfidenzintervall die Grenzen dieses Parameters zu bestimmen und dann wird es möglich sein , zu argumentieren , dass mit einer Wahrscheinlichkeit von 95% ist die Reaktionsgeschwindigkeit von dem Server im Bereich von uns berechnet werden.

Oder Sie möchten wissen, wie viele Menschen der Marke des Unternehmens bewusst sind. Wenn das Konfidenzintervall berechnet wird, dann wird es möglich sein, zum Beispiel, zu sagen , dass eine Wahrscheinlichkeit von 95% Anteil der Verbraucher , die sich dessen bewusst sind Marke, im Bereich bis 34% von 27% ist.

Da dieser Begriff ist eng mit einem solchen Wert als Konfidenzniveau. Es ist eine Möglichkeit, dass die gewünschte Option im Konfidenzintervall enthalten. Von diesem Wert hängt davon ab, wie groß unser gewünschter Bereich liegt. Je größer der Wert, den es empfängt, desto enger ist die Vertrauensintervalle und vice versa. Typischerweise wird sie auf 90%, 95% oder 99% eingestellt. Der Wert 95% ist am beliebtesten.

Aktive Komponente wirkt sich auch auf die Verteilung der Beobachtungen und die Stichprobengröße. Seine Definition basiert auf der Annahme , dass das Attribut in Frage , unterliegt das normale Verteilungsgesetz. Diese Aussage wird auch als Gauß-Gesetz bekannt. Ihm zufolge ist dies der Normalverteilung einer kontinuierlichen Zufallsvariablen genannt, die durch die Wahrscheinlichkeitsdichte beschrieben werden kann. Wenn die Annahme der Normalverteilung erwies sich als falsch, dann könnte die Schätzung falsch sein.

Lassen Sie uns zuerst befassen, wie das Konfidenzintervall für die Berechnung der Erwartung. Es gibt zwei mögliche Fälle. Dispersion (Grad der Streuung der Zufallsvariablen) können bekannt sein oder nicht. Wenn bekannt ist, ist unser Konfidenzintervall unter Verwendung der folgenden Formel berechnet:

HSR – t * σ / (sqrt (n)) <= α <= HSR + t * σ / (sqrt (n)), wobei

α – Zeichen,

t – Parameter der Laplace-Verteilungstabelle,

sqrt (n) – die Quadratwurzel der Gesamtprobenvolumen ,

σ – die Quadratwurzel der Varianz.

Wenn die Varianz unbekannt ist, kann berechnet werden, wenn wir alle Werte der gewünschten Eigenschaft kennen. Um dies zu tun, verwenden Sie die folgende Formel:

σ2 = h2sr – (HSR) 2, wobei

h2sr – der Mittelwert der Quadrate der untersuchten Eigenschaft,

(HSR) 2 – Quadratischer Mittelwert des Merkmals.

Die Formel, nach der in diesem Fall ist Konfidenzintervall berechnet ist etwas anders:

HSR – t * s / (sqrt (n)) <= α <= HSR + t * s / (sqrt (n)), wobei

XCP – die Probe bedeuten,

α – Zeichen,

t – Parameter, der durch den Schüler Verteilungstabelle t = t gefunden wird (ɣ; n-1),

sqrt (n) – die Quadratwurzel der Stichprobengröße,

s – die Quadratwurzel der Varianz.

Betrachten Sie dieses Beispiel. Es sei angenommen, dass die Ergebnisse von 7 Messungen betragen den durchschnittlichen Wert der Testfunktion bestimmt, die 30 und die Stichprobenvarianz gleich 36 ist gleich Es sollte mit einer Wahrscheinlichkeit von 99% Konfidenzintervall ermittelt werden, die den wahren Wert des gemessenen Parameters enthält.

Zuerst definieren wir, was ist das t: t = t (0,99; 7-1) = 3,71. Unter Verwendung der obigen Formel, erhalten wir:

HSR – t * s / (sqrt (n)) <= α <= HSR + t * s / (sqrt (n))

30 bis 3,71 * 36 / (sqrt (7)) <= α <= 30 + 3,71 * 36 / (sqrt (7))

21,587 <= α <= 38,413

Das Konfidenzintervall für die Varianz berechnet wird, wie es der Fall mit bekannten Mittelwert, und wenn es keine Daten über die mathematische Erwartung, und der einzige bekannten Wert unvoreingenommene Varianzschätzung Punkt. Wir werden hier nicht die Formel für die Berechnung geben, da sie sehr komplex sind und, falls gewünscht, können sie immer auf dem Netzwerk zu finden.

Wir bemerken nur, dass das Konfidenzintervall bequem bestimmt das Excel-Programm oder Netzwerkdienst verwenden, die aufgerufen wird.