Das Konfidenzintervall.

Konfidenzintervall kam zu uns aus dem Gebiet der Statistik.Dieser spezifische Bereich, der verwendet wird, um die unbekannten Parameter mit einem hohen Grad an Zuverlässigkeit zu schätzen.Der einfachste Weg, dies zu erklären, ist ein Beispiel.

Angenommen, Sie möchten eine beliebige Zufallsvariable erkunden möchten, beispielsweise die Geschwindigkeit des Servers als Antwort auf eine Client-Anfrage.Jedes Mal, wenn der Benutzer eine bestimmte Adresse wählt, antwortet der Server, um es mit verschiedenen Geschwindigkeiten.Somit ist die Testantwortzeit zufällig.So, das Vertrauensintervall, um die Grenzen des Parameters zu bestimmen, und dann wird es möglich sein, zu behaupten, dass mit einer Wahrscheinlichkeit von 95% der Geschwindigkeit Server-Antwort wird in der von uns berechneten Bereichs liegen.

Oder wollen Sie wissen, wie viele Menschen über die Marke des Unternehmens sind brauchen.Wenn das berechnete Vertrauensintervall ist es möglich, beispielsweise sagen, dass mit 95% -Wahrscheinlichkeit der Anteil der Verbraucher, der Kenntnis von dieser Marke sind im Bereich von 27% bis 34%.

dieser Begriff ist eng mit einem solchen Wert als Konfidenzniveau.Sie stellt die Wahrscheinlichkeit dar, dass die gewünschten Parameter in dem Vertrauensintervall enthalten.Von diesem Wert hängt davon ab, wie groß unsere gewünschten Bereich.Je größer der Wert, den es empfängt, desto enger wird der Vertrauensbereich, und umgekehrt.Typischerweise ist es bei 90%, 95% oder 99% eingestellt.Der Wert von 95% der beliebtesten.

Dieser Indikator beeinflusst auch die Dispersion der Beobachtungen und Stichprobengröße.Seine Definition basiert auf der Annahme, dass die analysierten Attribut gehorcht einer Normalverteilung Recht.Diese Feststellung wird auch als das Gesetz der Gauß bekannt.Ihm zufolge wird dies als die Normalverteilung von Wahrscheinlichkeiten einer kontinuierlichen Zufallsvariable, die Wahrscheinlichkeitsdichte beschreiben kann.Wenn die Annahme der Normalverteilung erwies sich als falsch, kann die Bewertung nicht korrekt.

ersten Deal mit, wie Sie das Vertrauensintervall für den Erwartungswert zu berechnen.Es gibt zwei mögliche Fälle.Die Dispersion (Dispersionsgrad der Zufallsvariablen) können bekannt sein oder nicht.Wenn bekannt ist, ist unser Konfidenzintervall unter Verwendung der folgenden Formel berechnet:

HSR - t * σ / (sqrt (n)) & lt; = α & lt; = HSR + t * σ / (sqrt (n)), wobei

α - ein Zeichen,

t - Option aus der Tabelle der Laplace-Verteilung,

sqrt (n) - die Quadratwurzel der Stichprobengröße,

σ - die Quadratwurzel der Varianz.

Wenn die Varianz bekannt ist, kann berechnet werden, wenn wir wissen, alle Werte des gewünschten Merkmals.Um dies zu tun, verwenden Sie die folgende Formel:

σ2 = h2sr - (XCP) 2, wobei

h2sr - der Mittelwert der Quadrate der untersuchten Eigenschaft,

(XCP) 2 - das Quadrat der Mittelwert des Merkmals.

Formel für die in diesem Fall berechnete Vertrauensintervall geringfügig ändert:

HSR - t * s / (sqrt (n)) & lt; = α & lt; = HSR + t * s / (sqrt (n)), wobei

XCP - Stichprobenmittelwert,

α - ein Zeichen,

t - Parameter, die in einer Tabelle der Student-Verteilung t = t liegt (ɣ; n-1),

sqrt (n) - die Quadratwurzel der Stichprobengröße,

s - die Quadratwurzel der Varianz.

Betrachten Sie dieses Beispiel.Wir gehen davon aus, dass die Ergebnisse der Messungen von 7 wurde festgestellt, wird der Mittelwert der Testattribut ist 30 und die Stichprobenvarianz, die gleich 36 ist, müssen wir eine Wahrscheinlichkeit von 99% Konfidenzintervall, die den wahren Wert der gemessenen Parameter enthält zu finden.

zunächst definieren, was ist die t: t = t (0,99; 7-1) = 3,71.Unter Verwendung der obigen Formel, erhalten wir:

XCP - t * s / (sqrt (n)) & lt; = α & lt; = HSR + t * s / (sqrt (n))

30 bis 3,71 * 36 / (sqrt(7)) & lt; = α & lt; = 30 + 3,71 * 36 / (sqrt (7))

21,587 & lt; = α & lt; = 38,413

Konfidenzintervall für die Varianz berechnet wird, wie es der Fall mit bekannten sekundären undwenn es keine Daten über die mathematische Erwartung, und wir wissen, nur den Wert eines Punktes unvoreingenommene Schätzung der Varianz.Wir nehmen nicht die Formel für die Berechnung, da sie ziemlich komplex und, falls gewünscht, können sie stets auf dem Netz zu finden sind.

Wir bemerken nur, dass das Vertrauensintervall liegt mit Excel oder einen Netzwerkdienst, die aufgerufen wird, bestimmt.