Konfidensintervallet.

konfidensintervall kom till oss från statistikområdet.Denna specifika intervall, som används för uppskattning av de okända parametrarna med en hög grad av tillförlitlighet.Det enklaste sättet att förklara detta är ett exempel.

Antag du vill utforska någon slumpvariabel, exempelvis hastigheten hos serverns svar på en begäran klient.Varje gång användaren slår en specifik adress, svarar servern att det med olika hastigheter.Sålunda är den tid provsvar slumpmässig.Så, för att konfidensintervallet bestämma gränserna för parametern, och då blir det möjligt att hävda att med en sannolikhet på 95% av den hastighet serversvar kommer att vara i intervallet beräknas genom oss.

Eller vill du behöver veta hur många människor är medvetna om varumärket för företaget.När det beräknade konfidensintervall, kommer det att vara möjligt, till exempel, säger att med 95% sannolikhet andelen konsumenter som är medvetna om detta varumärke är i storleksordningen 27% till 34%.

denna term är nära relaterad till ett sådant värde som en förtroendenivå.Det representerar sannolikheten att den önskade parametern är inkluderad i konfidensintervallet.Från detta värde beror på hur stort kommer vår önskade intervallet.Ju större värde som den tar emot, desto smalare konfidensintervall, och vice versa.Typiskt är det in på 90%, 95% eller 99%.Värdet för 95% av de mest populära.

Denna indikator påverkar även spridningen av observationer och urvalsstorlek.Dess definition är baserad på antagandet att det analyserade attributet lyder en normalfördelning lag.Detta uttalande är också känd som lag Gauss.Enligt honom, detta kallas den normala fördelningen av sannolikheterna för en kontinuerlig stokastisk variabel som kan beskriva täthets.Om antagandet om normalfördelning visade sig vara fel, kan bedömningen vara felaktig.

första affär med hur man beräknar konfidensintervallet för förväntan.Det finns två möjliga fall.Den dispersion (dispersion graden av stokastisk variabel) kan vara känd eller inte.Om det är känt, är vår konfidensintervall beräknas med hjälp av följande formel:

HSR - t * σ / (sqrt (n)) & lt; = α & lt; = HSR + t * σ / (sqrt (n)), där

α - ett tecken,

t - options från tabellen Laplaces distribution

sqrt (n) - kvadratroten av provstorleken,

σ - kvadratroten av variansen.

Om variansen är okänd, kan det beräknas om man känner till alla värdena för den önskade egenskapen.För att göra detta, använd följande formel:

σ2 = h2sr - (XCP) 2, där

h2sr - medelvärdet av kvadraterna den studerade egenskapen,

(XCP) 2 - kvadraten på medelvärdet av egenskapen.

formel som i detta fall beräknas konfidensintervall ändrar något:

HSR - t * s / (sqrt (n)) & lt; = α & lt; = HSR + t * s / (sqrt (n)), varvid

XCP - sampelmedelvärdet

α - ett tecken,

t - parametern, som ligger i en tabell i studentfördelnings t = (ɣ, n-1),

sqrt (n) - kvadratroten av provstorleken,

s - kvadratroten av variansen.

Tänk på detta exempel.Vi antar att resultaten av mätningar av 7 bestämdes medelvärdet av test attributet 30 och samplings varians, som är lika med 36. Vi måste hitta en sannolikhet på 99% konfidensintervall som innehåller det sanna värdet av den uppmätta parametern.

först definiera vad som är t: t = (0,99; 7-1) = 3,71.Med hjälp av ovanstående formel får vi:

XCP - t * s / (sqrt (n)) & lt; = α & lt; = HSR + t * s / (sqrt (n))

30 till 3,71 * 36 / (sqrt(7)) & lt; = α & lt; = 30 + 3,71 * 36 / (sqrt (7))

21,587 & lt; = α & lt; = 38,413

konfidensintervallet för variansen beräknas som är fallet med kända sekundär ochnär det inte finns några uppgifter om den matematiska förväntan, och vi bara vet värdet av en punkt objektiv uppskattning av variansen.Vi får inte ge formeln för beräkningen, eftersom de är ganska komplicerat och, om så önskas, de kan alltid hittas på nätet.

Vi noterar bara att konfidensintervallet är bekvämt bestämmas med hjälp av Excel eller en nätverkstjänst, som kallas.