Konfidensintervallet.

konfidensinterval kom til os fra det statistiske område.Denne specifikke område, som anvendes til at estimere ukendte parametre med en høj grad af pålidelighed.Den nemmeste måde at forklare dette på er med et eksempel.

Antag, at du ønsker at udforske en tilfældig variabel, for eksempel hastigheden af serveren svar på en klient anmodning.Hver gang brugeren ringer op til et bestemt adresse, serveren reagerer på det ved forskellige hastigheder.Således test responstid er tilfældigt.Så for at konfidensintervallet bestemme grænserne for parameteren, og så vil det være muligt at hævde, at med en sandsynlighed på 95% af hastigheden serversvaret vil være i området beregnes af os.

Eller har du brug for at vide, hvor mange mennesker er klar over brand i virksomheden.Når den beregnede konfidensinterval, vil det være muligt, for eksempel, sige, at med 95% sandsynlighed andelen af forbrugere, der er klar over dette mærke er i intervallet 27% til 34%.

dette udtryk er tæt forbundet med en sådan værdi som et konfidensniveau.Den repræsenterer sandsynligheden for, at den ønskede parameter er inkluderet i konfidensinterval.Fra denne værdi afhænger af, hvor stort vil vores ønskede område.Jo større den værdi, den modtager, den smallere konfidensintervallet, og vice versa.Det er typisk indstillet til 90%, 95% eller 99%.Værdien på 95% af de mest populære.

Denne indikator påvirker også spredningen af observationer og stikprøvestørrelse.Dens definition er baseret på den antagelse, at den analyserede attribut adlyder en normalfordeling lov.Denne erklæring er også kendt som lov Gauss.Ifølge ham, dette kaldes den normale fordeling af sandsynligheder for en kontinuerlig stokastisk variabel, der kan beskrive sandsynligheden tæthed.Hvis antagelsen om normalfordeling viste sig at være forkert, kan vurderingen være forkert.

første aftale med, hvordan man beregner konfidensintervallet for forventningen.Der er to mulige tilfælde.Dispersionen (dispersion grad af den tilfældige variabel) kan være kendt eller ej.Hvis det er kendt, er vores konfidensinterval beregnes efter følgende formel:

HSR - t * σ / (sqrt (n)) & lt; = α & lt; = HSR + t * σ / (sqrt (n)), hvor

α - et tegn,

t - indstilling fra tabellen over Laplace distribution,

sqrt (n) - kvadratroden af prøvens størrelse,

σ - kvadratroden af variansen.

Hvis variansen er ukendt, kan det beregnes, hvis vi ved alle værdier af det ønskede træk.For at gøre dette, skal du bruge følgende formel:

σ2 = h2sr - (XCP) 2, hvor

h2sr - middelværdien af kvadraterne af den undersøgte egenskab,

(XCP) 2 - kvadratet på middelværdien af de træk.

formel for som i dette tilfælde er beregnet konfidensinterval lidt ændrer:

HSR - t * s / (sqrt (n)) & lt; = α & lt; = HSR + t * s / (sqrt (n)), hvor

XCP - prøve betyde,

α - et tegn,

t - parameter, som er placeret i en tabel over Student fordelingen t = t (ɣ n-1),

sqrt (n) - kvadratroden af prøvens størrelse,

s - kvadratroden af variansen.

Overvej dette eksempel.Vi antager, at resultaterne af målingerne af 7 bestemtes den gennemsnitlige værdi af testen attribut er 30 og stikprøvevariansen, som er lig med 36. Det er nødvendigt at finde en sandsynlighed på 99% konfidensinterval, der indeholder den sande værdi af den målte parameter.

først definere, hvad der er t: t = t (0,99; 7-1) = 3,71.Hjælp af ovenstående formel, får vi:

XCP - t * s / (sqrt (n)) & lt; = α & lt; = HSR + t * s / (sqrt (n))

30 - 3,71 * 36 / (sqrt(7)) & lt; = α & lt; = 30 + 3,71 * 36 / (sqrt (7))

21,587 & lt; = α & lt; = 38,413

konfidensinterval for variansen beregnes som det er tilfældet med kendte sekundær ognår der ikke er ingen data om den matematiske forventning, og vi kun kender værdien af et punkt fordomsfri estimat af variansen.Vi giver ikke formlen for beregningen, da de er ganske komplekse og, hvis det ønskes, kan de altid findes på nettet.

Vi bemærker kun, at konfidensintervallet bekvemt bestemmes ved hjælp af Excel eller en netværkstjeneste, som kaldes.