Konfidensintervallet.

konfidensintervall kom til oss fra feltet av statistikk.Denne spesifikke område, som blir brukt til å estimere de ukjente parametrene med en høy grad av pålitelighet.Den enkleste måten å forklare dette på er med et eksempel.

Anta at du ønsker å utforske noen tilfeldig variabel, for eksempel hastigheten på serveren respons til en klient forespørsel.Hver gang brukeren slår et bestemt adresse, svarer serveren til den med forskjellige hastigheter.Således er prøveresponstiden tilfeldig.Så, for å konfidensintervallet bestemme grensene for parameteren, og det vil være mulig å påstå at med en sannsynlighet på 95% av hastigheten server respons den vil være i området beregnet av oss.

Eller trenger du å vite hvor mange som er klar over den helt av selskapet.Når den beregnede konfidensintervallet, vil det være mulig, for eksempel si at med 95% sannsynlighet den prosentandel av brukerne som er klar over dette merket er i området fra 27% til 34%.

dette begrepet er nært knyttet til en slik verdi som et sikkerhetsnivå.Det representerer sannsynligheten for at ønsket parameter er inkludert i konfidensintervallet.Fra denne verdien avhenger av hvor stor vil våre ønsket område.Jo større verdi den mottar, jo smalere konfidensintervall, og vice versa.Vanligvis er det satt til 90%, 95% eller 99%.Verdien av 95% av de mest populære.

Denne indikatoren påvirker også spredning av observasjoner og utvalgsstørrelse.Sin definisjon er basert på antagelsen om at det analyserte attributtet adlyder en normalfordeling lov.Denne uttalelsen er også kjent som loven om Gauss.Ifølge ham, dette kalles den normale fordelingen av sannsynlighetene for en kontinuerlig tilfeldig variabel som kan beskrive sannsynlighetstettheten.Dersom forutsetningen om normalfordeling viste seg å være feil, kan vurderingen være feil.

første avtale med hvordan å beregne konfidensintervall for forventningen.Det er to mulige tilfeller.Dispersjonen (dispersjon graden av tilfeldige variable) kan være kjent eller ikke.Hvis det er kjent, er vår konfidensintervall beregnes med følgende formel:

HSR - t * σ / (sqrt (n)) & lt; = α & lt; = HSR + t * σ / (sqrt (n)), hvor

α - et tegn,

t - opsjons fra bordet av Laplace distribusjon,

sqrt (n) - kvadratroten av størrelsen på utvalget,

σ - kvadratroten av variansen.

Dersom variansen er ukjent, kan det beregnes hvis vi kjenner alle verdier av den ønskede egenskap.For å gjøre dette, bruker du følgende formel:

σ2 = h2sr - (XCP) 2, der

h2sr - middelverdien av kvadratene av den studerte egenskap,

(XCP) 2 - kvadratet av gjennomsnittsverdien for egenskapen.

formel som i dette tilfelle er beregnet konfidensintervall endres litt:

HSR - t * s / (sqrt (n)) & lt; = α & lt; = HSR + t * s / (sqrt (n)), idet

XCP - utvalgsgjennomsnitt,

α - et tegn,

t - parameter, som ligger i en tabell i Student distribusjon t = t (ɣ; n-1),

sqrt (n) - kvadratroten av størrelsen på utvalget,

s - kvadratroten av variansen.

vurdere dette eksempelet.Vi antar at resultatene av målingene av 7 ble bestemt den gjennomsnittlige verdien av testen attributt er 30 og prøvetakings variansen, som er lik 36. Vi må finne en sannsynlighet på 99% konfidens- intervall som inneholder den sanne verdien av den målte parameter.

først definere hva som er t: t = t (0,99; 7-1) = 3,71.Ved hjelp av ovenstående formel, får vi:

XCP - t * s / (sqrt (n)) & lt; = α & lt; = HSR + t * s / (sqrt (n))

tretti - 3,71 * 36 / (sqrt(7)) & lt; = α & lt; = 30 + 3,71 * 36 / (sqrt (7))

21,587 & lt; = α & lt; = 38,413

konfidensintervall for variansen beregnes som er tilfelle med kjent sekundær ognår det er ingen data på den matematiske forventning, og vi bare vet verdien av et punkt estimat av variansen.Vi skal ikke gi formelen for beregningen, da de er ganske komplisert og, hvis ønskelig, kan de alltid befinner seg på nettet.

Vi bare oppmerksom på at konfidensintervallet er beleilig bestemmes ved hjelp av Excel eller en nettverkstjeneste, som kalles.