Konfidensintervall

Et konfidensintervall er et intervall over mulige verdier for en parameter i en statistisk modell. For et gitt konfidensnivå, α, vil et 100 ( 1 α ) {\displaystyle 100(1-\alpha )} %-konfidensintervall med sannsynlighet (1-α) inneholde den sanne parameterverdien.

Innenfor statistikk er tolkningen av konfidensintervall omstridt. Det hersker enighet om at utsagn av typen P ( X < θ < Y ) = 1 α {\displaystyle P(X<\theta <Y)=1-\alpha } gir mening når X  og  Y {\displaystyle X{\text{ og }}Y} har gitte sannsynlighetsfordelinger. Den klassiske forståelsen er derimot at realiserte konfidensintervall av typen P ( 2.34 < θ < 5.69 ) = 1 α {\displaystyle P(2.34<\theta <5.69)=1-\alpha } ikke gir mening så lenge parameteren θ {\displaystyle \theta } ikke har en spesifisert apriorifordeling (hvis parameteren har en apriorifordeling kaller man det ikke lenger konfidensinterval, men et kredibilitetsintervall).

Den fidusiale forståelsen, som lenge ble sett på som utdatert, men har fått mer oppmerksomhet de siste årene, er derimot at utsagn av typen P ( 2.34 < θ < 5.69 ) = 1 α {\displaystyle P(2.34<\theta <5.69)=1-\alpha } gir mening, selv om parameteren ikke har en apriorifordeling, fordi den sanne verdien av parameteren er heftet ved epistemisk usikkerhet. Se Usikkerhet i SNL [1]for definisjon av epistemisk usikkerhet. Se Confidence, Likelihood, Probability (Schweder og Hjort, 2016)[2] for en grundig innføring i den fidusiale forståelsen av konfidensintervall eller anmeldelsen av boken[3] for en kortere gjennomgang.

Definisjon

La en datagenererende prosess ha sannsynlighetstetthet f ( x | θ ) {\displaystyle f(x|\theta )} .

( a , b ) {\displaystyle (a,b)} er et 100 ( 1 α ) % {\displaystyle 100(1-\alpha )\%} -konfidensintervall for θ {\displaystyle \theta } hvis P ( a < θ < b ) = 1 α {\displaystyle P(a<\theta <b)=1-\alpha } .


Vi går gjennom noen kjente eksempler for å demonstrere hvordan man finner konfidensintervall i praksis.

Eksempel for snitt til en normalfordeling med kjent varians

La oss tenke at vi skal samle inn n uavhengige og identisk fordelte observasjoner fra en normalfordelt populasjon med kjent varians. Da er X 1 , X 2 , , X n N ( μ , σ 2 ) {\displaystyle X_{1},X_{2},\dots ,X_{n}\sim {\mathcal {N}}(\mu ,\sigma ^{2})} . Vi vet at X ¯ μ σ / n N ( 0 , 1 ) {\displaystyle {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\sim {\mathcal {N}}(0,1)} , der X ¯ = 1 n i = 1 n X i {\displaystyle {\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}} . Ved å se på tabeller for kumulativ sannsynlighet for standardnormalfordelt variabel finner vi at

P ( 1.96 < X ¯ μ σ / n < 1.96 ) = 0.95 {\displaystyle P(-1.96<{\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}<1.96)=0.95}

Da kan vi få et uttrykk for μ {\displaystyle \mu } alene

P ( X ¯ 1.96 σ n < μ < X ¯ + 1.96 σ n ) = 0.95 {\displaystyle P({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}<\mu <{\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}})=0.95}

og ( X ¯ 1.96 σ n , X ¯ + 1.96 σ n ) {\displaystyle ({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}},{\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}})} er da et 95% konfidensintervall for μ {\displaystyle \mu } .

I 90 %- og 99 %-konfidensintervall bytter vi ut 1,96 med henholdsvis 1,64 og 2,58.

Eksempel for snitt til en normalfordeling med ukjent varians

Vi ser på situasjonen der vi skal samle inn n uavhengige og identisk fordelt fra en normalfordelt observasjon. Da er X 1 , X 2 , , X n N ( μ , σ 2 ) {\displaystyle X_{1},X_{2},\dots ,X_{n}\sim {\mathcal {N}}(\mu ,\sigma ^{2})} . Vi vet at X ¯ μ S / n t n 1 {\displaystyle {\frac {{\bar {X}}-\mu }{S/{\sqrt {n}}}}\sim t_{n-1}} der S {\displaystyle S} er standardfeilen. For et gitt konfidensnivå α {\displaystyle \alpha } kan vi finne de kritiske verdiene for students t-fordeling slik at

P ( t α / 2 , n 1 < X ¯ μ S / n < t α / 2 , n 1 ) = 1 α {\displaystyle P(-t_{\alpha /2,n-1}<{\frac {{\bar {X}}-\mu }{S/{\sqrt {n}}}}<t_{\alpha /2,n-1})=1-\alpha }

Vi kan isolere μ {\displaystyle \mu } og få

P ( X ¯ t α / 2 , n 1 S n < μ < X ¯ + t α / 2 , n 1 S n ) = 1 α {\displaystyle P({\bar {X}}-t_{\alpha /2,n-1}{\frac {S}{\sqrt {n}}}<\mu <{\bar {X}}+t_{\alpha /2,n-1}{\frac {S}{\sqrt {n}}})=1-\alpha }

slik at

( X ¯ t α / 2 , n 1 S n , X ¯ + t α / 2 , n 1 S n ) {\displaystyle ({\bar {X}}-t_{\alpha /2,n-1}{\frac {S}{\sqrt {n}}},{\bar {X}}+t_{\alpha /2,n-1}{\frac {S}{\sqrt {n}}})}

er et 100 ( 1 α ) % {\displaystyle 100(1-\alpha )\%} -konfidensintervall for μ {\displaystyle \mu } .

Se også

  • Feilmargin
  • Kvantil
  • Varians
  • Prediksjonsintervall

Referanser


  • v
  • d
  • r
Statistikk
Deskriptiv statistikk
Kategoriske variabler
Målenivå
  • Nominalnivå
  • Ordinalnivå
Kontinuerlige variabler
Målenivå
  • Intervallnivå
  • Skalanivå
Sentralitet
  • Gjennomsnitt
    • Aritmetisk
    • Geometrisk
    • Harmonisk
  • Median
  • Typetall
Spredning
Moment
Statistiske grafer
Statistisk inferens
og
hypotesetest
Inferens
Forsøksdesign
Utvalgsstørrelse
  • Statistisk styrke
  • Effektstørrelse
  • Standardfeil
  • Momentmetodem
  • Tetthetsestimering
Statistiske tester
Overlevelsesanalyse
  • Overlevelsesfunksjon
  • Kaplan–Meier
  • Logrank-test
  • Feilrate
  • Cox-regresjon
Korrelasjon
og
regresjonsanalyse
Korrelasjon
Lineær regresjon
Ikke-standard
  • Ikke-lineær regresjon
  • Ikke-parametrisk
  • Semi-parametrisk
  • Robust
Non-normal feilledd
  • Generalisert lineær modell
  • Binomisk
  • Poisson
  • Logistisk
Multivariat statistikk
Tidsserieanalyse
  • Dekomponering
  • Trendestimering
  • Box–Jenkins
  • ARMA-modeller
  • Spektraltetthetsestimering
  • Kategori
  • Portal
Oppslagsverk/autoritetsdata
Store norske leksikon · Store Danske Encyklopædi · Encyclopædia Britannica · MathWorld · Nationalencyklopedin · GND · LCCN
  1. ^ Aven, Terje (26. januar 2023). «usikkerhet». Store norske leksikon (norsk). Besøkt 26. oktober 2023. 
  2. ^ Schweder, Tore; Hjort, Nils Lid (24. februar 2016). Confidence, Likelihood, Probability. Cambridge University Press. ISBN 978-0-521-86160-1. 
  3. ^ Emil Aas Stoltenberg, Celine Marie Løken Cunen, Gudmund Horn Hermansen. «Bokmelding: Confidence, Likelihood, Probability: Statistical Inference With Confidence Distributions (Schweder og Hjort, CUP, 2016)». Besøkt 26. oktober 2023.