snippet

Teória odhadu

Náhodný výber a charakteristiky

V štatistike sa častokrát stretávame s výberovou metódou, ktorá je založená  na popise určitého štatistického súboru využitím údajov, ktoré sa týkajú len vybraných jednotiek tohto súboru, t.j. princíp usudzovania z časti na celok. Súbor, ktorý je predmetom výskumu sa nazýva základný súbor a súbor jednotiek, ktoré boli z neho určitým spôsobom vybrané, nazývame výberový súbor. Pri výberovej metóde sa stretávame s dvoma skupinami problémov a príslušnými teóriami, ktoré ich riešia, a to:

  • teória odhadu - rieši problémy, ktoré spočívajú v odhade určitých neznámych parametrov základného súboru na základe charakteristík výberu.
  • teória testovania hypotéz -  rieši problémy otázok porovnávania parametrov toho istého druhu v rôznych základných súboroch, porovnávania niektorého parametra základného súboru s nejakou určenou hodnotou alebo porovnávania celých rozdelení.

Nech je daný náhodný výber \(V_n\) o rozsahu \(n\), kde \(x_1,x_2,\dots,x_n\) sú namerané hodnoty. Výberový priemer náhodného výberu \(V_n\) pre prosté triedenie definujeme ako číslo \[\overline{x}=\frac{1}{n}\sum_{i=1}^n x_i\] a pre utriedené početnosti alebo intervalové triedenie ako číslo \[\overline{x}=\frac{1}{n}\sum_{i=1}^k x_i.n_i.\]  Výberový rozptyl (disperzia) náhodného výberu \(V_n\) pre prosté triedenie definujeme ako číslo \[s^2=\frac{1}{n}\sum_{i=1}^n (x_i-\overline{x})^2\] a pre  utriedené početnosti alebo intervalové triedenie ako číslo \[s^2=\frac{1}{n}\sum_{i=1}^k (x_i-\overline{x})^2.n_i.\] Modifikovaný výberový rozptyl (disperzia) náhodného výberu \(V_n\) pre prosté triedenie definujeme ako číslo \[s^{\ast 2}=\frac{1}{n-1}\sum_{i=1}^n (x_i-\overline{x})^2\] a pre  utriedené početnosti alebo intervalové triedenie ako číslo \[s^{\ast 2}=\frac{1}{n-1}\sum_{i=1}^k (x_i-\overline{x})^2.n_i,\] kde \(n_i\) sú absolútne početnosti a \(k\) je počet tried. Výberovú smerodajnú odchýlku,  resp. modifikovanú výberovú smerodajnú odchýlku náhodného výberu \(V_n\) definujeme ako číslo \(s=\sqrt{s^2}\), resp. \(s^{\ast }=\sqrt{s^{\ast 2}}\).

Bodové odhady

Pod bodovým odhadom  parametra základného súboru rozumieme nahradenie neznámej hodnoty parametra konkrétnym číslom, t.j. vhodnou výberovou charakteristikou, ktorú získame z hodnôt výberového súboru.

Nech \(\varTheta\) je sledovaný parameter základného súboru  a \(\widehat{\varTheta}\) výberová charakteristika náhodného výberu. Bodovým odhadom parametra \(\varTheta\) nazývame takú výberovú charakteristiku \(\widehat{\varTheta}\), ktorá nadobúda hodnoty blízke skutočnej hodnote parametra \(\varTheta\). Bodovým odhadom strednej hodnoty \(\mu\) základného súboru je výberový priemer \(\overline{x}=\frac{1}{n}\sum_{i=1}^n x_i\) a bodovým odhadom rozptylu  \(\sigma^2\) základného súboru je modifikovaný výberový rozptyl \(s^{\ast 2}=\frac{1}{n-1}\sum_{i=1}^n (x_i-\overline{x})^2\). Charakteristiky základného súboru sa nemenia, no charakteristiky výberového súboru sa menia v závislosti od výberu. Aj keby sme použili najvhodnejší bodový odhad, dopustíme sa chýb, a to hlavne pri odhadoch z údajov výberov malého rozsahu. Práve preto sa bodové odhady často dopĺňajú intervalovými odhadmi využitím kvantilovej funkcie resp. kvantilov náhodných rozdelení pravdepodobností.

Intervalové odhady

Niekedy je potrebné namiesto bodových odhadov použiť intervalový odhad, t.j. odhad vyjadríme pomocou intervalu spoľahlivosti, ktorý s vopred určenou pravdepodobnosťou \(\gamma\) obsahuje skutočnú hodnotu odhadovaného parametra základného súboru. Pravdepodobnosť \(\gamma\) nazývame koeficient spoľahlivosti resp. hladina spoľahlivosti a číslo \(\alpha=1-\gamma\) hladina významnosti, ktorá predstavuje akú chybovosť sme ochotní pri intervalovom odhade parametra pripustiť resp. v koľkých percentách prípadov sa skutočná hodnota parametra nebude nachádzať v intervale. Najčastejšie volíme za \(\alpha=0,01\), \(\alpha=0,05\) a \(\alpha=0,1\). Je zrejme, že zvyšovaním spoľahlivosti sa interval spoľahlivosti rozširuje, no presnosť odhadu sa znižuje. Napr. \(99\) %-ný interval je širší než \(95\) %-ný. Príliš široké intervaly spoľahlivosti nie sú pre praktické účely použiteľné. Zúžením intervalu spoľahlivosti by sa však zvýšilo riziko, že odhad nebude správny, a tak sa v praxi osvedčili najmä \(95\) %-né intervaly spoľahlivosti. V závislosti od toho, či majú intervaly spoľahlivosti hornú alebo dolnú hranicu ich delíme na:

  • jednostranný \((1-\alpha)\;100\) %-ný pravostranný interval pre parameter \(\varTheta\)  je interval \((-\infty;\varTheta_{h})\), v ktorom \(\varTheta_h\) je horná hranica a platí: \(P(\varTheta\lt \varTheta_{h})=1-\alpha\).
  • jednostranný \((1-\alpha)\;100\) %-ný ľavostranný interval pre parameter \(\varTheta\)  je interval \((\varTheta_{d};\infty)\), v ktorom \(\varTheta_d\) je dolná hranica a platí: \(P(\varTheta\gt \varTheta_{d})=1-\alpha\).
  • obojstranný \((1-\alpha)\;100\) %-ný  interval pre parameter \(\varTheta\)  je interval \((\varTheta_{d};\varTheta_{h})\), v ktorom \(\varTheta_d\) je dolná hranica, \(\varTheta_h\) je horná hranica a platí: \(P(\varTheta_{d}\lt \varTheta \lt  \varTheta_{h})=1-\alpha\).

Interval spoľahlivosti pre strednú hodnotu \(\mu\), ak poznáme smerodajnú odchýlku \(\sigma\):

Nech náhodná premenná \(X\) má normálne rozdelenie pravdepodobnosti s parametrami \(\mu\) a \(\sigma\). Nech \(n\) je rozsah náhodného výberu, \(\overline{x}\) je výberový priemer, \(\alpha\in(0;1)\) a \(y_\beta\) je \(\beta\)- kvantil rozdelenia \(N(0,1)\). Potom  intervaly spoľahlivosti pre strednú hodnotu \(\mu\) na hladine významnosti \(\alpha\) majú tvar:

  • obojstranný interval \[\mu\in\left<\overline{x}-u_{1-\frac{\alpha}{2}}.\frac{\sigma}{\sqrt{n}};\overline{x}+u_{1-\frac{\alpha}{2}}.\frac{\sigma}{\sqrt{n}}\right>\]
  • ľavostranný interval \[\mu\in\left<\overline{x}-u_{1-\alpha}.\frac{\sigma}{\sqrt{n}};\infty\right)\]
  • pravostranný interval \[\mu\in\left(-\infty;\overline{x}+u_{1-\alpha}.\frac{\sigma}{\sqrt{n}}\right>\]

Interval spoľahlivosti pre strednú hodnotu \(\mu\), ak nepoznáme smerodajnú odchýlku \(\sigma\):

Nech náhodná premenná \(X\) má normálne rozdelenie pravdepodobnosti s parametrami \(\mu\) a \(\sigma\). Nech \(n\) je rozsah náhodného výberu, \(\overline{x}\) je výberový priemer, \(s^{\ast}\) je modifikovaná výberová smerodajná odchýlka, \(\alpha\in(0;1)\) a \(t_{\beta,n-1}\) je \(\beta\)- kvantil Studentovho \(t\)-rozdelenia pravdepodobnosti s \(n-1\) stupňami voľnosti. Potom  intervaly spoľahlivosti pre strednú hodnotu \(\mu\) na hladine významnosti \(\alpha\) majú tvar:

  • obojstranný interval \[\mu\in\left<\overline{x}-t_{1-\frac{\alpha}{2},n-1}.\frac{s^{\ast}}{\sqrt{n}};\overline{x}+t_{1-\frac{\alpha}{2},n-1}.\frac{s^{\ast}}{\sqrt{n}}\right>\]
  • ľavostranný interval \[\mu\in\left<\overline{x}-t_{1-\alpha,n-1}.\frac{s^{\ast}}{\sqrt{n}};\infty\right)\]
  • pravostranný interval \[\mu\in\left(-\infty;\overline{x}+t_{1-\alpha,n-1}.\frac{s^{\ast}}{\sqrt{n}}\right>\]

Interval spoľahlivosti na odhad rozptylu \(\sigma^2\):

Nech náhodná premenná \(X\) má normálne rozdelenie pravdepodobnosti s parametrami \(\mu\) a \(\sigma\). Nech \(n\) je rozsah náhodného výberu, \(s^{\ast 2}\) je modifikovaný výberový rozptyl, \(\alpha\in(0;1)\) a \(\chi^2_{\beta,n-1}\) je \(\beta\)- kvantil \(chí\)-kvadrát rozdelenia pravdepodobnosti s \(n-1\) stupňami voľnosti. Potom  intervaly spoľahlivosti pre rozptyl \(\sigma^2\) na hladine významnosti \(\alpha\) majú tvar:

  • obojstranný interval \[\sigma^2\in\left<\frac{(n-1).s^{\ast 2}}{\chi^2_{1-\frac{\alpha}{2},n-1}};\frac{(n-1).s^{\ast 2}}{\chi^2_{\frac{\alpha}{2},n-1}}\right>\]
  • ľavostranný interval \[\sigma^2\in\left<\frac{(n-1).s^{\ast 2}}{\chi^2_{1-\alpha,n-1}};\infty\right)\]
  • pravostranný interval \[\sigma^2\in\left(0;\frac{(n-1).s^{\ast 2}}{\chi^2_{\alpha,n-1}}\right>\]

 

Páči sa Vám tento web venovaný matematike?