Teorie za p- hodnotami a nulovou hypotézou se může na první pohled zdát komplikovanou, ale pochopení pojmů vám pomůže orientovat se ve světě statistik. Tyto termíny jsou bohužel v populární vědě často zneužívány, takže by bylo užitečné pochopit všechny základy.
Viz také náš článek Jak odstranit každý další řádek v Excelu
Výpočet p- hodnoty modelu a prokázání / vyvrácení nulové hypotézy je s MS Excel překvapivě jednoduchý. Existují dva způsoby, jak to udělat, a oba je pokryjeme. Pojďme se kopat.
Nulová hypotéza a p- hodnota
Nulová hypotéza je prohlášení, také označované jako výchozí pozice, které tvrdí, že vztah mezi pozorovanými jevy neexistuje. Může být také aplikována na asociace mezi dvěma pozorovanými skupinami. Během výzkumu tuto hypotézu otestujete a pokusíte se ji vyvrátit.
Řekněme například, že chcete pozorovat, zda konkrétní strava má významné výsledky. Nulová hypotéza, v tomto případě, je, že neexistuje žádný významný rozdíl v hmotnosti testovaných subjektů před a po dietě. Alternativní hypotéza spočívá v tom, že strava způsobila změnu. To by se vědci pokusili dokázat.
Hodnota p představuje šanci, že statistický souhrn by byl stejný nebo větší než pozorovaná hodnota, když je neplatná hypotéza pro určitý statistický model pravdivá. Ačkoli to je často vyjádřeno jako desetinné číslo, je obecně lepší vyjádřit ho v procentech. Například hodnota p 0, 1 by měla být reprezentována jako 10%.
Nízká hodnota p znamená, že důkazy proti nulové hypotéze jsou silné. To dále znamená, že vaše data jsou významná. Na druhé straně vysoká hodnota p znamená, že neexistují žádné silné důkazy proti hypotéze. Aby dokázali, že výstřelek funguje, vědci by museli najít nízkou hodnotu p .
Statisticky významný výsledek je ten, který je vysoce nepravděpodobný, pokud je neplatná hypotéza pravdivá. Úroveň významnosti je označena řeckým písmenem alfa a musí být větší než hodnota p, aby byl výsledek statisticky významný.
Mnoho vědců v celé řadě oborů používá hodnotu p k získání lepšího a hlubšího nahlédnutí do dat, se kterými pracují. Mezi významné oblasti patří sociologie, trestní soudnictví, psychologie, finance a ekonomie.
Nalezení p- hodnoty v Excelu
Hodnotu p sady dat najdete v MS Excel pomocí funkce T-Test nebo pomocí nástroje pro analýzu dat. Nejprve se podíváme na funkci T-testu. Prověříme pět vysokoškoláků, kteří chodili na 30denní stravu. Porovnáme jejich hmotnost před a po jídle.
POZNÁMKA: Pro účely tohoto článku budeme používat MS Excel 2010. Ačkoli to není nejnovější, kroky by se obecně měly vztahovat i na novější verze.
Funkce T-testu
Podle těchto kroků vypočítejte hodnotu p pomocí funkce T-Test.
- Vytvořte a naplňte tabulku. Náš stůl vypadá takto:

- Klikněte na libovolnou buňku před stolem.
- Zadejte: = T.Test (.
- Za otevřenou závorku zadejte první argument. V tomto příkladu se jedná o sloupec Before Diet. Rozsah by měl být B2: B6. Funkce zatím vypadá takto: T.Test (B2: B6.
- Dále zadáme druhý argument. Sloupec After Diet a jeho výsledky jsou naším druhým argumentem a rozsah, který potřebujeme, je C2: C6. Přidáme ji do vzorce: T.Test (B2: B6, C2: C6.
- Po druhém argumentu zadejte čárku a v rozevírací nabídce se automaticky zobrazí možnosti jednostranného rozdělení a dvouokřídého rozdělení. Pojďme si vybrat první - jednostrannou distribuci. Poklepejte na něj.
- Zadejte jinou čárku.
- V další rozbalovací nabídce dvakrát klikněte na možnost Spárováno.
- Nyní, když máte všechny potřebné prvky, zavřete závorku. Vzorec pro tento příklad vypadá takto: = T.Test (B2: B6, C2: C6, 1, 1)

- Stiskněte Enter. Buňka okamžitě zobrazí hodnotu p . V našem případě je tato hodnota 0, 1333906 nebo 13, 3906%.
Tato p- hodnota, která je vyšší než 5%, neposkytuje silný důkaz proti nulové hypotéze. V našem příkladu výzkum neprokázal, že dieta pomohla testovaným subjektům zhubnout značné množství váhy. To nutně neznamená, že nulová hypotéza je správná, pouze to, že dosud nebyla vyvrácena.
Trasa analýzy dat
Nástroj pro analýzu dat umožňuje provádět mnoho skvělých věcí, včetně výpočtů hodnoty p . Pro zjednodušení použijeme stejnou tabulku jako v předchozí metodě.
Tady je, jak se to dělá.
- Protože již máme ve sloupci D rozdíly hmotnosti, přeskočíme výpočet rozdílu. Pro budoucí tabulky použijte tento vzorec: = „Cell 1“ - „Cell 2“.
- Dále klikněte na kartu Data v hlavní nabídce.
- Vyberte nástroj pro analýzu dat.
- Přejděte seznamem dolů a klepněte na možnost t-Test: Paired Two Sample for Means.
- Klikněte na OK.
- Objeví se vyskakovací okno. Vypadá to takto:

- Zadejte první rozsah / argument. V našem příkladu je to B2: B6.
- Zadejte druhý rozsah / argument. V tomto případě je to C2: C6.
- Ponechte výchozí hodnotu v textovém poli Alpha (je 0, 05).
- Klikněte na přepínač Výstupní rozsah a vyberte, kde chcete výsledek. Pokud je to buňka A8, zadejte: $ A $ 8.
- Klikněte na OK.
- Excel vypočítá hodnotu p a několik dalších parametrů. Konečná tabulka může vypadat takto:

Jak vidíte, jednosměrná hodnota p je stejná jako v prvním případě - 0, 1333905569. Protože je nad 0, 05, platí pro tuto tabulku nulová hypotéza a důkazy proti ní jsou slabé.
Co je třeba vědět o p -Value
Zde je několik užitečných tipů ohledně výpočtů hodnoty p v Excelu.
- Pokud je hodnota p rovna 0, 05 (5%), jsou data v tabulce významná. Pokud je nižší než 0, 05 (5%), jsou údaje, které máte, velmi významné.
- V případě, že je hodnota p větší než 0, 1 (10%), jsou data v tabulce zanedbatelná. Pokud je v rozmezí 0, 05-0, 10, máte marginálně významná data.
- Hodnotu alfa můžete změnit, i když nejběžnější možnosti jsou 0, 05 (5%) a 0, 10 (10%).
- Volba oboustranného testování může být lepší volbou v závislosti na vaší hypotéze. Ve výše uvedeném příkladu znamená jednostranné testování, že zkoumáme, zda testované subjekty po jídle zhubly, a to je přesně to, co jsme potřebovali zjistit. Ale dvoukolový test by také prozkoumal, zda získali statisticky významná množství hmotnosti.
- Hodnota p nemůže identifikovat proměnné. Jinými slovy, pokud identifikuje korelaci, nemůže identifikovat příčiny, které jsou za ní.
P- hodnota demystifikovaná
Každý statistik, který stojí za svou sůl, musí znát přínosy nulového testování hypotéz a co to znamená p- hodnota. Tyto znalosti se hodí také pro výzkumné pracovníky v mnoha dalších oborech.
Už jste někdy použili Excel pro výpočet p- hodnoty statistického modelu? Jakou metodu jste použili? Dáváte přednost jinému způsobu výpočtu? Dejte nám vědět v sekci komentáře.






