2 of 29

Výzkumné plány

neexperimentální

systematické měření, pozorování a popis
klasifikace

experimentální

manipulace s proměnnými
prokazování kauzality

Pokud vás problematika zajímá a chcete proniknout do filozofie podstaty proč výzkumy vůbec dělat, tak doporučuji knihu Ferjenčíka (Ferjenčík, 2000). Je sice psychologická a nikoliv ekologická, ale v češtině jednoznačně nejlépe napsaná.

3 of 29

Výběr vzorků pro pozorování a experimenty

základní soubor v drtivé většině případů nelze studovat
musíme z něj provést výběr objektů, které budeme měřit nebo měřit trápit a následně opět měřit

výsledkem výběru je výběrový soubor, který se vždy nějakým způsobem liší od souboru základního
trápí nás nejistota, do jaké míry se náš výběrový soubor liší od souboru základní

4 of 29

Výběr vzorků pro pozorování a experimenty

s měřenými hodnotami tak musíme pracovat jako ne s „pevnými“ hodnotami, ale hodnotami, které mají jakousi míru pravděpodobnosti výskytu

do jaké míry jsme ochotni nebo můžeme věřit, že to, co měříme, je „pravda“

jen na okraj

tato pravděpodobnost se mění v závislosti na tom, co o daném problému víme

5 of 29

Výběr vzorků pro pozorování a experimenty

veličina měřená na objektu pak vykazuje různou pravděpodobnost výskytu různých hodnot
tato pravděpodobnost se dá popsat rozdělením pravděpodobností a distribuční funkcí

u spojitých proměnných jsme schopni její derivací získat hustotu pravděpodobnosti

6 of 29

Výběr vzorků pro pozorování a experimenty

rozdělení (spojité veličiny)

normální rozdělení (viz Biostatistika)

nejčastěji používané
POZOR – měřené hodnoty mají obvykle log-normální nebo exponenciální rozdělení a před analýzou je obvykle nutná jejich transformace; u geograficky orientovaných dat je běžný Pareto model

7 of 29

Výběr vzorků pro pozorování a experimenty

rozdělení (diskrétní veličiny)

binomické rozdělení (Lepš, 1996, s. 145-148)

pro binomické veličiny (ano-ne; 1-0)
často výsledná veličina experimentu (objekt přežil-nepřežil)

Lepš, 1996, s. 146

8 of 29

Výběr vzorků pro pozorování a experimenty

rozdělení (diskrétní veličiny)

Binomické rozdělení (praktické využití)

odhadování pravděpodobnosti výskytu stavu binomické proměnné v základním souboru

např. zastoupení samic v lokální populaci potkanů

lze využít na posouzení proporcionality, nicméně v těchto případech se chí-kvadrát test obvykle jeví jako rozumnější (a především jednodušší) varianta

9 of 29

Výběr vzorků pro pozorování a experimenty

rozdělení (diskrétní veličiny)

Poissonovo rozdělení (Lepš, 1996, s. 139-141)

významné pro malý počet pozorování
při velkém počtu pozorování s plnění dalších podmínek se doporučuje aproximovat normálním rozdělením

Lepš, 1996, s. 140

10 of 29

Výběr vzorků pro pozorování a experimenty

rozdělení (diskrétní veličiny)

Poissonovo rozdělení (praktické využití – Lepš, 1996, s. 141-143)

testování náhodnosti v rozmístění (v prostoru nebo čase)

poměr variance a střední hodnoty je u Poissonova rozdělení roven 1 (neboť obě hodnoty se rovnají)
výskyt objektů je na sobě vzájemně nezávislý

víme-li, že daný jev se opravdu v prostoru vyskytuje náhodně, pak můžeme testovat jestli jsme v terénním pokusu zvolili plochy opravdu prostorově nenáhodně
známe-li hustotu rozmístění části objektů jsme schopni pomocí rozdělení modelovat (pravděpodobnostně) počet objektů v dalších plochách vymezených v území

pomocí binomického testu bychom mohli stejně modelovat počet pokusných ploch, ve kterých se objekt vyskytne nebo ne

11 of 29

Výběr vzorků pro pozorování a experimenty

krok stranou – geografické vyjádření míry náhodnosti výskytu

analýza nejbližšího souseda

Lepš (1996, s. 144-145)

12 of 29

Výběr vzorků pro pozorování a experimenty

další využití znalostí o teoretickém rozdělení

binomické a normální rozdělení lze využít pro identifikaci odhadovaného počtu měření (= velikosti vzorku), pokud hodláme dosáhnout stanovené úrovně míry pravděpodobnosti v rozhodování při statistickém testování

normální: Lepš (1996, s. 60-61)
binomické: Lepš (1996, s. 147-148)

velikost je pak dána ale i použitou metodou zpracování

např. u většiny regresních modelů je požadavek na minimálně 100 násobné opakování při splnění požadavku, aby každá varia byla identifikována alespoň na dané úrovni (kupříkladu u Dicrete Choice Modelling je to 50 na každou variantu)

13 of 29

Výběr vzorků pro pozorování a experimenty

výběry

zajištění generální reprezentativnosti

vůči maximálnímu možnému množství spolupůsobících faktorů
roste s rostoucí homogenitou základního souboru

čím je předpoklad heterogenity základního souboru vyšší, tím je nutné obvykle pořídit větší vzorek

různé typy

14 of 29

Výběr vzorků pro pozorování a experimenty

výběry

náhodný výběr

pochopitelně hlavní význam má pro neexperimentální plány, nicméně i u experimentů je podstatný a ovlivňuje celkový výsledek
podstatou je, že každý objekt má stejnou pravděpodobnost na to že bude ze základního souboru vybrán

zní to jednoduše, ale je ve většině případů neproveditelný

objektů základního souboru je mnoho
objekty nejsou rozmístěny náhodně, neboť sledují nějaký vyšší gradient, který není účelem mého studia
základní soubor je složen z heterogenních objektů

15 of 29

Výběr vzorků pro pozorování a experimenty

výběry

stratifikovaný náhodný výběr

jedno z mála vhodných řešení situace, kdy objektů základního souboru je mnoho, objekty jsou relativně heterogenní a výběr musí být z nějakého důvodu relativně úzký
na základě předchozích znalostí vybereme kritérium nebo kritéria odrážející některý významný faktor ovlivňující námi studovaný objekt a teprve v těchto kategoriích (známého faktoru) provedu náhodný výběr

běžně se používá právě pro testování shody nebo rozdílů mezi těmito kategoriemi
výběr počtu náhodně vybraných objektů by měl být ve skupině proporcionální podílu této skupiny v základním souboru

16 of 29

Výběr vzorků pro pozorování a experimenty

výběry

skupinový náhodný výběr

je nemožné vybírat ze všech jednotlivců (objektů) a tak volíme náhodný výběr ze skupin objektů

typickým příkladem je problém studia vitality zástupců čeledi Orchideaceae v chráněných územích přírody ČR – obvykle nemohu vybírat ze všech jedinců (při náhodném výběru, bych objel celou ČR), ale vyberu náhodně chráněná území (skupinový výběr) a v nich pak budu vybírat náhodně zkoumané jedince

17 of 29

Výběr vzorků pro pozorování a experimenty

hodnocení výběrů vzorků

základní metody jsme poznali v kurzu biostatistiky

deskriptivní statistika
testování statistických hypotéz

chí-kvadrát
Wilcoxon test. Man-Whiney test, t-testy, F-test, jednofaktorová ANOVA

závislosti kvantitativních proměnných

korelace – parametrická, neparametrická, parciální, mnohonásobná
regrese – lineární, mnohonásobná lineární

18 of 29

Výběr vzorků pro pozorování a experimenty

charakteristiky experimentu

při přípravě experimentu je třeba mít na paměti pravidla výběrů vzorků
experimenty se plánují s ohledem na cíle experimentu

tím je obvykle testování hypotézy o vazbách mezi vybranými proměnnými

data se sbírají s ohledem na plánované vyhodnocení

čili již před vlastním sběrem dat vím, kterou metodu jejich zpracování použiji

19 of 29

Výběr vzorků pro pozorování a experimenty

podstata experimentu

měříme závislé proměnné a uměle manipulujeme s proměnnou nezávislou (nebo větším počtem nezávislých proměnných)

20 of 29

Výběr vzorků pro pozorování a experimenty

experiment musí splňovat několik podmínek

příčina musí časově předcházet následku

to mimo jiné souvisí s vyloučením dřívějšího působení efektu na objekty experimentu = zajištění stejných „startovních“ pozic objektů před zásahem

příčina musí být ve vazbě na efekt

= při změně příčinného faktoru se mění intenzita následku

plán musí být navržen tak, aby vyloučil vliv nějaké další proměnné
musí existovat kontrolní skupina

tedy ta, kde je měřena závislá proměnná, ale není manipulována nezávislá proměnná
může sloužit ve zpracování pro odfiltrování vnějších proměnných

21 of 29

Výběr vzorků pro pozorování a experimenty

experimentální plány

v biologii a ekologii dominují jednoznačně faktoriální plány

nejjednodušší variantou jsou jednofaktoriální experimenty, které jsme poznali již dříve a naučili jsme se je hodnotit

t-testem (Lepš, 1996, obr. 5-4 a obr. 6-3)
jednofaktorovou ANOVAou (Lepš, 1996, obr.8-1)

22 of 29

Výběr vzorků pro pozorování a experimenty

experimentální plány

vícefaktoriální plány (Lepš, 1996, s. 89; Michálek, 2010, kap. 2.1.5-7)

v experimentu se snažíme prokázat působení většího množství faktorů s různým počtem úrovní na závislou proměnnou

obvykle nás mimo působení jednotlivých faktorů zajímá jejich spolupůsobení

kompletní faktoriální plán pak znamená, že v experimentu je potřeba zajistit takový počet testových skupin, který odpovídá kombinaci všech úrovní všech faktorů

v každé kombinaci se pak provádí jedno (bez opakování) nebo více měření (s opakováním), u kterého je obvykle vzhledem ke statistickým metodám zapotřebí stejný počet měření v jednotlivých kombinacích

23 of 29

Výběr vzorků pro pozorování a experimenty

experimentální plány

vícefaktoriální plány

dílčí faktoriální plán (Michálek, 2010, kap. 2.1.9) je takový, kde netestujeme všechny potenciální vazby, ale jen vybrané, protože počet měření exponenciálně roste s počtem faktorů a jejich úrovní a my nejsme schopni zajistit pokus ve všech možných kombinacích

existuje větší množství designů jak vytvořit dílčí vícefaktoriální plán, ale nejčastěji se používá „resolution III“

výběr je takový, aby byla možnost identifikovat hlavní efekt všech nezávislých proměnných na závislou proměnnou
přicházíme o možnost posouzení vazeb mezi závislými proměnnými (jsou neoddělitelné)

v biologických vědách se moc nepoužívá, obvykle se dává přednost kompletnímu plánu 2^k kde k je obvykle max. 4

24 of 29

Výběr vzorků pro pozorování a experimenty

experimentální plány

úplné znáhodnělé bloky

jejich cílem je zabránění projevu autokorelace plynoucí z blízkosti sledovaných objektů (Lepš, 1996, s. 94-95)

prakticky vše se v živých, sociálních i neživých systémech nemění skokově, ale postupně podél gradientů, proto bližší věci mají podobnější charakteristiky než věci vzdálenější (viz. kurz Biogeografie)
podstatou je provádění zásahů v blocích (Michálek, 2010, kap. 2.1.2)

v každém bloku (tím může být jedna louka ze zkoumaných luk nebo jedna populace ze zkoumaných populací) se prování experimentální zásahy samostatně
bloků je pak tolik, kolik je typů zásahů (faktorů) plus 1 (což je kontrolní plocha)

teoreticky existuje i možnost provádět experimenty v neúplně znáhodnělých blocích, v praxi biologických experimentů se toho ale nevyužívá, pokud to není nutné

25 of 29

Výběr vzorků pro pozorování a experimenty

experimentální plány

latinský čtverec (Michálek, 2010, kap. 2.1.3

systematické blokování dvou vybraných faktorů

v podstatě se tímto postupem na zásah zprůměrovává vliv těchto dvou proměnných a jde tak o faktoriální variantu tvorby bloků
cílem je, aby zásahy (včetně kontroly) byly v tomto čtverci v každém sloupci i řádku provedeny právě jednou a v jiné pořadové pozici (a tedy každý zásah se objeví ve stejné pořadové pozici stejně často)
latinských čtverců na daný počet zásahů lze vytvořit více, pokud je důležitou proměnou nikoliv prostor, ale čas, pak by měla být dodržena ještě zásada, že všechny úrovně ve vzájemně předcházejí a následují stejně často (Ferjenčík, 2000, s. 98)

26 of 29

Výběr vzorků pro pozorování a experimenty

experimentální plány

nested design (Lepš, 1996, s. 104-105; Quinn and Keough, 2003, s. 208-210)

za „nested“ můžeme považovat všechny experimenty které provádí výběr výzkumných objektů skupinovým výběrem – viz typický příklad 2 z Lepše (lepš, 1996, s. 104)
stejně pokud sleduji gradienty na kolika transektech, tak vlastní plochy jsou hlavním faktorem a jednotlivé transekty pak „nested“ faktorem

27 of 29

Výběr vzorků pro pozorování a experimenty

experimentální plány

opakovaná měření

nezapomínejte, že objekt experimentu měříme minimálně dvakrát – před a po zásahu – a proto tato měření nejsou vzájemně nezávislá, což je třeba zohlednit při statistickém zpracování

28 of 29

Statistické metody zpracování dat získaných z experimentů

jednorozměrné metody

komplikovanější regresní modely

mnohonásobná regrese do níž vstupují na straně vysvětlované nebo vysvětlující proměnné data charakteru binárního, nominálního, ordinálního

komplikovanější modely ANOVA

factorial
opakovaná měření
hierarchická ANOVA

ANCOVA

vícerozměrné metody

klasifikace

různé typy shlukových analýz

analýzy, kde na straně vysvětlovaných proměnných není jedna proměnná, ale vysvětlujeme strukturu většího (často velmi velkého) množství proměnných

29 of 29

Použitá literatura

Lepš, J. (1996). Biostatistika. BF JU v Č.B.
Ferjenčík, J. (2000). Úvod do metodologie psychologického výzkumu. Portál: Praha.
Michálek, J. (2010). Navrhování a vyhodnocování experimentů (DOE). VUTBR: Brno.
Quinn, G. P. et Keough, M. J. (2003). Experimental design and data analysis for biologists. Cambridge University Press