1 of 29

Plánování a hodnocení ekologických experimentů

Úvod

2 of 29

Výzkumné plány

  • neexperimentální
    • systematické měření, pozorování a popis
    • klasifikace
  • experimentální
    • manipulace s proměnnými
    • prokazování kauzality

Pokud vás problematika zajímá a chcete proniknout do filozofie podstaty proč výzkumy vůbec dělat, tak doporučuji knihu Ferjenčíka (Ferjenčík, 2000). Je sice psychologická a nikoliv ekologická, ale v češtině jednoznačně nejlépe napsaná.

3 of 29

Výběr vzorků pro pozorování a experimenty

  • základní soubor v drtivé většině případů nelze studovat
  • musíme z něj provést výběr objektů, které budeme měřit nebo měřit trápit a následně opět měřit
    • výsledkem výběru je výběrový soubor, který se vždy nějakým způsobem liší od souboru základního
    • trápí nás nejistota, do jaké míry se náš výběrový soubor liší od souboru základní

4 of 29

Výběr vzorků pro pozorování a experimenty

  • s měřenými hodnotami tak musíme pracovat jako ne s „pevnými“ hodnotami, ale hodnotami, které mají jakousi míru pravděpodobnosti výskytu
    • do jaké míry jsme ochotni nebo můžeme věřit, že to, co měříme, je „pravda“
  • jen na okraj
    • tato pravděpodobnost se mění v závislosti na tom, co o daném problému víme

5 of 29

Výběr vzorků pro pozorování a experimenty

  • veličina měřená na objektu pak vykazuje různou pravděpodobnost výskytu různých hodnot
  • tato pravděpodobnost se dá popsat rozdělením pravděpodobností a distribuční funkcí
    • u spojitých proměnných jsme schopni její derivací získat hustotu pravděpodobnosti

6 of 29

Výběr vzorků pro pozorování a experimenty

  • rozdělení (spojité veličiny)
    • normální rozdělení (viz Biostatistika)
      • nejčastěji používané
      • POZOR – měřené hodnoty mají obvykle log-normální nebo exponenciální rozdělení a před analýzou je obvykle nutná jejich transformace; u geograficky orientovaných dat je běžný Pareto model

7 of 29

Výběr vzorků pro pozorování a experimenty

  • rozdělení (diskrétní veličiny)
    • binomické rozdělení (Lepš, 1996, s. 145-148)
      • pro binomické veličiny (ano-ne; 1-0)
      • často výsledná veličina experimentu (objekt přežil-nepřežil)

Lepš, 1996, s. 146

8 of 29

Výběr vzorků pro pozorování a experimenty

  • rozdělení (diskrétní veličiny)
    • Binomické rozdělení (praktické využití)
      • odhadování pravděpodobnosti výskytu stavu binomické proměnné v základním souboru
        • např. zastoupení samic v lokální populaci potkanů
      • lze využít na posouzení proporcionality, nicméně v těchto případech se chí-kvadrát test obvykle jeví jako rozumnější (a především jednodušší) varianta

9 of 29

Výběr vzorků pro pozorování a experimenty

  • rozdělení (diskrétní veličiny)
    • Poissonovo rozdělení (Lepš, 1996, s. 139-141)
      • významné pro malý počet pozorování
      • při velkém počtu pozorování s plnění dalších podmínek se doporučuje aproximovat normálním rozdělením

Lepš, 1996, s. 140

10 of 29

Výběr vzorků pro pozorování a experimenty

  • rozdělení (diskrétní veličiny)
    • Poissonovo rozdělení (praktické využití – Lepš, 1996, s. 141-143)
      • testování náhodnosti v rozmístění (v prostoru nebo čase)
        • poměr variance a střední hodnoty je u Poissonova rozdělení roven 1 (neboť obě hodnoty se rovnají)
        • výskyt objektů je na sobě vzájemně nezávislý
          • víme-li, že daný jev se opravdu v prostoru vyskytuje náhodně, pak můžeme testovat jestli jsme v terénním pokusu zvolili plochy opravdu prostorově nenáhodně
          • známe-li hustotu rozmístění části objektů jsme schopni pomocí rozdělení modelovat (pravděpodobnostně) počet objektů v dalších plochách vymezených v území
            • pomocí binomického testu bychom mohli stejně modelovat počet pokusných ploch, ve kterých se objekt vyskytne nebo ne

11 of 29

Výběr vzorků pro pozorování a experimenty

  • krok stranou – geografické vyjádření míry náhodnosti výskytu
    • analýza nejbližšího souseda
      • Lepš (1996, s. 144-145)

12 of 29

Výběr vzorků pro pozorování a experimenty

  • další využití znalostí o teoretickém rozdělení
    • binomické a normální rozdělení lze využít pro identifikaci odhadovaného počtu měření (= velikosti vzorku), pokud hodláme dosáhnout stanovené úrovně míry pravděpodobnosti v rozhodování při statistickém testování
        • normální: Lepš (1996, s. 60-61)
        • binomické: Lepš (1996, s. 147-148)
      • velikost je pak dána ale i použitou metodou zpracování
        • např. u většiny regresních modelů je požadavek na minimálně 100 násobné opakování při splnění požadavku, aby každá varia byla identifikována alespoň na dané úrovni (kupříkladu u Dicrete Choice Modelling je to 50 na každou variantu)

13 of 29

Výběr vzorků pro pozorování a experimenty

  • výběry
    • zajištění generální reprezentativnosti
      • vůči maximálnímu možnému množství spolupůsobících faktorů
      • roste s rostoucí homogenitou základního souboru
        • čím je předpoklad heterogenity základního souboru vyšší, tím je nutné obvykle pořídit větší vzorek
    • různé typy

14 of 29

Výběr vzorků pro pozorování a experimenty

  • výběry
    • náhodný výběr
      • pochopitelně hlavní význam má pro neexperimentální plány, nicméně i u experimentů je podstatný a ovlivňuje celkový výsledek
      • podstatou je, že každý objekt má stejnou pravděpodobnost na to že bude ze základního souboru vybrán
        • zní to jednoduše, ale je ve většině případů neproveditelný
          • objektů základního souboru je mnoho
          • objekty nejsou rozmístěny náhodně, neboť sledují nějaký vyšší gradient, který není účelem mého studia
          • základní soubor je složen z heterogenních objektů

15 of 29

Výběr vzorků pro pozorování a experimenty

  • výběry
    • stratifikovaný náhodný výběr
      • jedno z mála vhodných řešení situace, kdy objektů základního souboru je mnoho, objekty jsou relativně heterogenní a výběr musí být z nějakého důvodu relativně úzký
      • na základě předchozích znalostí vybereme kritérium nebo kritéria odrážející některý významný faktor ovlivňující námi studovaný objekt a teprve v těchto kategoriích (známého faktoru) provedu náhodný výběr
        • běžně se používá právě pro testování shody nebo rozdílů mezi těmito kategoriemi
        • výběr počtu náhodně vybraných objektů by měl být ve skupině proporcionální podílu této skupiny v základním souboru

16 of 29

Výběr vzorků pro pozorování a experimenty

  • výběry
    • skupinový náhodný výběr
      • je nemožné vybírat ze všech jednotlivců (objektů) a tak volíme náhodný výběr ze skupin objektů
        • typickým příkladem je problém studia vitality zástupců čeledi Orchideaceae v chráněných územích přírody ČR – obvykle nemohu vybírat ze všech jedinců (při náhodném výběru, bych objel celou ČR), ale vyberu náhodně chráněná území (skupinový výběr) a v nich pak budu vybírat náhodně zkoumané jedince

17 of 29

Výběr vzorků pro pozorování a experimenty

  • hodnocení výběrů vzorků
    • základní metody jsme poznali v kurzu biostatistiky
      • deskriptivní statistika
      • testování statistických hypotéz
        • chí-kvadrát
        • Wilcoxon test. Man-Whiney test, t-testy, F-test, jednofaktorová ANOVA
      • závislosti kvantitativních proměnných
        • korelace – parametrická, neparametrická, parciální, mnohonásobná
        • regrese – lineární, mnohonásobná lineární

18 of 29

Výběr vzorků pro pozorování a experimenty

  • charakteristiky experimentu
    • při přípravě experimentu je třeba mít na paměti pravidla výběrů vzorků
    • experimenty se plánují s ohledem na cíle experimentu
      • tím je obvykle testování hypotézy o vazbách mezi vybranými proměnnými
    • data se sbírají s ohledem na plánované vyhodnocení
      • čili již před vlastním sběrem dat vím, kterou metodu jejich zpracování použiji

19 of 29

Výběr vzorků pro pozorování a experimenty

  • podstata experimentu
    • měříme závislé proměnné a uměle manipulujeme s proměnnou nezávislou (nebo větším počtem nezávislých proměnných)

20 of 29

Výběr vzorků pro pozorování a experimenty

  • experiment musí splňovat několik podmínek
    • příčina musí časově předcházet následku
      • to mimo jiné souvisí s vyloučením dřívějšího působení efektu na objekty experimentu = zajištění stejných „startovních“ pozic objektů před zásahem
    • příčina musí být ve vazbě na efekt
      • = při změně příčinného faktoru se mění intenzita následku
    • plán musí být navržen tak, aby vyloučil vliv nějaké další proměnné
    • musí existovat kontrolní skupina
      • tedy ta, kde je měřena závislá proměnná, ale není manipulována nezávislá proměnná
      • může sloužit ve zpracování pro odfiltrování vnějších proměnných

21 of 29

Výběr vzorků pro pozorování a experimenty

  • experimentální plány
    • v biologii a ekologii dominují jednoznačně faktoriální plány
      • nejjednodušší variantou jsou jednofaktoriální experimenty, které jsme poznali již dříve a naučili jsme se je hodnotit
        • t-testem (Lepš, 1996, obr. 5-4 a obr. 6-3)
        • jednofaktorovou ANOVAou (Lepš, 1996, obr.8-1)

22 of 29

Výběr vzorků pro pozorování a experimenty

  • experimentální plány
    • vícefaktoriální plány (Lepš, 1996, s. 89; Michálek, 2010, kap. 2.1.5-7)
      • v experimentu se snažíme prokázat působení většího množství faktorů s různým počtem úrovní na závislou proměnnou
        • obvykle nás mimo působení jednotlivých faktorů zajímá jejich spolupůsobení
      • kompletní faktoriální plán pak znamená, že v experimentu je potřeba zajistit takový počet testových skupin, který odpovídá kombinaci všech úrovní všech faktorů
        • v každé kombinaci se pak provádí jedno (bez opakování) nebo více měření (s opakováním), u kterého je obvykle vzhledem ke statistickým metodám zapotřebí stejný počet měření v jednotlivých kombinacích

23 of 29

Výběr vzorků pro pozorování a experimenty

  • experimentální plány
    • vícefaktoriální plány
      • dílčí faktoriální plán (Michálek, 2010, kap. 2.1.9) je takový, kde netestujeme všechny potenciální vazby, ale jen vybrané, protože počet měření exponenciálně roste s počtem faktorů a jejich úrovní a my nejsme schopni zajistit pokus ve všech možných kombinacích
        • existuje větší množství designů jak vytvořit dílčí vícefaktoriální plán, ale nejčastěji se používá „resolution III“
          • výběr je takový, aby byla možnost identifikovat hlavní efekt všech nezávislých proměnných na závislou proměnnou
          • přicházíme o možnost posouzení vazeb mezi závislými proměnnými (jsou neoddělitelné)
        • v biologických vědách se moc nepoužívá, obvykle se dává přednost kompletnímu plánu 2k kde k je obvykle max. 4

24 of 29

Výběr vzorků pro pozorování a experimenty

  • experimentální plány
    • úplné znáhodnělé bloky
      • jejich cílem je zabránění projevu autokorelace plynoucí z blízkosti sledovaných objektů (Lepš, 1996, s. 94-95)
        • prakticky vše se v živých, sociálních i neživých systémech nemění skokově, ale postupně podél gradientů, proto bližší věci mají podobnější charakteristiky než věci vzdálenější (viz. kurz Biogeografie)
        • podstatou je provádění zásahů v blocích (Michálek, 2010, kap. 2.1.2)
          • v každém bloku (tím může být jedna louka ze zkoumaných luk nebo jedna populace ze zkoumaných populací) se prování experimentální zásahy samostatně
          • bloků je pak tolik, kolik je typů zásahů (faktorů) plus 1 (což je kontrolní plocha)
        • teoreticky existuje i možnost provádět experimenty v neúplně znáhodnělých blocích, v praxi biologických experimentů se toho ale nevyužívá, pokud to není nutné

25 of 29

Výběr vzorků pro pozorování a experimenty

  • experimentální plány
    • latinský čtverec (Michálek, 2010, kap. 2.1.3
      • systematické blokování dvou vybraných faktorů
        • v podstatě se tímto postupem na zásah zprůměrovává vliv těchto dvou proměnných a jde tak o faktoriální variantu tvorby bloků
        • cílem je, aby zásahy (včetně kontroly) byly v tomto čtverci v každém sloupci i řádku provedeny právě jednou a v jiné pořadové pozici (a tedy každý zásah se objeví ve stejné pořadové pozici stejně často)
        • latinských čtverců na daný počet zásahů lze vytvořit více, pokud je důležitou proměnou nikoliv prostor, ale čas, pak by měla být dodržena ještě zásada, že všechny úrovně ve vzájemně předcházejí a následují stejně často (Ferjenčík, 2000, s. 98)

26 of 29

Výběr vzorků pro pozorování a experimenty

  • experimentální plány
    • nested design (Lepš, 1996, s. 104-105; Quinn and Keough, 2003, s. 208-210)
      • za „nested“ můžeme považovat všechny experimenty které provádí výběr výzkumných objektů skupinovým výběrem – viz typický příklad 2 z Lepše (lepš, 1996, s. 104)
      • stejně pokud sleduji gradienty na kolika transektech, tak vlastní plochy jsou hlavním faktorem a jednotlivé transekty pak „nested“ faktorem

27 of 29

Výběr vzorků pro pozorování a experimenty

  • experimentální plány
    • opakovaná měření
      • nezapomínejte, že objekt experimentu měříme minimálně dvakrát – před a po zásahu – a proto tato měření nejsou vzájemně nezávislá, což je třeba zohlednit při statistickém zpracování

28 of 29

Statistické metody zpracování dat získaných z experimentů

  • jednorozměrné metody
    • komplikovanější regresní modely
      • mnohonásobná regrese do níž vstupují na straně vysvětlované nebo vysvětlující proměnné data charakteru binárního, nominálního, ordinálního
    • komplikovanější modely ANOVA
      • factorial
      • opakovaná měření
      • hierarchická ANOVA
    • ANCOVA
  • vícerozměrné metody
    • klasifikace
      • různé typy shlukových analýz
    • analýzy, kde na straně vysvětlovaných proměnných není jedna proměnná, ale vysvětlujeme strukturu většího (často velmi velkého) množství proměnných

29 of 29

Použitá literatura

  • Lepš, J. (1996). Biostatistika. BF JU v Č.B.
  • Ferjenčík, J. (2000). Úvod do metodologie psychologického výzkumu. Portál: Praha.
  • Michálek, J. (2010). Navrhování a vyhodnocování experimentů (DOE). VUTBR: Brno.
  • Quinn, G. P. et Keough, M. J. (2003). Experimental design and data analysis for biologists. Cambridge University Press