Анализ модификаций гистонов на основании данных ChIP-Seq
1
План занятия
2
Гистоновый год – названия меток
Что в химическом смысле означают метка H3K4me1, H3K36me, H3K36ac, H3K4me0?
Может ли на одной нуклеосоме находиться метки
H3K36me и H3K36ac
H3K36ac и H3K4me1
H3K4me1 и H3K4me3
H3K4me1 и H3K4ac
H3K4me1, H3K9ac, H3K14ac, H3K27me3, H3K36me3, H3K79me2, H4K12ac
?
Проект ENCODE – каталог всех функциональных элементов в геноме человека (энхансеры, промотеры и тп)
Проект ENCODE – каталог всех функциональных элементов в геноме человека (энхансеры, промотеры и тп)
Проект ENCODE – матрица со всеми экспериментами
Проект ENCODE – данные ChIP-seq (клеточные линии)
Проект ENCODE – данные ChIP-seq (первичные клетки и органы)
Проект ENCODE – визуализация через UCSC геномный браузер
Проект ENCODE – визуализация через UCSC геномный браузер
ChIP-seq на транскрипционные факторы (Transcription Factors, TFs)
Chromatin
Immuno
Precipitation
ChIP-seq for TF
Nature Reviews Genetics 13, 840-852
Технология ChIP-Seq
13
http://ccg.vital-it.ch/chipseq/doc/chipseq_tutorial_intro.php
Library Preparation
Need sufficient amount of starting material because the ChIP will enrich for a small proportion
Ideally the starting material for one ChIP uses 107 cells from culture
Crosslink proteins to DNA
https://www.jbc.org/article/S0021-9258(20)49515-8/pdf
Fragment
The DNA is sheared into small fragments - usually 200-500 bp in length
Check by running on a gel
Protein specific antibody
The sheared protein-bound DNA is immunoprecipitated using a specific antibody
Immunoprecipitate
The antibody binds primarily to the protein of interest but there may be cross reactivity with other proteins with similar epitopes
Reverse crosslink and purify DNA
Откуда антитела?
20
http://www.slideshare.net/nasagusto/monoclonal-antibodies-14851287
Давайте вернемся к шагам эксперимента и подумаем о потенциальных проблемах
Impact of sequencing depth
H3K4me3
Adapted from Jung et al (2014). NAR.
Impact of sequencing depth
H3K27me3
Adapted from Jung et al (2014). NAR.
Why are controls necessary?
17
ChIP-Seq Controls
18
Crosslink proteins to DNA
Shear DNA (sonication)
Reverse crosslink
Size selection and PCR
Immunoprecipitation
Non-specific antibody (IgG “mock IP”)
Specific antibody (ChIP enrichment)
+
No IP (Input DNA)
Biological samples/Library preparation
Сравнение сигнала и фона ("шума")
https://bioinformatics-core-shared-training.github.io/cruk-autumn-school-2017/ChIP/Materials/Lectures/Lecture5_Peak%20Calling_SS.pdf
Replicates and reproducibility
All binding
High confidence
2090
Sox2 Replicate 1
(4605)
Sox2 Replicate 2
(2382)
Bioinformatics analysis
Nature Protocols 7, 45–61 (2012)
Поиск пиков – peak calling
https://hbctraining.github.io/Intro-to-ChIPseq/lessons/05_peak_calling_macs.html
Программы поиска ChIP-seq пиков
https://bioinformatics-core-shared-training.github.io/cruk-autumn-school-2017/ChIP/Materials/Lectures/Lecture5_Peak%20Calling_SS.pdf
Peak callers
WIlbanks & Facciotti (2010). PLoS ONE.
Проект ENCODE – визуализация через UCSC геномный браузер
Downstream analysis
Figure 4. Proportion of true and false positives for each tool on the simulated FoxA1 data set (A, B) and H3K36me3 data (C, D)
Sharp ChIP-seq signal: FoxA1
Broad ChIP-seq signal: H3K36me3
Single replicate tools Multiple replicate tools
Decision tree indicating the proper choice of tool depending on the data set: shape of the signal (sharp peaks or broad enrichments), presence of replicates and presence of an external set of regions of interest [Steinhauser, et al, 2016].
Downstream analysis
Downstream analysis
Downstream analysis
Downstream analysis
TF binding motif: PWM
If you need good motifs to compare...
http://hocomoco.autosome.ru/
De novo motif search
Nature Biotechnology 24, 959 - 961 (2006)
Software for de novo motif seach: MEME suite
ChIP-seq на гистоновые модификации
Белки, которые пишут и стирают гистоновый код
В БД EpiFactors имеется информация про 69 белковых комплекса
(список не обновлялся несколько лет)
Где находятся инструкции о том где и что писать в эпигенетике?
Инструменты -- белковые комплексы, которые способны делать или убирать определенные эпигенетические модификации
Результат работы – наблюдаемые эпигенетические изменения/состояния в разных клетка организма
Инструкции? – кто указывает, что и где писать или стирать?
Длинные некодирующие РНК (lncRNA)
нкРНК MEG3 – образование триплексов
нкРНК CHASERR– ко-транскрипционное РНК-РНК вз-вия
В технологии CRISPR также используется нкРНК (gRNA)