Анализ модификаций гистонов на основании данных ChIP-Seq
1
План занятия
2
Гистоновый код – названия меток
Что в химическом смысле означают метка H3K4me1, H3K36me, H3K36ac, H3K4me0?
Может ли на одной нуклеосоме находиться метки
H3K36me и H3K36ac
H3K36ac и H3K4me1
H3K4me1 и H3K4me3
H3K4me1 и H3K4ac
H3K4me1, H3K9ac, H3K14ac, H3K27me3, H3K36me3, H3K79me2, H4K12ac ?
Проект ENCODE – каталог всех функциональных элементов в геноме человека (энхансеры, промотеры и тп)
Проект ENCODE – каталог всех функциональных элементов в геноме человека (энхансеры, промотеры и тп)
Проект ENCODE – матрица со всеми экспериментами
Проект ENCODE – данные ChIP-seq
(клеточные линии)
Проект ENCODE – данные ChIP-seq
(первичные клетки и органы)
Проект ENCODE – визуализация через UCSC геномный браузер
Проект ENCODE – визуализация через UCSC геномный браузер
ChIP-seq на транскрипционные факторы
(Transcription Factors, TFs)
Chromatin
Immuno
Precipitation
ChIP-seq
Осажде́ние, преципита́ция — образование твёрдого осадка в растворе в процессе химической реакции, например, при добавлении соответствующих реагентов. Химическое вещество, вызывающее образование твёрдого вещества, называют «осадителем».
12
ChIP-seq
13
Иммунопреципита́ция — метод выделения белка из сложных смесей, таких как клеточные лизаты, сыворотки и тканевые гомогенаты, при помощи специфичных к белку антител.
https://link.springer.com/protocol/10.1007/978-1-0716-3362-5_15
ChIP-seq
14
Иммунопреципита́ция — метод выделения белка из сложных смесей, таких как клеточные лизаты, сыворотки и тканевые гомогенаты, при помощи специфичных к белку антител.
Иммунопреципитация хроматина (ChIP) — это тип экспериментального метода иммунопреципитации, используемый для исследования взаимодействия белков и ДНК в клетке.
ChIP-seq for TF
Nature Reviews Genetics 13, 840-852
A | Chromatin immunoprecipitation followed by sequencing (ChIP–seq) for DNA-binding proteins such as transcription factors. Recent variations on the standard protocol include using endonuclease digestion instead of sonication (ChIP–exo) to increase the resolution of binding-site detection and to eliminate contaminating DNA, and DNA amplification after ChIP for samples with limited cells.
b | ChIP–seq for histone modifications uses micrococcal nuclease (MNase) digestion to fragment DNA and can also now be run on low-quantity samples when combined with the additional post-ChIP amplification.
Технология ChIP-Seq
16
In construction of a sequencing library, the immunoprecipitated DNA is subjected to size selection (typically in the ~150–300 bp range), although there appears to be a bias toward shorter fragments in sequencing.
sc-ChIP-seq
17
Library Preparation
Need sufficient amount of starting material because the ChIP will enrich for a small proportion
Ideally the starting material for one ChIP uses 107 cells from culture
Crosslink proteins to DNA
Fragment
The DNA is sheared into small fragments - usually 200-500 bp in length
Check by running on a gel
Protein specific antibody
The sheared protein-bound DNA is immunoprecipitated using a specific antibody
Immunoprecipitate
The antibody binds primarily to the protein of interest but there may be cross reactivity with other proteins with similar epitopes
Reverse crosslink and purify DNA
Откуда антитела?
24
http://www.slideshare.net/nasagusto/monoclonal-antibodies-14851287
Давайте вернемся к шагам эксперимента и подумаем о потенциальных проблемах
Impact of sequencing depth
H3K4me3
Adapted from Jung et al (2014). NAR.
Impact of sequencing depth
H3K27me3
Adapted from Jung et al (2014). NAR.
Why are controls necessary?
17
ChIP-Seq Controls
18
Crosslink proteins to DNA
Shear DNA (sonication)
Reverse crosslink
Size selection and PCR
Immunoprecipitation
Non-specific antibody (IgG “mock IP”)
Specific antibody (ChIP enrichment)
+
No IP (Input DNA)
Biological samples/Library preparation
Сравнение сигнала и фона ("шума")
https://bioinformatics-core-shared-training.github.io/cruk-autumn-school-2017/ChIP/Materials/Lectures/Lecture5_Peak%20Calling_SS.pdf
Replicates and reproducibility
All binding
High confidence
2090
Sox2 Replicate 1
(4605)
Sox2 Replicate 2
(2382)
Bioinformatics analysis
Nature Protocols 7, 45–61 (2012)
Поиск пиков – peak calling
https://hbctraining.github.io/Intro-to-ChIPseq/lessons/05_peak_calling_macs.html
Программы поиска ChIP-seq пиков
https://bioinformatics-core-shared-training.github.io/cruk-autumn-school-2017/ChIP/Materials/Lectures/Lecture5_Peak%20Calling_SS.pdf
Peak callers
WIlbanks & Facciotti (2010). PLoS ONE.
Проект ENCODE – визуализация через UCSC геномный браузер
Downstream analysis
Figure 4. Proportion of true and false positives for each tool on the simulated FoxA1 data set (A, B) and H3K36me3 data (C, D)
Sharp ChIP-seq signal: FoxA1
Broad ChIP-seq signal: H3K36me3
Single replicate tools Multiple replicate tools
Decision tree indicating the proper choice of tool depending on the data set: shape of the signal (sharp peaks or broad enrichments), presence of replicates and presence of an external set of regions of interest [Steinhauser, et al, 2016].
Downstream analysis
Downstream analysis
Downstream analysis
Downstream analysis
TF binding motif: PWM
If you need good motifs to compare...
http://hocomoco.autosome.ru/
De novo motif search
Nature Biotechnology 24, 959 - 961 (2006)
Software for de novo motif seach: MEME suite
ChIP-seq на гистоновые модификации
Белки, которые пишут и стирают гистоновый код
В БД EpiFactors имеется информация про 69 белковых комплекса
(список не обновлялся несколько лет)
Где находятся инструкции о том где и что писать в эпигенетике?
Инструменты -- белковые комплексы, которые способны делать или убирать определенные эпигенетические модификации
Результат работы – наблюдаемые эпигенетические изменения/состояния в разных клетка организма
Инструкции? – кто указывает, что и где писать или стирать?
Длинные некодирующие РНК (lncRNA)
нкРНК MEG3 – образование триплексов
нкРНК CHASERR– ко-транскрипционное РНК-РНК вз-вия
В технологии CRISPR также используется нкРНК (gRNA)