1 of 14

Оценка племенной ценности животных

Майсурадзе М.В.

Москва

2023

Курс «Нейронные сети и их применение в научных исследованиях»

2 of 14

Оценка племенной ценности животных

Селекция производится на основании значений племенной ценности (EBV – Estimated Breeding Value – оценка для TBV – True Breeding Value), определяемой для интересующих признаков а также суммарного индекса BLUP, рассчитываемом с учётом экономических коэффициентов. Значения племенной ценности рассчитываются из наблюдений за фенотипом животного и его родственников, генетических маркеров, измеримых условий окружающей среды. Целью данного проекта является получение модели, которая на основании имеющихся данных о животном и его близких родственниках рассчитывает EBV и индекс BLUP, позволяющие качественно проводить селекцию по заданным критериям.

Цели и задачи

3 of 14

Оценка племенной ценности животных

 

Базовая модель

4 of 14

Оценка племенной ценности животных

 

Вычисление EBV

5 of 14

Оценка племенной ценности животных

Есть набор данных в формате XML с основной информацией о животных: дата рождения, пол, порода, идентификаторы родителей, циклы беременности, сбор фенотипических признаков, индекс BLUP.

Данные собраны по нескольким фермам, поэтому одно животное может встречаться в них несколько раз. Реальное количество животных – около 200 тыс. записей. При этом, наличие информации о фенотипе и BLUP есть по меньшему числу особей – порядка 50 тыс. записей.

Данные

На фермах представлены 9 пород, однако большая часть измерений есть только по двум породам.

6 of 14

Оценка племенной ценности животных

Примеры данных

7 of 14

Оценка племенной ценности животных

Фенотипические признаки

В собранных данных присутствуют признаки 4 признака полученных в ходе тестирования животного, информация о рождаемости и один внешний признак.

Для классической модели расчёта EBV нужны: среднее по стаду, коэффициенты наследственности. Решено было получить EBV или похожий на него набор значений, заполнив в том числе их по животным, по которым измерения не проводились или отсутствую в силу природы (например рождаемость у самцов считается по родственным самкам).

На следующем слайде приведены результаты анализа средних значений и нормального распределения по двум породам, пяти годам, четырём признакам.

Красной точкой отмечены средние значения, рассчитанные иностранной компанией.

8 of 14

Оценка племенной ценности животных

Средние и нормальное распределение

9 of 14

Оценка племенной ценности животных

Вычисление параметров классической модели

На практике используются данные не обо всех животных, т.к. в следствие селекции среднее значение выше из-за того, что при разведении используются лучшие самцы.

В дальнейшем необходимо разработать методику фильтрации потомства таких особей, но на данном этапе ограничимся средним значением признака по всем особям одной группы и его дисперсией.

Вычисление дисперсии ошибки в моей работе основано на принципе наследования генов. Ошибка вычисляется как разница между значениями родителей и их детей. По полученным измерениям вычисляются характеристики случайной ошибки – математическое ожидание и дисперсия.

Коэффициент наследственности вычисляется как отношение дисперсий.

10 of 14

Оценка племенной ценности животных

Подготовка данных

Будем использовать записи EBV каждого из родителей посчитанные различными способами: по собственным признакам, по родным братьям и сёстрам, по сводным братьям и сёстрам, по детям.

Также каждое значение снабдим признаком 1 – в наличие, 0 – отсутствует.

Выбрав одну из пород на одной из ферм, разделим данные на train / test в соотношении 85 / 15.

В качестве целевых значений, будем использовать известные значения BLUP.

11 of 14

Оценка племенной ценности животных

Модель

Используем простую однослойную линейную модель:

На данном этапе, как будет показано дальше, это даёт достаточную точность и улучшения требуются на этапе подготовки данных.

12 of 14

Оценка племенной ценности животных

Обучение модели

Модель быстро обучается на данных одной фермы до ошибки 0.025.

Тестирование проводится на данных другой фермы и даёт ошибку 0.03.

Ошибка велика, но позволяет производить отбор лучших животных.

13 of 14

Оценка племенной ценности животных

Результаты

  1. Результаты вычисления BLUP удовлетворительны, позволяют ранжировать животных.
  2. Модель корректно работает с данными других ферм.

14 of 14

Оценка племенной ценности животных

  1. Hannah E. Willson, Hinayah Rojas de Oliveira, Allan P. Schinckel, Daniela Grossi, Luiz F. Brito. Estimation of Genetic Parameters for Pork Quality, Novel Carcass, Primal-Cut and Growth Traits in Duroc Pigs
  2. Jonathan M. Schefers, Kent A. Weigel, Genomic selection in dairy cattle: Integration of DNA testing into breeding programs, Animal Frontiers, Volume 2, Issue 1, January 2012, Pages 4–9, https://doi.org/10.2527/af.2011-0032
  3. Kor Oldenbroek and Liesbeth van der Waaij, 2015. Textbook Animal Breeding and Genetics for BSc students. Centre for Genetic Resources The Netherlands and Animal Breeding and Genomics Centre, 2015. Groen Kennisnet: https://wiki-groenkennisnet.atlassian.net/wiki/spaces/TAB/overview
  4. Mathew B, Hauptmann A, Léon J, Sillanpää MJ. NeuralLasso: Neural Networks Meet Lasso in Genomic Prediction. Front Plant Sci. 2022 Apr 29;13:800161. doi: 10.3389/fpls.2022.800161. PMID: 35574107; PMCID: PMC9100816.
  5. Montesinos-López, O.A., Montesinos-López, A., Pérez-Rodríguez, P. et al. A review of deep learning applications for genomic selection. BMC Genomics 22, 19 (2021). https://doi.org/10.1186/s12864-020-07319-x
  6. Pook, T., Freudenthal, J., Korte, A., Simianer, H. (2020). Using Local Convolutional Neural Networks for Genomic Prediction. Frontiers in Genetics, 11. https://doi.org/10.3389/fgene.2020.561497
  7. Rafael A. Mrode. Linear Models for the Prediction of Animal Breeding Values, 2014.
  8. Samuel A. Clark , Julius Werf. Genomic Best Linear Unbiased Prediction (gBLUP) for the Estimation of Genomic Breeding Values
  9. Genome-Wide Association Studies and Genomic Prediction, 2013, Volume 1019ISBN : 978-1-62703-446-3

Литература