1 of 15

Автоматическое детектирование клеток �для теста Allium Cepa L. �с помощью моделей глубокого обучения

Курс «Нейронные сети и их применение в научных исследованиях»

МГУ им. М.В. Ломоносова

Химический факультет

Кафедра аналитической химии

Потемкин Александр

аспирант 3 г.о.

2 of 15

Автоматическое детектирование клеток для теста Allium Cepa L.

Тест Allium Cepa L.

  • Воздействие генотоксикантов и мутагенов может передаваться следующим поколениям.
  • Их воздействия можно увидеть только спустя годы, поэтому для анализа таких веществ часто используют организмы-биоиндикаторы.
  • Один из распространенных на практике биоиндикаторов – это репчатый лук (Allium Cepa L.).
  • Исследуют клетки корней луковиц, пророщенных в растворах исследуемых веществ.

1

3 of 15

Автоматическое детектирование клеток для теста Allium Cepa L.

Пример изображения, получаемого в ходе анализа

Разные стадии деления:

  • Подсчитать число делящихся клеток
  • Среди делящихся - подсчитать число клеток с нарушениями процесса деления
  • Для получения достоверных результатов надо подсчитать несколько тысяч клеток для одного раствора (+ отрицательный и положительный контроль)
  • Подсчитать число неделящихся клеток

Неделящаяся клетка:

2

4 of 15

Автоматическое детектирование клеток для теста Allium Cepa L.

Цель работы

Создание вспомогательного программного обеспечения, упрощающего проведение теста Allium cepa L. за счет автоматического детектирования делящихся и неделящихся клеток на изображениях с микроскопа.

Исходное изображение

Программа

Обработанное изображение

3

3

5 of 15

Автоматическое детектирование клеток для теста Allium Cepa L.

Обзор существующих решений

  • В статье [1] Faster R-CNN применялась для подсчета клеток человеческого эпителия. Наибольшая достигнутая точность: mAP 78.1%.

  • В [2] YOLOv3 применялась в задаче детектирования и подсчета кровяных клеток. Исследователям удалось достичь точности mAP 88.26%, точности подсчета эритроцитов 83.28%, лейкоцитов – 86.49%.

  • В работе [3] описано использование модели UV-Net для подсчета делящихся клеток на гистологических изображениях. Точность F1-score 0.6721.

[1] Uka et al. FASTER R-CNN for cell counting in low contrast microscopic images // 2020. P. 64-69.

[2] Zhang et al. Cell counting algorithm based on YOLOv3 and image density estimation // 2019. P. 920-924.

[3] Mirjahanmardi et al. Mitosis Detection for Breast Cancer Pathology Images Using UV-Net // 2021.

4

6 of 15

Датасет

Автоматическое детектирование клеток для теста Allium Cepa L.

  • 587 фрагментов из 6 больших изображений RGB, JPEG с микроскопа Olympus BX63 (40x)

  • ~ 3100 х 3100 пикселей

  • Разметка: 2 класса (dividing и not_dividing),

bounding boxes

Делящиеся клетки (dividing)

3630 клеток

Неделящиеся клетки (not_dividing)

23378 клеток

  • Также были подготовлены одноканальные (ч/б) версии этих фрагментов

~ 1 : 6

  • Датасет разбивали случайным образом: 8 : 1 : 1

  • В ходе обучения применялась аугментация данных

5

7 of 15

Автоматическое детектирование клеток для теста Allium Cepa L.

Модель

🡨 YOLOv5s, реализация компании Ultralytics с использованием библиотеки PyTorch

  • Также рассматривалась Faster R-CNN, но она справлялась заметно хуже
  • Модели, предобученные на датасете COCO.

6

8 of 15

Автоматическое детектирование клеток для теста Allium Cepa L.

Метрики качества

1) P, R, F1-score, mAP@0.5

2) Точность подсчета клеток [4]:

TP – число True Positive предсказаний (верно детектированных клеток)

Ntruth – число клеток, размеченных человеком

Npredicted – число клеток, предсказанное моделью

[4] Drałus G. et al. Automatic Detection and Counting of Blood Cells in Smear Images Using RetinaNet // 2021. V. 23. P. 1522.

7

9 of 15

Автоматическое детектирование клеток для теста Allium Cepa L.

Лучшая модель (YOLOv5s)

Оптимизатор

Adam

Focal Loss gamma

0

Learning Rate

1e-3

Аугментация во время обучения

есть

Размер изображений

2048 х 2048

Размер батча

6

Количество эпох

170

Изображения

ч/б

Класс

P

R

F1-score

AP@0.5

Точность подсчета

dividing

0.87

0.73

0.79

0.84

73.53%

not_dividing

0.93

0.96

0.94

0.96

98.13%

8

10 of 15

Автоматическое детектирование клеток для теста Allium Cepa L.

Сравнение моделей

  • Изменение параметра gamma для Focal Loss на значения 0, 1, 1.5, 2

не давало заметных улучшений.

  • При использовании черно-белых одноканальных изображений все метрики точности улучшились.

Модель

Precision (взвешенное среднее)

Recall (взвешенное среднее)

F1-score

mAP@0.5

Faster R-CNN

0.82

0.57

0.66

0.46

Faster R-CNN (с синт. данными)

0.76

0.80

0.78

0.74

YOLOv5s (цвет)

0.89

0.85

0.87

0.87

YOLOv5s (ч/б)

0.89

0.90

0.90

0.90

9

11 of 15

Автоматическое детектирование клеток для теста Allium Cepa L.

Интерпретация работы модели

  • Результат работы алгоритма Eigen-CAM (Class Activation Map)
  • Красные участки имеют наболее сильно влияние на итоговый ответ сети

Больше всего на решения нейросети влияют области, в которых расположены клеточные ядра, а также области между двумя близкорасположенными ядрами.

10

12 of 15

Автоматическое детектирование клеток для теста Allium Cepa L.

Интерпретация работы модели

  1. Неправильно классифицированные клетки;
  2. Модель нашла клетку, там где нет близкого Ground Truth;
  3. Модель не нашла клетку там, где есть Ground Truth;

11

13 of 15

Автоматическое детектирование клеток для теста Allium Cepa L.

Приложение для резметки изображений с микроскопа (создание, редактирование, сохранение в файл)

  • YOLOv5s
  • Библиотека PyQt5

Добавлена возможность масштабировать анализируемое изображение.

Добавлена сетка поверх изображения, для того, чтобы было проще ориентирваться

Код программы: https://gitlab.com/fat-fox/python_nn

12

14 of 15

Автоматическое детектирование клеток для теста Allium Cepa L.

Выводы

• Набор данных с размеченными клетками Allium Cepa L, который позволит другим исследователям подключиться к решению данной задачи и совершенствовать предложенное решение.

• Обученная нейросеть YOLOv5s для детектирования делящихся и неделящихся клеток Allium Cepa L. с высокой точностью, которая может быть использована в работе других исследовательских групп.

• Программное обеспечение для обработки изображений теста Allium Cepa L., которое позволит ускорить проведение данного анализа.

13

15 of 15

Автоматическое детектирование клеток для теста Allium Cepa L.

Спасибо за внимание!