1 of 8

Многослойная модель для предсказания времен удерживания метаболитов в условиях жидкостной хроматографии при помощи методов машинного обучения

Автор: Строева Екатерина Николаевна (ВМК МГУ имени М.В. Ломоносова)

Научный консультант на курсе MSU.AI: Немченко Виктор Андреевич

Научный консультант: Матюшин Дмитрий Дмитриевич (ФГБУН Институт физической химии и электрохимии им. А.Н. Фрумкина РАН)

Курс: «Нейронные сети и их применение в научных исследованиях»

2 of 8

Актуальность

  • Медицина
  • Фармакология
  • Промышленность

Многослойная модель для предсказания времен удерживания метаболитов в условиях жидкостной хроматографии при помощи методов машинного обучения

Цель:

предсказание времени удерживания вещества по структуре молекулы (SMILES) для произвольных условий для небольшого набора данных (5-20 записей) для фиксированных заданных условий.

3 of 8

Существующие решения

Экспериментальное

Многослойная модель для предсказания времен удерживания метаболитов в условиях жидкостной хроматографии при помощи методов машинного обучения

Недостатки

  • зависимость от конкретных условий
  • плохой перенос результатов с одной установки на другую
  • финансовые и временные затраты

4 of 8

Многослойная модель для предсказания времен удерживания метаболитов в условиях жидкостной хроматографии при помощи методов машинного обучения

Данные: таблица csv

Retention time

International Chemical Identifier

93.5

InChI=1S/C3H8N2S/c1-2-6-3(4)5/h2H2,1H3,(H3,4,5)

687.8

InChI=1S/C19H25Cl2N3O3/c1-27-19(26)23-8-9-24(15(13-23)12-22-6-2-3-7-22)18(25)11-14-4-5-16(20)17(21)10-14/h4-5,10,15H,2-3,6-9,11-13H2,1H3/t15-/m1/s1

  1. HILIC
  2. METLIN: 0-8, 8-25
  3. Hilic_Oxana

5 of 8

Многослойная модель для предсказания времен удерживания метаболитов в условиях жидкостной хроматографии при помощи методов машинного обучения

Существующие решения

6 of 8

Многослойная модель для предсказания времен удерживания метаболитов в условиях жидкостной хроматографии при помощи методов машинного обучения

Архитектура: ансамбль моделей

  • One-hot-encoding
  • Преобразование Бокса-Кокса
  • Усреднение вдоль размерности
  • Выделение дескрипторов
  • Использование Standart Scaler

Метрика MAE:

144,414

7 of 8

Многослойная модель для предсказания времен удерживания метаболитов в условиях жидкостной хроматографии при помощи методов машинного обучения

MAE:

Наша

модель

144,441

Deep

Chem

290,219

smiles

real rt

predicted rt our model

predicted rt model from DeepChem

0

C1=NC=NN1

276.0

361.90580489

556.6185

1

C1(=NC(=NN1)N)N

456.0

350.51210793

687.9944

2

C1=NN=CN1N

408.0

404.89112242

615.11884

3

CC1=NC=NN1

312.0

300.81737119

556.1645

4

C1=NNN=C1

204.0

314.93627073

556.6185

5

C1=NNC(=N1)N

336.0

361.90580489

687.9944

6

C1=CNN=C1

204.0

350.51210793

615.11884

7

CC1=CC=NN1

210.0

404.89112242

556.1645

8

CN1C=CC(=N1)N

270.0

300.81737119

556.6185

9

CCC1=CC(=NN1)N

258.0

314.93627073

687.9944

10

C1=CN=CN1

444.0

361.90580489

615.11884

11

CC1=NC=CN1

798.0

350.51210793

556.1645

12

CC1=NC=CN1C

936.0

404.89112242

556.6185

13

CCN1C=CN=C1

432.0

300.81737119

687.9944

14

CC1=NC=CN1CCCN

642.0

314.93627073

615.11884

15

CC1=NC(=NC(=N1)N)N

426.0

361.90580489

556.1645

16

C1=CC=NN=C1

282.0

350.51210793

556.6185

17

C1=CN=CN=C1

258.0

404.89112242

687.9944

18

C1=CN=CC=N1

234.0

300.81737119

615.11884

8 of 8

Многослойная модель для предсказания времен удерживания метаболитов в условиях жидкостной хроматографии при помощи методов машинного обучения

  1. Analytical Chemistry
  2. Analytica Chimica Acta
  3. Journal of Chromatography A

Журналы