Многослойная модель для предсказания времен удерживания метаболитов в условиях жидкостной хроматографии при помощи методов машинного обучения
Автор: Строева Екатерина Николаевна (ВМК МГУ имени М.В. Ломоносова)
Научный консультант на курсе MSU.AI: Немченко Виктор Андреевич
Научный консультант: Матюшин Дмитрий Дмитриевич (ФГБУН Институт физической химии и электрохимии им. А.Н. Фрумкина РАН)
Курс: «Нейронные сети и их применение в научных исследованиях»
Актуальность
Многослойная модель для предсказания времен удерживания метаболитов в условиях жидкостной хроматографии при помощи методов машинного обучения
Цель:
предсказание времени удерживания вещества по структуре молекулы (SMILES) для произвольных условий для небольшого набора данных (5-20 записей) для фиксированных заданных условий.
Существующие решения
Экспериментальное
Многослойная модель для предсказания времен удерживания метаболитов в условиях жидкостной хроматографии при помощи методов машинного обучения
Недостатки
Многослойная модель для предсказания времен удерживания метаболитов в условиях жидкостной хроматографии при помощи методов машинного обучения
Данные: таблица csv
Retention time | International Chemical Identifier |
93.5 | InChI=1S/C3H8N2S/c1-2-6-3(4)5/h2H2,1H3,(H3,4,5) |
687.8 | InChI=1S/C19H25Cl2N3O3/c1-27-19(26)23-8-9-24(15(13-23)12-22-6-2-3-7-22)18(25)11-14-4-5-16(20)17(21)10-14/h4-5,10,15H,2-3,6-9,11-13H2,1H3/t15-/m1/s1 |
Многослойная модель для предсказания времен удерживания метаболитов в условиях жидкостной хроматографии при помощи методов машинного обучения
Существующие решения
Многослойная модель для предсказания времен удерживания метаболитов в условиях жидкостной хроматографии при помощи методов машинного обучения
Архитектура: ансамбль моделей
Метрика MAE:
144,414
Многослойная модель для предсказания времен удерживания метаболитов в условиях жидкостной хроматографии при помощи методов машинного обучения
MAE:
Наша
модель
144,441
Deep
Chem
290,219
| smiles | real rt | predicted rt our model | predicted rt model from DeepChem |
0 | C1=NC=NN1 | 276.0 | 361.90580489 | 556.6185 |
1 | C1(=NC(=NN1)N)N | 456.0 | 350.51210793 | 687.9944 |
2 | C1=NN=CN1N | 408.0 | 404.89112242 | 615.11884 |
3 | CC1=NC=NN1 | 312.0 | 300.81737119 | 556.1645 |
4 | C1=NNN=C1 | 204.0 | 314.93627073 | 556.6185 |
5 | C1=NNC(=N1)N | 336.0 | 361.90580489 | 687.9944 |
6 | C1=CNN=C1 | 204.0 | 350.51210793 | 615.11884 |
7 | CC1=CC=NN1 | 210.0 | 404.89112242 | 556.1645 |
8 | CN1C=CC(=N1)N | 270.0 | 300.81737119 | 556.6185 |
9 | CCC1=CC(=NN1)N | 258.0 | 314.93627073 | 687.9944 |
10 | C1=CN=CN1 | 444.0 | 361.90580489 | 615.11884 |
11 | CC1=NC=CN1 | 798.0 | 350.51210793 | 556.1645 |
12 | CC1=NC=CN1C | 936.0 | 404.89112242 | 556.6185 |
13 | CCN1C=CN=C1 | 432.0 | 300.81737119 | 687.9944 |
14 | CC1=NC=CN1CCCN | 642.0 | 314.93627073 | 615.11884 |
15 | CC1=NC(=NC(=N1)N)N | 426.0 | 361.90580489 | 556.1645 |
16 | C1=CC=NN=C1 | 282.0 | 350.51210793 | 556.6185 |
17 | C1=CN=CN=C1 | 258.0 | 404.89112242 | 687.9944 |
18 | C1=CN=CC=N1 | 234.0 | 300.81737119 | 615.11884 |
Многослойная модель для предсказания времен удерживания метаболитов в условиях жидкостной хроматографии при помощи методов машинного обучения
Журналы