Предсказание редокс-потенциалов �органических молекул, �используемых в цикле переработки ОЯТ, �с применением глубокого обучения
Смирнов Максим Вадимович�студент 6 курса химического факультета МГУ
Курс: «Нейронные сети и их применение в научных исследованиях»
2
Переработка ОЯТ
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
3
Переработка ОЯТ
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
4
Окислительно-восстановительные реакции
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
Mn+
Mn+
M(n-1)+
Получение значений E0Ox для малых органических молекул:
5
Обзор существующих решений
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
ML + QC
LUMO
или
S0-D0
Эксп. E_ox
Deep learning
CNN, RNN - �MAE 0.44, 0.24 V
R2 0.74 - 0.99, MSE 0.01 - 0.2 V
Journal of Chemical Theory and Computation 2023, 19, 4796-4814.
GBR
KRR
SVR
6
Цель работы
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
7
Данные
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
8
Предобработка данных
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
325
молекул
9
Разбиение данных
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
train-val-test 0.70/0.15/0.15
10
Модель
Molecular language transformer (MolFormer)
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
Nature Machine Intelligence 2022, 4, 1256-1264
11
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
Molformer
10% ZINC (100M) + 10% PubChem (11.1M) MoLFormer-XL-both-10%
(модель + токенайзер)
RoFormer: enhanced transformer with rotary position embedding�https://arxiv.org/abs/2104.09864
12
Графики обучения по эпохам
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
13
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
Parity plot
MSE 0.11
RMSE 0.33 В
R2 0.67
14
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
Результаты и выводы
15
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
Где публиковать?
16
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
17
Полученные метрики, OMEAD
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
| R2 | RMSE | MAE |
train | 0,9 | 0,8 | 0,62 |
val | 0,71 | 1,36 | 1,07 |
test | 0,55 | 1,34 | 1,03 |
| R2 | RMSE | MAE |
train | 0,88 | 0,66 | 0,5 |
val | 0,55 | 1,29 | 0,95 |
test | 0,49 | 1,45 | 1,05 |
1 freezed layer
2 freezed layers
18
Учет растворителя
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
Конкатенирование тензора, содержащего диэлектрическую проницаемость растворителя, с основным эмбеддингом
Жидкость | Т кип., oC | ε |
Ацетон | 56 | 20,7 |
Ацетонитрил | 82 | 38,8 |
Вода | 100 | 81,0 |
Диметилсульфоксид | 189 | 45,0 |
Керосин | 150-250 | 1,8 |
19
Полученные метрики, OMEAD
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
| R2 | RMSE, В | MAE, В |
train | 0,85 | 0,017 | 0,012 |
val | 0,83 | 0,018 | 0,013 |
test | 0,84 | 0,018 | 0,013 |
| R2 | RMSE, В | MAE, В |
train | 0,93 | 0,012 | 0,009 |
val | 0,92 | 0,013 | 0,01 |
test | 0,92 | 0,013 | 0,01 |
Energy Gap
LUMO
20
Метрики
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
1L. Jia, E. Bremond, L. Zaida, B. Gauzere, V. Tognetti, L. Joubert, ChemRxiv 2023
21
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
Relative positional embeddings
Применение RoPE заключается в повороте вектора запроса/ключа на угол, зависящий от индекса его позиции. Поворот обоих векторов на один угол, т.е. смещение позиций без изменения расстояния, сохранит значение скалярного произведения.
22
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
Relative positional embeddings
В отличие от Absolute, применяется не к отдельным координатам, а к парам, и использует умножение вместо суммы (мультипликация вместо аддитивности). Введение обучаемых параметров углов поворота пар координат: на mθ1 поворачивают первые две координаты, на mθ2 - вторые две и т.д.
23
Метрики
Предсказание редокс-потенциалов органических молекул, �используемых в цикле переработки ОЯТ, с использованием глубокого обучения
1L. Jia, E. Bremond, L. Zaida, B. Gauzere, V. Tognetti, L. Joubert, ChemRxiv 2023
Performance comparison
24
All models were evaluated using the area under the receiver operating characteristic curve
For QM9 and QM8, average MAE is reported, while RMSE is reported for the remaining tasks.