1 of 16

Терагерцевая спектроскопия во временной области с применением машинного обучения

Румянцев Борис Вадимович�Физический факультет МГУ имени М.В.Ломоносова

Научный консультант на курсе MSU.AI: Васильев Артём Викторович�Научный руководитель: д.ф.-м.н., профессор Потёмкин Фёдор Викторович

Курс: «Нейронные сети и их применение в научных исследованиях»

2 of 16

Терагерцевый диапазон

 

 

ТГц-спектроскопия во временной области

[2] Yu, Liu, et al. "The medical application of terahertz technology in non-invasive detection of cells and tissues: opportunities and challenges." RSC advances 9.17 (2019): 9354-9363.

ТГц-диагностика

[1] Koch, M., Mittleman, D. M., Ornik, J., & Castro-Camus, E. (2023). Terahertz time-domain spectroscopy. Nature Reviews Methods Primers, 3(1). https://doi.org/10.1038/s43586-023-00232-z

Терагерцевая спектроскопия во временной области с применением машинного обучения

3 of 16

Терагерцевая спектроскопия во временной области

[1] Koch, M., Mittleman, D. M., Ornik, J., & Castro-Camus, E. (2023). Terahertz time-domain spectroscopy. Nature Reviews Methods Primers, 3(1). https://doi.org/10.1038/s43586-023-00232-z

Терагерцевая спектроскопия во временной области с применением машинного обучения

Временная область

Спектральная

область

Искажение результатов�из-за влияния аппаратной функции системы регистрации за счёт наличия ТГц-резонансов среды

[2] Wu, Q., & Zhang, X.-C. (1997). 7 terahertz broadband GaP electro-optic sensor. Applied Physics Letters, 70(14), 1784–1786. https://doi.org/10.1063/1.118691

4 of 16

Терагерцевая спектроскопия во временной области с применением машинного обучения

Существующее решение

Электрооптическое детектирование:

  • Искажение спектрально-временной формы ТГц-поля за счёт ТГц-резонансов среды,
  • Ограничение по пиковой напряженности поля.

[1] Wu, Q., & Zhang, X.-C. (1997). 7 terahertz broadband GaP electro-optic sensor. Applied Physics Letters, 70(14), 1784–1786. https://doi.org/10.1063/1.118691

[2] Wu, Q., & Zhang, X. ‐C. (1995). Free‐space electro‐optic sampling of terahertz beams. Applied Physics Letters, 67(24), 3523–3525. https://doi.org/10.1063/1.114909

5 of 16

Цель работы

Терагерцевая спектроскопия во временной области с применением машинного обучения

Рис.1. Сравнение экспериментального сигнала ВГ

и временной формы ТГц-поля

Цель: восстановление по сигналу ВГ формы ТГц-поля и спектра с учётом фазы поля

 

 

6 of 16

Терагерцевая спектроскопия во временной области с применением машинного обучения

Решение задачи в первом приближении: данные

Получение данных в эксперименте:

  1. Затратно по времени и силам
  2. Трудно обеспечить высокую вариативность

Генерация данных с учётом экспериментальных параметров

Рис.2. Процесс генерации тренировочного датасета

в среде LabVIEW.

 

7 of 16

Терагерцевая спектроскопия во временной области с применением машинного обучения

Методология

Используемая модель -

полносвязная нейронная сеть:

  • 4 скрытых слоя
  • Функция активации: ReLU
  • Batch normalization (256 объектов в батче)
  • Drop-out на последнем скрытом слое (5%)
  • Оптимизатор: Adam
  • Loss-функция: MAE
  • 100 входов.
  • 3 выхода.

Метрика качества: MAE

Параметры обучения:

  • Размер тренировочного датасета: 10000 сигналов
  • Размер валидационного датасета: 8000 сигналов
  • Размер тестового датасета: 2000 сигналов
  • Аугментация для тренировочного датасета: гауссов шум с std=0.01
  • Обучение в течение 200 эпох

Рис.4. Архитектура используемой полносвязной нейронной сети, реализованной на языке Python с использованием библиотеки PyTorch

Рис.5. Пример аугментации сигнала

8 of 16

Терагерцевая спектроскопия во временной области с применением машинного обучения

Результаты обучения

 

 

 

 

9 of 16

Терагерцевая спектроскопия во временной области с применением машинного обучения

Результаты: синтезированный датасет

Обученная нейросеть корректно восстанавливает спектрально-временную форму ТГц-излучения на синтезированном тестовом датасете!

Видео 1. Результат восстановления временной формы и спектра ТГц-излучения на основе сигналов ВГ c помощью нейронной сети.

10 of 16

Терагерцевая спектроскопия во временной области с применением машинного обучения

Результаты: экспериментальный датасет

Как свидетельствуют результаты сравнения на Рис.8, Рис.9 и Рис.10, обученная нейросеть позволяет корректно воспроизвести основные особенности спектрально-временной формы ТГц-излучения по экспериментально измеренным сигналам.

Для более детального восстановления требуется учитывать тонкую структуру ТГц-спектра, что может быть сделано путём разложения амплитудного спектра по базису множества гауссовых функций.

11 of 16

Терагерцевая спектроскопия во временной области с применением машинного обучения

Метрика качества: MAE

Решение задачи во втором приближении:

данные и методология

6

6

Параметры обучения:

  • Размер тренировочного датасета: 500000 сигналов
  • Размер валидационного датасета: 8000 сигналов
  • Размер тестового датасета: 2000 сигналов
  • Аугментация для тренировочного датасета: гауссов шум с std=0.01
  • Обучение в течение 500 эпох

Используемая модель -

полносвязная нейронная сеть:

  • 4 скрытых слоя
  • Функция активации: ReLU
  • Batch normalization�(16384 объектов в батче)
  • Drop-out на последнем скрытом слое (5%)
  • Оптимизатор: Adam
  • Loss-функция: MAE
  • 100 входов.
  • 6 выходов.

Эффективное обучение нейросети для шести выходных параметров потребовало значительного - более, чем на порядок – увеличения размера тренировочного датасета, что объясняется увеличением размерности пространства выходных параметров нейросети в два раза - с трёх до шести.

12 of 16

Терагерцевая спектроскопия во временной области с применением машинного обучения

Результаты обучения

Метрика MAE на обученной нейросети составила 6.9 ⋅ 10−2 – это даёт примерно 7% ошибку в среднем по шести выходным параметрам.

Более точно восстанавливаются параметры, характеризующие гауссову функцию №2 с большей амплитудой, что может объясняться её определяющим вкладом во временную форму ТГц-импульса и, как следствие, во временную форму сигнала и в формирование значения лосс-функции.

 

 

 

 

 

 

13 of 16

Терагерцевая спектроскопия во временной области с применением машинного обучения

Результаты

Обученная нейросеть позволяет корректно восстановить как спектральную, так и временную форму ТГц-импульса на синтезированном датасете

Обученная нейросеть позволяет восстановить дополнительные особенности спектральной и временной формы ТГц-импульса на экспериментальном датасете

Синтезированный датасет

Экспериментальный датасет

14 of 16

Терагерцевая спектроскопия во временной области с применением машинного обучения

Журналы

Доклад на «XIV МЕЖДУНАРОДНАЯ КОНФЕРЕНЦИЯ ПО ФОТОНИКЕ И ИНФОРМАЦИОННОЙ ОПТИКЕ», 29 — 31 января 2025 года, Москва, НИЯУ МИФИ, тематика: цифровые методы и нейронные сети в оптике

15 of 16

Терагерцевая спектроскопия во временной области с применением машинного обучения

Разработан и апробирован метод полной спектрально-временной характеризации ТГц-излучения с применением предобученной на синтезированных данных полносвязной нейронной сети.

  • Показано, что нейронная сеть с тремя выходными параметрами, характеризующими спектрально-временную форму ТГц-импульса в первом приближении на основе разложения спектра по базису гауссовых функций, позволяет добиться восстановления основных особенностей спектра и временной формы ТГц-поля как в случае синтезированных данных, так и при подаче на вход нейросети экспериментально измеренного временного сигнала ВГ.

  • Усложнение базиса путём добавления второй гауссовой функции позволяет восстановить дополнительные особенности спектрально-временной формы ТГц-излучения.

Заключение

16 of 16

Терагерцевая спектроскопия во временной области с применением машинного обучения

Спасибо за внимание!