1 of 14

Распознавание мысленно произносимых фонем по данным электроэнцефалографии и электромиографии

Поиленкова Анна,�магистрант 2 курса ВМК

Курс «Нейронные сети и их применение в научных исследованиях»

2 of 14

Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ

BCI � brain–computer interface

3 of 14

Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ

Электрофизиологические данные

ЭЭГ - Электроэнцефалография

— метод регистрации электрической активности мозга

ЭМГ - Электромиография

— метод оценки и регистрации электрической активности скелетных мышц

4 of 14

Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ

Внутренняя речь

Внутренняя речь - беззвучная, мысленная речь, которая возникает в тот момент, когда мы думаем о чем-либо или по-другому, когда произносим что-то про себя

во время мысленной речи возникает отчетливая речедвигательная импульсная активности либо в форме повышения общего тонуса речевой мускулатуры, либо в форме кратковременных вспышек.

5 of 14

Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ

Целью является разработка алгоритма для распознавания мысленно проговариваемых фонем русского языка на основе данных, получаемых с устройства электроэнцефалографии, и данных электромиографа, снятых в области отвечающей за речь.

Новизна работы обусловлена добавлением данных ЭМГ, которые будут участвовать в классификации, а также использованием данных с мысленным произношением русских фонем. Существующие работы основаны на англоязычных или других иностранных фонемах.

6 of 14

Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ

7 of 14

Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ

Данные

Количество сегментов для каждого испытуемого.

8 of 14

Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ

временные ряды с мысленным проговариванием

фонема

[a]

9 of 14

Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ

Обзор литературы

Статья		Точность распознавания
[1]	2 хинди фонемы	75–80%
[2]	11 ( фонемы + слова )	~ 20%
[3]	9 слов	85%
[4]	4 слова (вверх, вниз, налево, направо)	SVM - 26.2%, XGBoos - 27,9%, BiLSTM - 36,1%
[5]	4 слова	28,95% до 30,25%

10 of 14

Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ

Классификация

Классическое машинное обучение

SVM

Четырехуровневое дискретное вейвлет-преобразование для исходного сигнала.

Извлечение признаков

AR + MAD + STD

11 of 14

Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ

Классическое машинное обучение

SVM

точность по данным ЭЭГ - 23.9% в среднем по всем испытуемым
точность по при объединении данных ЭЭГ + ЭМГ — 18.8%

12 of 14

Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ

Нейросетевой подход

Спектрограмма сигнала.

CNN
ResNet18
EfficientNet
LSTM

13 of 14

Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ

Результаты

Результаты проведенного экспериментального исследования показали, что задача многоклассовой классификации решается более эффективно с помощью классического машинного обучение, что может быть связано с ограниченным объемом данных. На модели с SVC c подобранными гиперпараметрами на данных ЭЭГ точность в среднем 23.9% по всем испытуемым, а при объединении данных ЭЭГ и ЭМГ —18.8%. Нейросетевые подходы дали точность сравнимую с уровнем случайности.

14 of 14

Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ

Литература

Khan, Munna. Classification of myoelectric signal for sub-vocal Hindi phoneme speech recognition / Munna Khan, Mosarrat Jahan // Journal of Intelligent & Fuzzy Systems. — 2018. — Vol. 35, no. 5. — Pp. 5585–5592.
Cooney, Ciaran. Mel frequency cepstral coefficients enhance imagined speech decoding accuracy from EEG / Ciaran Cooney, Rafaella Folli, Damien Coyle // 2018 29th Irish Signals and Systems Conference (ISSC) / IEEE. — 2018. — Pp. 1–7.
Silent eeg-speech recognition using convolutional and recurrent neural network with 85% accuracy of 9 words classification / Darya Vorontsova, Ivan Menshikov, Aleksandr Zubov et al. // Sensors. — 2021. — Vol. 21, no. 20. — P. 6744.
Gasparini F., Cazzaniga E., Saibene A. Inner speech recognition through electroencephalographic signals //arXiv preprint arXiv:2210.06472. – 2022.
Cooney C. et al. Evaluation of hyperparameter optimization in machine and deep learning methods for decoding imagined speech EEG //Sensors. – 2020. – Т. 20. – No. 16. – С. 4629.