Распознавание мысленно произносимых фонем по данным электроэнцефалографии и электромиографии
Поиленкова Анна,�магистрант 2 курса ВМК
Курс «Нейронные сети и их применение в научных исследованиях»
Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ
BCI � brain–computer interface
Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ
Электрофизиологические данные
ЭЭГ - Электроэнцефалография
— метод регистрации электрической активности мозга
ЭМГ - Электромиография
— метод оценки и регистрации электрической активности скелетных мышц
Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ
Внутренняя речь
Внутренняя речь - беззвучная, мысленная речь, которая возникает в тот момент, когда мы думаем о чем-либо или по-другому, когда произносим что-то про себя
во время мысленной речи возникает отчетливая речедвигательная импульсная активности либо в форме повышения общего тонуса речевой мускулатуры, либо в форме кратковременных вспышек.
Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ
Целью является разработка алгоритма для распознавания мысленно проговариваемых фонем русского языка на основе данных, получаемых с устройства электроэнцефалографии, и данных электромиографа, снятых в области отвечающей за речь.
Новизна работы обусловлена добавлением данных ЭМГ, которые будут участвовать в классификации, а также использованием данных с мысленным произношением русских фонем. Существующие работы основаны на англоязычных или других иностранных фонемах.
Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ
Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ
Данные
Количество сегментов для каждого испытуемого.
Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ
временные ряды с мысленным проговариванием
фонема
[a]
Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ
Обзор литературы
Статья | | Точность распознавания |
[1] | 2 хинди фонемы | 75–80% |
[2] | 11 ( фонемы + слова ) | ~ 20% |
[3] | 9 слов | 85% |
[4] | 4 слова (вверх, вниз, налево, направо) | SVM - 26.2%, XGBoos - 27,9%, BiLSTM - 36,1% |
[5] | 4 слова | 28,95% до 30,25% |
Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ
Классификация
Классическое машинное обучение
SVM
Четырехуровневое дискретное вейвлет-преобразование для исходного сигнала.
Извлечение признаков
AR + MAD + STD
Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ
Классическое машинное обучение
SVM
Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ
Нейросетевой подход
Спектрограмма сигнала.
Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ
Результаты
Результаты проведенного экспериментального исследования показали, что задача многоклассовой классификации решается более эффективно с помощью классического машинного обучение, что может быть связано с ограниченным объемом данных. На модели с SVC c подобранными гиперпараметрами на данных ЭЭГ точность в среднем 23.9% по всем испытуемым, а при объединении данных ЭЭГ и ЭМГ —18.8%. Нейросетевые подходы дали точность сравнимую с уровнем случайности.
Распознавание мысленно произносимых фонем по данным ЭЭГ и ЭМГ
Литература