Курс «Нейронные сети и их применение в научных исследованиях»
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Федорова Александра
ОТиПЛ МГУ им. М.В. Ломоносова
22.06.23
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Данные: DaNetQA (Glushkova et al., 2020)
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
BERT VS GPT
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
BERT: Bidirectional Encoder Representations from Transformers
GPT: Generative Pre-trained Transformer
Рис. 1 Архитектура нейросетевых моделей семейства BERT (Devlin et al., 2019)
Рис. 2 Архитектура нейросетевых моделей семейства GPT (Radford et al., 2018)
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Предобучаемые языковые модели
translate from english to french: John loves Mary
Review: This movie sucks. Sentiment: negative
Prompt-tuning
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Рис. 3 Пример подбора подводки для “The capital of Britain is [MASK]” (Liu et al., 2021)
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Генерация общих вопросов
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
P-tuning ruGPT-3 для генерации общих вопросов
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
P-tuning ruGPT-3 для генерации общих вопросов
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
P-tuning ruGPT-3 для генерации общих вопросов: стратегии генерации
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
P-tuning ruGPT-3 для генерации общих вопросов: результаты
passage | question | label |
Дебютная публикация стихов Павла Нагорских состоялась в «Пионерской правде» в 1989 году. Его палиндромам присуща поэтическая выразительность, мелодичность, стройность языка. Особенно автору удаются так называемые монопалиндромы, то есть целые стихотворения, читаемые от начала к концу и от конца к началу одинаково. | Были ли палиндромы у поэта Павла Нагорских? | true |
Но в отличие от двух других футболистов, с которыми были подписаны новые контракты, контракт Мамедова был продлен. В составе «Кяпаза» играет под номером 77. Кубок. | Были ли в составе «Кяпаза» другие футболисты? | true |
Но Рубинштейна ещё можно было рассматривать как одиночку, как блестящее исключение, как гениального самородка. Игра Есиповой засвидетельствовала перед всем светом наличие в России родника пианистических талантов, замечательной школы, высокой пианистической культуры. После развода с Лешетицким в 1892 году Есипова вернулась в Россию, заняв место профессора фортепиано в Санкт-Петербургской консерватории. Сторонница активной пальцевой техники. | Есипова – талантливая пианистка? | true |
Таблица 1. Утвердительные синтетические вопросы после p-tuning-а ruGPT-3
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
P-tuning ruGPT-3 для генерации общих вопросов: результаты
passage | question | label |
Язык. Говорят на языке лусога, имеющем два диалекта: северный (лупакоойо) и южный (лутенга). Язык лусога относится к языковой группе банту, включающей в себя множество различных языков, распространенных в Африке. | У лусога есть восточный диалект? | false |
Эти рисунки были просты в техническом плане и для их нанесения требовалось минимум времени. Поэтому эти рисунки были внедрены в производство, так как предельная скорость ручного труда была в приоритете и выгодна для поточного производства фарфора. В начале 1970-х годов стиль росписи Яснецова определился окончательно. | Была ли разработана технология нанесения рисунка на стеклянную поверхность? | false |
Перила, как правило, изготавливают из дерева, металла и пластика. Деревянные перила. Чаще всего применяются в интерьере, реже в экстерьере домов, в садах и парках. | Есть ли ограничения по высоте перил? | false |
Таблица 2. Отрицательные синтетические вопросы после p-tuning-а ruGPT-3
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Правиловый подход для генерации общих вопросов
Параметры генерации:
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Правиловый подход для генерации общих вопросов
Параметры генерации:
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Правиловый подход для генерации общих вопросов: результаты
passage | question | label |
Однажды Миджа увидела объявление о наборе на курсы поэзии и незамедлительно решила туда попасть. | Не Миджа ли увидела объявление о наборе на курсы поэзии? | true |
В начале времени Бог создал нескольких духов. | Возможно ли, что Бог создал несколько духов? | true |
В 2006 году тренеры «Динамо» сочли молодого игрока бесперспективным и предложили ему искать новую команду. | Тренеры Динамо считают молодого игрока "слабым"? | true |
Все 15 вагонов пассажирского поезда сошли с рельсов. | С рельсов сошли все 15 вагонов пассажирского поезда? | true |
Новое красное кирпичное здание стояло на месте нынешнего сквера на Площади Свободы, который в то время был Театральной площадью. | А правда ли, что здание красного кирпича стояло на месте скверика у Площади Свободы? | true |
Таблица 3. Утвердительные синтетические вопросы после правиловой генерации
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Правиловый подход для генерации общих вопросов: результаты
passage | question | label |
В конце концов Василий, остро нуждавшийся в верных войсках, нашёл поддержку в Киевской Руси: в обмен на брак сестры Анны с князем Владимиром Святославичем, тот отправил 6 тыс. отряд, с которым удалось подавить восстание, а сам Фока пал в битве. | Не в Киевской Руси нашёл поддержку Василий? | false |
Однажды вечером, в историческом центре Детройта, Роджер встретил на улице группу поющих монахов-кришнаитов. | Встретил группу поющих монахов кришнаитов не Роджер? | false |
Большинство землетрясений в мире (90 % и 81 % самых крупных) происходят в подковообразной зоне протяженностью 40 000 км, называемой Тихоокеанским огненным кольцом. | В подковообразной зоне протяженностью 40 000 км большинство землетрясений в мире не происходят? | false |
Таблица 4. Отрицательные синтетические вопросы после правиловой генерации
Архитектура BERT для задачи предсказания бинарного ответа
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Label (0/1)
Question
Passage
Тонкая настройка и обучение подводки ruBERT и ruRoBERTa
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Тонкая настройка ruBERT и ruRoBERTa
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Accuracy на валидации = 0.52 Accuracy на тесте = 0.502 | ||
| Доля верно предсказанных «да» | Доля верно предсказанных «нет» |
Точность | 0.51 | 0.67 |
Полнота | 0.96 | 0.08 |
F-мера | 0.67 | 0.14 |
Accuracy на валидации = 0.6 Accuracy на тесте = 0.522 | ||
| Доля верно предсказанных «да» | Доля верно предсказанных «нет» |
Точность | 0.57 | 0.71 |
Полнота | 0.85 | 0.35 |
F-мера | 0.68 | 0.47 |
Accuracy на валидации = 0.63 Accuracy на тесте = 0.523 | ||
| Доля верно предсказанных «да» | Доля верно предсказанных «нет» |
Точность | 0.59 | 0.73 |
Полнота | 0.9 | 0.5 |
F-мера | 0.75 | 0.62 |
Таблица 5. Тонкая настройка ruBERT на DaNetQA
Таблица 6. Тонкая настройка
ruBERT на DaNetQA+RB
Таблица 7. Тонкая настройка
ruBERT на DaNetQA+PT
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Accuracy на валидации = 0.75 Accuracy на тесте = 0.645 | ||
| Доля верно предсказанных «да» | Доля верно предсказанных «нет» |
Точность | 0.68 | 0.91 |
Полнота | 0.94 | 0.56 |
F-мера | 0.79 | 0.69 |
Accuracy на валидации = 0.7 Accuracy на тесте = 0.57 | ||
| Доля верно предсказанных «да» | Доля верно предсказанных «нет» |
Точность | 0.63 | 0.95 |
Полнота | 0.98 | 0.43 |
F-мера | 0.77 | 0.59 |
Accuracy на валидации = 0.79 Accuracy на тесте = 0.67 | ||
| Доля верно предсказанных «да» | Доля верно предсказанных «нет» |
Точность | 0.8 | 0.79 |
Полнота | 0.78 | 0.8 |
F-мера | 0.79 | 0.79 |
Таблица 8. Тонкая настройка ruRoBERTa на DaNetQA
Таблица 9. Тонкая настройка
ruRoBERTa на DaNetQA+RB
Таблица 10. Тонкая настройка
ruRoBERTa на DaNetQA+PT
P-tuning ruBERT и ruRoBERTa
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
{"placeholder": "text_a"} Вопрос: {"placeholder": "text_b"} {"soft"} {"soft"} {"soft"} Ответ: {"mask"} .
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Accuracy на валидации = 0.673 Accuracy на тесте = 0.643 | ||
| Доля верно предсказанных «да» | Доля верно предсказанных «нет» |
Точность | 0.62 | 0.82 |
Полнота | 0.9 | 0.44 |
F-мера | 0.74 | 0.57 |
Accuracy на валидации = 0.705 Accuracy на тесте = 0.671 | ||
| Доля верно предсказанных «да» | Доля верно предсказанных «нет» |
Точность | 0.65 | 0.81 |
Полнота | 0.88 | 0.53 |
F-мера | 0.75 | 0.64 |
Accuracy на валидации = 0.73 Accuracy на тесте = 0.714 | ||
| Доля верно предсказанных «да» | Доля верно предсказанных «нет» |
Точность | 0.67 | 0.84 |
Полнота | 0.9 | 0.56 |
F-мера | 0.77 | 0.67 |
Таблица 11. P-tuning ruBERT на DaNetQA
Таблица 12. P-tuning
ruBERT на DaNetQA+RB
Таблица 13. P-tuning
ruBERT на DaNetQA+PT
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Accuracy на валидации = 0.79 Accuracy на тесте = 0.78 | ||
| Доля верно предсказанных «да» | Доля верно предсказанных «нет» |
Точность | 0.76 | 0.85 |
Полнота | 0.87 | 0.72 |
F-мера | 0.81 | 0.78 |
Accuracy на валидации = 0.8 Accuracy на тесте = 0.783 | ||
| Доля верно предсказанных «да» | Доля верно предсказанных «нет» |
Точность | 0.74 | 0.89 |
Полнота | 0.92 | 0.68 |
F-мера | 0.82 | 0.77 |
Accuracy на валидации = 0.82 Accuracy на тесте = 0.817 | ||
| Доля верно предсказанных «да» | Доля верно предсказанных «нет» |
Точность | 0.84 | 0.8 |
Полнота | 0.79 | 0.85 |
F-мера | 0.82 | 0.83 |
Таблица 14. P-tuning ruRoBERTa на DaNetQA
Таблица 15. P-tuning
ruRoBERTa на DaNetQA+RB
Таблица 16. P-tuning
ruRoBERTa на DaNetQA+PT
Генерация ответа на общие вопросы
passage: Отравления ртутью — расстройства здоровья, связанные с избыточным поступлением паров или соединений ртути в организм. Токсические свойства ртути известны с глубокой древности. Соединения ртути — киноварь, каломель и сулема — применялись для разных целей, в том числе и в качестве ядов. С древних времён известна также и металлическая ртуть, хотя её токсичность поначалу сильно недооценивалась. Ртуть и её соединения стали особенно широко применяться в средние века, в частности при производстве золота и серебряных зеркал, а также при изготовлении фетра для шляп, что вызвало поток новых, уже профессиональных отравлений.
label: false
passage: Фауна лесных почв — совокупность видов животных, для которых лесная почва является средой обитания, часть лесной фауны. Животных, обитающих в почве, в зависимости от размеров особей относят к следующим группам: макрофауна — в основном мелкие млекопитающие, в том числе землеройки, кроты. мезофауна — её представляют дождевые черви, многоножки, мокрицы, насекомые, их личинки. микрофауна — нематоды, энхитреиды, клещи, в основном панцирные клещи, ногохвостки и другие. Нанофауна - это одноклеточные простейшие. В любых лесах среди беспозвоночных почв преобладают сапрофаги, которые питаются лесным опадом, грибницей, гниющей древесиной.
label: false
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Генерация ответа на общие вопросы
passage: Съедобная лягушка — вид или таксон видового ранга семейства настоящих лягушек, произошедший в результате гибридизации прудовой и озёрной лягушек не менее 5000 лет назад. Название связано с тем, что лапки этого животного — популярное блюдо французской кухни. Максимальная длина тела 97 мм. Сверху чаще всего окрашены в зелёный цвет, но у части особей фон серый, оливковый, буроватый или мозаично зелено-бурый. Лягушка съедобная имеет промежуточные морфологические признаки между родительскими видами: серые резонаторы; округлый пяточный бугорок, длина которого укладывается 1,7—2,9 раз в длине первого пальца задних конечностей; голеностопные суставы, если конечности сложить перпендикулярно оси тела, соприкасаются.
label: true
passage: globulus и Е. amygdalina. В середине 19 века эвкалиптовое масло применяли для борьбы с эпидемиями малярии, при дифтерии и скарлатине. Коренные народы Австралии использовали листья эвкалипта для изготовления компрессов при лечении ран. Сегодня эвкалиптовое масло применяется в составе медицинских препаратов в терапии инфекционно-воспалительных заболеваний глотки и верхних дыхательных путей, ринита, гайморита, герпеса. Возможны аллергические реакции.
label: true
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Выводы
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Список литературы
Clark et al., 2019 – Clark, C., Lee, K., Chang, M.W., Kwiatkowski, T., Collins, M., Toutanova, K. Boolq: Exploring
the surprising difficulty of natural yes/no questions. 2019. arXiv:1905.10044.
Devlin et al., 2019 – Devlin J., Chang M-W., Lee K., Toutanova K. BERT: Pre-training of Deep Bidirectional
Transformers for Language Understanding. 2019 arXiv:1810.04805.
Glushkova et al., 2020 – Glushkova T., Machnev A., Fenogenova A., Shavrina T., Artemova E., Ignatov D. DaNetQA:
a yes/no Question Answering Dataset for the Russian Language. 2020. arXiv:2010.02605.
Liu et al., 2021 – Liu X., Zheng Y., Du Z., Ding M., Qian Y., Yang Z., Tang J. GPT Understands, Too. 2021.
arXiv:2103.10385.
Radford et al., 2018 – Radford A., Narasimhan K., Salimans T., Sutskever I. Improving Language Understanding by
Generative Pre-Training. OpenAI. 2018.
Vaswani et al., 2017 – Vaswani A., Shazeer N., Parmar N., Uszkoreit J., Jones L., Gomez A. N., Kaiser L.,
Polosukhin I. Attention is all you need // Advances in Neural Information Processing Systems. 2017. P. 6000–6010.
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Дополнительные материалы
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Правиловый подход для генерации общих вопросов: вопросительные преобразования
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных
Правиловый подход для генерации общих вопросов: отбор предложений
Автоматический ответ на общие вопросы с использованием искусственно сгенерированных данных