Weeek
Авоська и Небоська
КОМАНДА
Граур
Андрей Константинович
ML Ops
Коряковцева
Алёна
Андреевна
Data Analyst
Кудрявцева Полина Дмитриевна
Data Analyst
Кайгородов
Глеб
Борисович
Data Scientist
2
Ли
Диана Александровна
Product manager
Проблема
Люди, не знакомые с системами типа Jira, затрудняются заводить задачи самостоятельно.
Цель проекта - упростить для них этот процесс (достаточно короткого текстового сообщения).
3
Практическая ценность
Цель проекта Weeek
Cоздать удобную и простую платформу для командной работы над задачами и проектами.
Основные задачи проекта
1. Упрощение процесса постановки задач. В настоящий момент этот процесс требует нескольких шагов, таких как набор текста, указание проекта и назначение исполнителя. Цель: создать возможность постановки задачи быстро и просто, подобно отправке аудиосообщения.
2. Разработка системы разметки текста из различных источников. Это позволит автоматически определить событие или действие, которое необходимо выполнить. А также назначить исполнителя, дату и другие детали задачи.
4
План и ход работ
5
План работ
1) Сформировать вопросы заказчику
2) Получить датасет
3) Провести исследование на тему существующих решений и подходов для решения задачи
4) Создание подкоманд для оптимизации процесса реализации решений
5) Распределение подзадач для каждой подкоманды
6) Создание визуализации полученных результатов (опционально)
Наборы данных
Датасет заказчика
2775 фраз, размеченных под задачу классификации
Как создать новую задачу в WEEEK? => advice
Провести обучение персонала заказчика по управлению сайтом. => task_create
Наш датасет под NER
487 фраз, приведенных к инфинитиву, с размеченными: типом задания, исполнителем и временем.
Создай B-TASK
задачу I-TASK
: O
Подготовить O
отчет O
к O
15 B-TIME
: O
00 B-TIME
завтра I-TIME
на O
Анну B-PERSON
6
Наборы данных: разметка датасета для NER
7
Решение с нуля: классификация
LSTM по набору данных заказчика
"Как настроить автоматическое назначение задач на основе приоритета?"
=> advice
"Александр Логинов, спланируйте создание контент-плана на месяц вперед к 25 ноября".
=> task_create
"Кто такие Авоська и Небоська?"
=> KeyError: 'такие' (слова “такие” не было в датасете)
8
Проблема: очень ограниченный словарь
Решение с нуля: NER
LSTM по нашей разметке
9
Проблема: очень ограниченный словарь
"Создай задачу : Олеся должна предоставить эскиз нового карнавального костюма завтра к 11 : 00"
=> KeyError: 'карнавальный' (слова “карнавальный” не было в датасете)
Создай задачу : Сергей должен предоставить 3 варианта дизайна упаковки до конца этой недели.
Создай задачу : Попросить Никиту разработать фирменный стиль для ресторана к 1 апреля.
TASK: Создай задачу
PERSON: Сергей
TIME: до конца этой недели
TASK: Создай задачу
PERSON: Никиту
TIME: 1 апреля
Метрики
Решение с дообучением:
NER spaCy
10
Пример получения разметки фразы
F1 score = 0.9
Выделяются основные сущности: тип задачи(task_type), время(time) и на кого поставлена задача(person)
Текст самой задачи определяется: фраза - task_type - time - person
Решение с дообучением:
NER DeepPavlov
DeepPavlov, дообученный на нашей разметке
11
Создай
задачу
:
Олеся
должна
предоставить
эскизы
сувенирной
продукции
завтра
к
11
:
00
B-LAW
I-LAW
O
B-PER
O
O
O
O
O
B-TIME
O
B-TIME
O
B-TIME
Метрики
Демо
12
Стэк:
https://huggingface.co/spaces/ru4rg/weeek-mipt
Рекомендации
13
Спасибо за внимание!
14
https://github.com/pluie-d-automne/weeek-hackathon