#mlcourse_open. Домашнее задание №4
Линейные модели классификации и регрессии в соревнованиях Kaggle Inclass
Email address
Фамилия, Имя, Отчество
Вопрос 4.1.1. Какие размерности имеют тестовая и обучающая выборки?
1 point
Вопрос 4.1.2. Какие сайты Элис посещает в сети наиболее часто?
1 point
Вопрос 4.1.3. Выберите все верные утверждения (может оказаться один верный ответ, несколько или ни одного):
3 points
Required
Вопрос 4.1.4. Чему равна разреженность матрицы из минипримера?
1 point
Вопрос 4.1.5. Данные за какие годы представлены в обучающей и тестовой выборке?
1 point
Вопрос 4.1.6. Постройте график количества сессий Элис в зависимости от новой переменной start_month. Выберите верное утверждение:
1 point
Вопрос 4.1.7. Добавьте в обучающую выборку признак n_unique_sites , количество уникальных сайтов в сессии, и посчитайте, как изменилось качество на отложенной выборке?
1 point
Вопрос 4.1.8. Добавьте два новых признака: start_hour и morning. Посчитайте метрику, какие из признаков дали прирост?
1 point
Вопрос 4.1.9. При каком коэффициенте регуляризации C модель показывает наивысшее качество?
1 point
Вопрос 4.2.1. Есть ли в train_df признаки, корреляция между которыми больше 0.9? Обратите внимание - именно различные признаки.
1 point
Вопрос 4.2.2. В каком году было больше всего публикаций? (Рассматриваем train_df)
1 point
Вопрос 4.2.3. Какой размер у полученного словаря?
1 point
Вопрос 4.2.4. Какой индекс у слова 'python'?
1 point
Вопрос 4.2.5. Какой размер у полученного словаря?
1 point
Вопрос 4.2.6. Выберите верные утверждения
2 points
Есть ли замечания по заданию?
Submit
Never submit passwords through Google Forms.
This content is neither created nor endorsed by Google. Report Abuse - Terms of Service - Additional Terms