A | B | C | D | E | F | G | ||
---|---|---|---|---|---|---|---|---|
1 | Студент | Логин | Название датасета | URL на Kaggle или другом ресурсе* | Комментарий преподавателя | Deadline | ||
2 | *Если датасет свой - укажите "Свой датасет" и по желанию его колонки. Если вы меняете датасет - удаляйте комментарий. | |||||||
3 | Пример | Titanic | https://www.kaggle.com/c/titanic/data | Titanic использован в лекции, брать нельзя | 49 | |||
4 | Апель | Полина | polina-apel | Memory Test on Drugged Islanders Data | https://www.kaggle.com/steveahn/memory-test-on-drugged-islanders-data | Ок | 1 | |
5 | Бибишева | Рената | rbibisheva | depression | https://www.kaggle.com/diegobabativa/depression | Ок | 1 | |
6 | Болтышева | Анастасия | windbiter | 0 | ||||
7 | Босов | Дмитрий | dimabosov | https://www.kaggle.com/primaryobjects/voicegender | Если вы хотите ML делать, то вперед. Тем не менее, базовый анализ тут точно не получится сделать адекватно. Значения по строкам не связаны друг с другом. | 1 | ||
8 | Буев | Виталий | vitbuev | Chess Game Dataset (Lichess) | https://www.kaggle.com/datasnaek/chess | Подойдет | 1 | |
9 | Ватолкина | Ника | mora | Complete Pokemon Dataset (Updated 16.04.21) | https://www.kaggle.com/mariotormo/complete-pokemon-dataset-updated-090420 | Ок | 1 | |
10 | Вашуркина | Софья | vashur | Student Alcohol Consumption | https://www.kaggle.com/uciml/student-alcohol-consumption | Ок | 1 | |
11 | Владимиров | Даниил | daenbol | Structural Protein Sequences | https://www.kaggle.com/shahir/protein-data-set | Неплохой датасет | 1 | |
12 | Вольхин | Илья | volkhin2 | Star dataset to predict star types | https://www.kaggle.com/deepu1109/star-dataset | Данных не очень много, но попробуйте | 1 | |
13 | Гаркуль | Лидия | lidia | Nutritional values for common foods and products | https://www.kaggle.com/trolukovich/nutritional-values-for-common-foods-and-products | Данные надо будет чистить, они числовые, но в виде строк (с единицами измерения). Категориальных признаков нет, если берете этот датасет, их надо будет генерировать из имеющихся признаков (какой-нибудь разумной группировкой по одному или нескольким признакам) | 1 | |
14 | Демьянченко | Олег | kuzka | 2016 US election demographical data | https://www.kaggle.com/benhamner/2016-us-election | Прикольно, давайте | 0 | |
15 | Денисова | Александра | savouriess2112 | Properties of ATC accepted medicines | https://www.kaggle.com/tonibois/properties-of-atc-accepted-medicines | Хорошо | 1 | |
16 | Дрозд | Яна | drozd.yana | Hepatitis C Prediction Dataset | https://www.kaggle.com/fedesoriano/hepatitis-c-dataset | Подойдет | 1 | |
17 | Егоров | Евгений | yablinkubovich | Stroke Prediction Dataset | https://www.kaggle.com/fedesoriano/stroke-prediction-dataset | Хороший датасет | 1 | |
18 | Жукова | Надежда | zhukonad99 | World Happiness | https://www.kaggle.com/unsdsn/world-happiness | Не очень много значений, но можете попробовать склеить таблицы (как?) и посмотреть тренды по годам. Пробуйте придумать графики под ваши цели | 1 | |
19 | Заббарова | Вероника | zaveron | Hourly energy demand generation and weather | https://www.kaggle.com/nicholasjhana/energy-consumption-generation-prices-and-weather?select=weather_features.csv | Ок | 1 | |
20 | Завилейский | Лев | zavilev | Indian Liver Patient Records | https://www.kaggle.com/uciml/indian-liver-patient-records | Категория всего одна, но можете попробовать сделать другие категории самостоятельно | 1 | |
21 | Камкина | Татьяна | tatkam | The Spotify Hit Predictor Dataset (1960-2019) | https://www.kaggle.com/theoverman/the-spotify-hit-predictor-dataset | Приятный. Можете добавить колонку с периодом и сконкатенировать в один большой датасет, а потом разные группировки делать | 1 | |
22 | Касьянова | Мария | kasmasha | Bike Sharing in Washington D.C. Dataset | https://www.kaggle.com/marklvl/bike-sharing-dataset?select=hour.csv | Забавно, там распределения по картинкам все равномерные. Ну берите, штош | 1 | |
23 | Каштанова | Анастасия | anastasiia | ForbesAmericasTopColleges2019 | https://www.kaggle.com/chris95cam/forbes-americas-top-colleges-2019 | Ок | 1 | |
24 | Колодяжная | Екатерина | ekako | FIFA 19 Player Database | https://www.kaggle.com/aishwarya1992/fifa-19-player-database | Отличный большой датасет. Конечно, полный анализ делать не надо, выберите то, что интересно. Обязательно поясняйте смысл переменных в анализе | 1 | |
25 | Колчанова | Анастасия | 15anastasi | Goodreads-books | https://www.kaggle.com/jealousleopard/goodreadsbooks | Категорий немного, придется заниматься парсингом дат и издательств | 1 | |
26 | Колюпанова | Наталия | nataliyak | Foodborne disease outbreaks | https://www.kaggle.com/cdc/foodborne-diseases | Достаточно неплохой датасет. Проверьте число колонок. | 1 | |
27 | Коновалова | Евгения | konovalova.z | Russia Real Estate 2018-2021 | https://www.kaggle.com/mrdaniilak/russia-real-estate-20182021 | 1 | ||
28 | Кряквин | Максим | maxim2002 | California Housing Data (1990) | https://www.kaggle.com/harrywang/housing?select=housing.csv | Ок, но есть всего 1 категория. Можете обойтись ей или сделать новые из имеющихся данных | 1 | |
29 | Левин | Илья | lewis | League of Legends Diamond Ranked Games (10 min) | https://www.kaggle.com/bobbyscience/league-of-legends-diamond-ranked-games-10-min | Вам придется самостоятельно создавать категории (т.е. как-то осмысленно группировать по числовым переменным - их тут очень много). Если согласны и вам интересен LoL, то датасет подойдет. | 1 | |
30 | Луконенко | Екатерина | tea-01 | 0 | ||||
31 | Лыскова | Алиса | alice | Google Play Store Apps | https://www.kaggle.com/lava18/google-play-store-apps | Хороший датасет | 1 | |
32 | Лямина | Анна | lyamina26 | Students Performance in Exams | https://www.kaggle.com/spscientist/students-performance-in-exams | Ок, но для него много примеров в интернете. Буду пристально проверять. | 1 | |
33 | Марков | Иван | m74ovik | Dogecoin Historical Data(2017-2021) | https://www.kaggle.com/tarandeep97/dogecoin-historical-data20172021 | Из биржевых данных трудно что-то тащить (было бы легко - можно на этом зарабатывать), но если сможете - круто. Ваша задача с этим датасетом будет посмотреть, как новости о DogeCoin и крипте влияют на стоимость. Придется много гуглить. | 1 | |
34 | Миньковская | Татьяна | weary.lizard | All Elon Musk's Tweets | https://www.kaggle.com/andradaolteanu/all-elon-musks-tweets | Ок | 1 | |
35 | Никитин | Павел | nikitinp | Palmer Archipelago (Antarctica) penguin data | https://www.kaggle.com/parulpandey/palmer-archipelago-antarctica-penguin-data | Да, ок | 1 | |
36 | Ноздрин | Владимир | legoushque | CS:GO Professional Matches или Anime Recommendation Database 2020 | https://www.kaggle.com/mateusdmachado/csgo-professional-matches или https://www.kaggle.com/hernan4444/anime-recommendation-database-2020 | Оба хорошие и смешные. Выбирайте тот, что вам будет интереснее анализировать. Anime Recommendations дублируется у кекуле, договоритесь | 1 | |
37 | Носкова | Елизавета | kekulen | Health care: Heart attack possibility | https://www.kaggle.com/nareshbhat/health-care-data-set-on-heart-attack-possibility/code?datasetId=737503&sortBy=voteCount | Оба хорошие. В первом переменных не очень много, но мб вам их хватит. Anime Recommendations дублирется у лягушк, договоритесь | 1 | |
38 | Орлов | Артем | orlov.artem | Video Game Sales with Ratings | https://www.kaggle.com/rush4ratio/video-game-sales-with-ratings | Годно | 1 | |
39 | Пензин | Никита | recidivist | Solar power Generation | https://www.kaggle.com/vipulgote4/solar-power-generation | Сложно для анализа, но можно брать | 1 | |
40 | Петрухин | Егор | egorfix | Honey Production in the USA (1998-2012) | https://www.kaggle.com/jessicali9530/honey-production | Ок, но категорий нет. Можете их придумать сами (т.е. сгруппировать имеющиеся данные) | 1 | |
41 | Пигиданов | Артемий | artemii | Wine Quality | https://www.kaggle.com/rajyellow46/wine-quality | Ок, но категорий нет. Можете их придумать сами (т.е. сгруппировать имеющиеся данные) | 1 | |
42 | Питиков | Егор | pitikov.egor | Wine Reviews | https://www.kaggle.com/zynicide/wine-reviews | Датасет неплохой, численных данных не очень много, но ок | 1 | |
43 | Покровский | Сергей | pork7007 | Meteorite Landings | https://www.kaggle.com/nasa/meteorite-landings | 1 | ||
44 | Пухов | Степан | stepan_puhov | 0 | ||||
45 | Рачкова | Анастасия | rachkovanastya | Mice Protein Expression | https://www.kaggle.com/ruslankl/mice-protein-expression | Хорошо, если вы понимаете, что там за данные | 1 | |
46 | Романова | Татьяна | ta.rom | Harry Potter fanfiction data | https://www.kaggle.com/nehatiwari03/harry-potter-fanfiction-data | Надо будет распарсить имена и жанры | 1 | |
47 | Семёнова | Ариадна | a19semenova | Alcohol consumption in Russia | https://www.kaggle.com/dwdkills/alcohol-consumption-in-russia | Категории очень мелкие, придется их формировать самостоятельно (группировать как-то?) | 1 | |
48 | Скворцов | Денис | starlingsden | Movies on Netflix, Prime Video, Hulu and Disney+ | https://www.kaggle.com/ruchi798/movies-on-netflix-prime-video-hulu-and-disney | Хороший | 1 | |
49 | Соркин | Антон | retr0 | SkillCraft-StarCraft | https://www.kaggle.com/danofer/skillcraft | Хороший | 1 | |
50 | Стринкевич | Александра | sanya.str | Medical Cost Personal Datasets | https://www.kaggle.com/mirichoi0218/insurance | 1 | ||
51 | Суслов | Андрей | asuslov | Metacritic all time games stats | https://www.kaggle.com/skateddu/metacritic-all-time-games-stats | Ок | 1 | |
52 | Сухинина | Анастасия | sukhinina-a | World Happiness Report 2021 | https://www.kaggle.com/ajaypalsinghlo/world-happiness-report-2021 | Датасеты коротенькие. Можно, если очень хочется | 1 | |
53 | Фроленкова | Марина | frolenkova.mo | Life Expectancy (WHO) | https://www.kaggle.com/kumarajarshi/life-expectancy-who | Стран немного, но есть группировка по годам. В принципе, подходит | 1 | |
54 | Хлебников | Даниил | mrbelyash | Market Prices of Onion 2020 | https://www.kaggle.com/ravisane1/market-price-of-onion-2020 | Если берете этот датасет - откуда-то надо брать численные значения | 1 | |
55 | Хохлова | Мария | manyak | D&D | https://www.kaggle.com/mrpantherson/dnd-5e-monsters | Хорошо | 1 | |
56 | Чупин | Глеб | gchupin | Autoimmune Diseases gene expression | https://adex.genyo.es/ | Ok | 1 |