ABCDEFG
1
СтудентЛогинНазвание датасетаURL на Kaggle или другом ресурсе*Комментарий преподавателяDeadline
2
*Если датасет свой - укажите "Свой датасет" и по желанию его колонки.
Если вы меняете датасет - удаляйте комментарий.
3
ПримерTitanichttps://www.kaggle.com/c/titanic/dataTitanic использован в лекции, брать нельзя49
4
АпельПолинаpolina-apelMemory Test on Drugged Islanders Datahttps://www.kaggle.com/steveahn/memory-test-on-drugged-islanders-dataОк1
5
БибишеваРенатаrbibishevadepressionhttps://www.kaggle.com/diegobabativa/depressionОк1
6
БолтышеваАнастасияwindbiter0
7
БосовДмитрийdimabosovhttps://www.kaggle.com/primaryobjects/voicegenderЕсли вы хотите ML делать, то вперед. Тем не менее, базовый анализ тут точно не получится сделать адекватно. Значения по строкам не связаны друг с другом.1
8
БуевВиталийvitbuevChess Game Dataset (Lichess)https://www.kaggle.com/datasnaek/chessПодойдет1
9
ВатолкинаНикаmora
Complete Pokemon Dataset (Updated 16.04.21)
https://www.kaggle.com/mariotormo/complete-pokemon-dataset-updated-090420Ок1
10
ВашуркинаСофьяvashurStudent Alcohol Consumptionhttps://www.kaggle.com/uciml/student-alcohol-consumptionОк1
11
ВладимировДаниилdaenbolStructural Protein Sequenceshttps://www.kaggle.com/shahir/protein-data-setНеплохой датасет1
12
ВольхинИльяvolkhin2Star dataset to predict star typeshttps://www.kaggle.com/deepu1109/star-datasetДанных не очень много, но попробуйте1
13
ГаркульЛидияlidia
Nutritional values for common foods and products
https://www.kaggle.com/trolukovich/nutritional-values-for-common-foods-and-products
Данные надо будет чистить, они числовые, но в виде строк (с единицами измерения). Категориальных признаков нет, если берете этот датасет, их надо будет генерировать из имеющихся признаков (какой-нибудь разумной группировкой по одному или нескольким признакам)1
14
ДемьянченкоОлегkuzka2016 US election demographical datahttps://www.kaggle.com/benhamner/2016-us-electionПрикольно, давайте0
15
ДенисоваАлександраsavouriess2112Properties of ATC accepted medicines https://www.kaggle.com/tonibois/properties-of-atc-accepted-medicines Хорошо1
16
ДроздЯнаdrozd.yanaHepatitis C Prediction Datasethttps://www.kaggle.com/fedesoriano/hepatitis-c-datasetПодойдет1
17
ЕгоровЕвгенийyablinkubovichStroke Prediction Datasethttps://www.kaggle.com/fedesoriano/stroke-prediction-datasetХороший датасет1
18
ЖуковаНадеждаzhukonad99World Happinesshttps://www.kaggle.com/unsdsn/world-happinessНе очень много значений, но можете попробовать склеить таблицы (как?) и посмотреть тренды по годам. Пробуйте придумать графики под ваши цели1
19
ЗаббароваВероникаzaveron
Hourly energy demand generation and weather
https://www.kaggle.com/nicholasjhana/energy-consumption-generation-prices-and-weather?select=weather_features.csv
Ок1
20
ЗавилейскийЛевzavilevIndian Liver Patient Recordshttps://www.kaggle.com/uciml/indian-liver-patient-recordsКатегория всего одна, но можете попробовать сделать другие категории самостоятельно1
21
КамкинаТатьянаtatkam
The Spotify Hit Predictor Dataset (1960-2019)
https://www.kaggle.com/theoverman/the-spotify-hit-predictor-datasetПриятный. Можете добавить колонку с периодом и сконкатенировать в один большой датасет, а потом разные группировки делать1
22
КасьяноваМарияkasmashaBike Sharing in Washington D.C. Datasethttps://www.kaggle.com/marklvl/bike-sharing-dataset?select=hour.csv Забавно, там распределения по картинкам все равномерные. Ну берите, штош1
23
КаштановаАнастасияanastasiiaForbesAmericasTopColleges2019https://www.kaggle.com/chris95cam/forbes-americas-top-colleges-2019Ок1
24
КолодяжнаяЕкатеринаekakoFIFA 19 Player Databasehttps://www.kaggle.com/aishwarya1992/fifa-19-player-databaseОтличный большой датасет. Конечно, полный анализ делать не надо, выберите то, что интересно. Обязательно поясняйте смысл переменных в анализе1
25
КолчановаАнастасия15anastasiGoodreads-bookshttps://www.kaggle.com/jealousleopard/goodreadsbooksКатегорий немного, придется заниматься парсингом дат и издательств1
26
КолюпановаНаталияnataliyakFoodborne disease outbreakshttps://www.kaggle.com/cdc/foodborne-diseasesДостаточно неплохой датасет. Проверьте число колонок.1
27
КоноваловаЕвгенияkonovalova.zRussia Real Estate 2018-2021https://www.kaggle.com/mrdaniilak/russia-real-estate-201820211
28
КряквинМаксимmaxim2002California Housing Data (1990)https://www.kaggle.com/harrywang/housing?select=housing.csvОк, но есть всего 1 категория. Можете обойтись ей или сделать новые из имеющихся данных1
29
ЛевинИльяlewis
League of Legends Diamond Ranked Games (10 min)
https://www.kaggle.com/bobbyscience/league-of-legends-diamond-ranked-games-10-min
Вам придется самостоятельно создавать категории (т.е. как-то осмысленно группировать по числовым переменным - их тут очень много). Если согласны и вам интересен LoL, то датасет подойдет.1
30
ЛуконенкоЕкатеринаtea-010
31
ЛысковаАлисаaliceGoogle Play Store Appshttps://www.kaggle.com/lava18/google-play-store-appsХороший датасет1
32
ЛяминаАннаlyamina26Students Performance in Examshttps://www.kaggle.com/spscientist/students-performance-in-examsОк, но для него много примеров в интернете. Буду пристально проверять.1
33
МарковИванm74ovikDogecoin Historical Data(2017-2021)https://www.kaggle.com/tarandeep97/dogecoin-historical-data20172021Из биржевых данных трудно что-то тащить (было бы легко - можно на этом зарабатывать), но если сможете - круто. Ваша задача с этим датасетом будет посмотреть, как новости о DogeCoin и крипте влияют на стоимость. Придется много гуглить.1
34
МиньковскаяТатьянаweary.lizardAll Elon Musk's Tweetshttps://www.kaggle.com/andradaolteanu/all-elon-musks-tweetsОк1
35
НикитинПавелnikitinpPalmer Archipelago (Antarctica) penguin datahttps://www.kaggle.com/parulpandey/palmer-archipelago-antarctica-penguin-dataДа, ок1
36
НоздринВладимирlegoushque
CS:GO Professional Matches или Anime Recommendation Database 2020
https://www.kaggle.com/mateusdmachado/csgo-professional-matches или https://www.kaggle.com/hernan4444/anime-recommendation-database-2020
Оба хорошие и смешные. Выбирайте тот, что вам будет интереснее анализировать. Anime Recommendations дублируется у кекуле, договоритесь1
37
НосковаЕлизаветаkekulenHealth care: Heart attack possibilityhttps://www.kaggle.com/nareshbhat/health-care-data-set-on-heart-attack-possibility/code?datasetId=737503&sortBy=voteCount Оба хорошие. В первом переменных не очень много, но мб вам их хватит. Anime Recommendations дублирется у лягушк, договоритесь1
38
ОрловАртемorlov.artemVideo Game Sales with Ratingshttps://www.kaggle.com/rush4ratio/video-game-sales-with-ratingsГодно1
39
ПензинНикитаrecidivistSolar power Generationhttps://www.kaggle.com/vipulgote4/solar-power-generationСложно для анализа, но можно брать1
40
ПетрухинЕгорegorfix
Honey Production in the USA (1998-2012)
https://www.kaggle.com/jessicali9530/honey-productionОк, но категорий нет. Можете их придумать сами (т.е. сгруппировать имеющиеся данные)1
41
ПигидановАртемийartemiiWine Qualityhttps://www.kaggle.com/rajyellow46/wine-qualityОк, но категорий нет. Можете их придумать сами (т.е. сгруппировать имеющиеся данные)1
42
ПитиковЕгорpitikov.egorWine Reviewshttps://www.kaggle.com/zynicide/wine-reviewsДатасет неплохой, численных данных не очень много, но ок1
43
ПокровскийСергейpork7007Meteorite Landingshttps://www.kaggle.com/nasa/meteorite-landings 1
44
ПуховСтепанstepan_puhov0
45
РачковаАнастасияrachkovanastyaMice Protein Expressionhttps://www.kaggle.com/ruslankl/mice-protein-expressionХорошо, если вы понимаете, что там за данные1
46
РомановаТатьянаta.romHarry Potter fanfiction datahttps://www.kaggle.com/nehatiwari03/harry-potter-fanfiction-dataНадо будет распарсить имена и жанры1
47
СемёноваАриаднаa19semenovaAlcohol consumption in Russiahttps://www.kaggle.com/dwdkills/alcohol-consumption-in-russiaКатегории очень мелкие, придется их формировать самостоятельно (группировать как-то?)1
48
СкворцовДенисstarlingsden
Movies on Netflix, Prime Video, Hulu and Disney+
https://www.kaggle.com/ruchi798/movies-on-netflix-prime-video-hulu-and-disneyХороший1
49
СоркинАнтонretr0SkillCraft-StarCrafthttps://www.kaggle.com/danofer/skillcraftХороший1
50
СтринкевичАлександраsanya.strMedical Cost Personal Datasetshttps://www.kaggle.com/mirichoi0218/insurance1
51
СусловАндрейasuslovMetacritic all time games statshttps://www.kaggle.com/skateddu/metacritic-all-time-games-statsОк1
52
СухининаАнастасияsukhinina-aWorld Happiness Report 2021https://www.kaggle.com/ajaypalsinghlo/world-happiness-report-2021Датасеты коротенькие. Можно, если очень хочется1
53
ФроленковаМаринаfrolenkova.moLife Expectancy (WHO)https://www.kaggle.com/kumarajarshi/life-expectancy-whoСтран немного, но есть группировка по годам. В принципе, подходит1
54
ХлебниковДаниилmrbelyashMarket Prices of Onion 2020https://www.kaggle.com/ravisane1/market-price-of-onion-2020 Если берете этот датасет - откуда-то надо брать численные значения1
55
ХохловаМарияmanyakD&Dhttps://www.kaggle.com/mrpantherson/dnd-5e-monstersХорошо1
56
ЧупинГлебgchupinAutoimmune Diseases gene expressionhttps://adex.genyo.es/Ok1