A | B | |
---|---|---|
1 | Исходные данные экзитполов "Голосуй за рубежом" на выборах президента РФ 15-17 марта 2024 на участках за рубежом | |
2 | Выгрузка от: 20/03/2024 22:58 CET | |
3 | Изменения с первой публикации: | |
4 | На участке в Коста-Рике удалён 1 тестовый ответ экзитпола | |
5 | На участке в Стокгольме восстановлены правильные таймкоды 47 анкет, которые изначально были перевбиты, т.к. попали по ошибке в другую форму | |
6 | ||
7 | CSV-format dataset tailored for data analysts: | |
8 | https://voteabroad.info/files/voter_responses_exit_polls_voteabroad_info_russia_presidential_election_20240317_v3.txt (Technical intro) | |
9 | https://voteabroad.info/files/voter_responses_exit_polls_voteabroad_info_russia_presidential_election_20240317_v3.csv (Data) | |
10 | ||
11 | Суммарная статистика и данные ЦИК доступны на сайте: https://voteabroad.info | |
12 | Суммарная статистика содержит на 87 анкет больше, чем исходные данные. Это 87 анкет в Хайфе, Израиль от волонтера верифицированного уже после публикации данных. | |
13 | ||
14 | Что стоит знать при анализе: | |
15 | Как собирались ответы экзитпола - поля "источник данных" и "timestamp": 1. Много волонтеров вводили данные в реальном времени в "общую электронную анкету" (время = выход избирателя) 2. Много волонтеров собирали данные в бумажном виде и оцифровывали их позже в "общую электронную анкету" (время нерепрезентативно) 3. Анонимная "электронной анкеты избирателя по одноразовым QR кодам" с уникальными PIN кодами привязанными к УИК (1433 анкет) 4. Ряд городов (Прага, Швеция, Дубай) использовали свою собственную электронную анкету (в реальном времени или оцифровкой после) 5. Два города (Веллингтон и Сидней) в передали статистику ответов о выборе кандидата и не собирали другие данные (отметка времени одинакова для всех записей) Мы не можем различить сбор реальном времени vs. оцифровывание бумажных анкет позже, т.к. не собирали параметр про это. | |
16 | ||
17 | Мы знаем, что в реальном времени собирались почти все данные в Нидерландах, в Швеции и большая часть в Кракове. | |
18 | ||
19 | Timestamp во временной зоне CET за исключением источника данных "Электронная анкета - Токио", где GMT+9 (Tokyo time) | |
20 | ||
21 | Вопрос о времени проживании за рубежом: - в источник данных = "Электронная анкета - Прага" вопрос отличался "Как давно вы проживаете в стране, где сейчас голосуете?" - в остальных городах - "Как давно вы не живете в России?" | |
22 | ||
23 | "Как долго вы добирались до избирательного участка?" - ответы могут быть искажены тем, что многие стояли во многочасовой очереди, чтобы попасть на участок. Многие волонтеры уточняли, что вопрос о времени в пути до начала очереди. Мы не знаем, кто из избирателей учитывал или не учитывал время в очереди при ответе на вопрос. | |
24 | ||
25 | Демографические параметры (пол, возраст, время проживания итд) отсутствуют в анкетах из источников данных - "Статистика ответов - Веллингтон" - "Статистика ответов - Сидней", т.к. эти волонтеры не собирали эту информацию | |
26 | ||
27 | Отказавшиеся отвечать вообще ("Не хочу отвечать" в поле "За какого кандидата вы проголосовали"): - не учитывались вообще в "Статистика ответов - Сидней" вообще - существенно недоучтены в Париже - возможно, учитывались не полностью в ряде других городов | |
28 | ||
29 | Время закрытия участка изменено на реальное время закрытия в некоторых (не всех) участках, в остальных указано объявленное время закрытия | |
30 | ||
31 | Кипр, Никосия - аномальные 36.000+ бюллетеней досрочного голосования | |
32 | ||
33 | Что отфильтровано из результатов и raw данных: - Все анкеты волонтеров от имейлов, которые не были верифицированы координаторами (1214 анкет) - Анкеты QR кодов, в которых PIN и УИК не соответствуют проверочным данным, а также предыдущие ответы в случае повторных отправок (94 анкеты) | |
34 |