AB
1
Исходные данные экзитполов "Голосуй за рубежом" на выборах президента РФ 15-17 марта 2024 на участках за рубежом
2
Выгрузка от: 20/03/2024 22:58 CET
3
Изменения с первой публикации:
4
На участке в Коста-Рике удалён 1 тестовый ответ экзитпола
5
На участке в Стокгольме восстановлены правильные таймкоды 47 анкет, которые изначально были перевбиты, т.к. попали по ошибке в другую форму
6
7
CSV-format dataset tailored for data analysts:
8
https://voteabroad.info/files/voter_responses_exit_polls_voteabroad_info_russia_presidential_election_20240317_v3.txt (Technical intro)
9
https://voteabroad.info/files/voter_responses_exit_polls_voteabroad_info_russia_presidential_election_20240317_v3.csv (Data)
10
11
Суммарная статистика и данные ЦИК доступны на сайте: https://voteabroad.info
12
Суммарная статистика содержит на 87 анкет больше, чем исходные данные. Это 87 анкет в Хайфе, Израиль от волонтера верифицированного уже после публикации данных.
13
14
Что стоит знать при анализе:
15
Как собирались ответы экзитпола - поля "источник данных" и "timestamp":
1. Много волонтеров вводили данные в реальном времени в "общую электронную анкету" (время = выход избирателя)
2. Много волонтеров собирали данные в бумажном виде и оцифровывали их позже в "общую электронную анкету" (время нерепрезентативно)
3. Анонимная "электронной анкеты избирателя по одноразовым QR кодам" с уникальными PIN кодами привязанными к УИК (1433 анкет)
4. Ряд городов (Прага, Швеция, Дубай) использовали свою собственную электронную анкету (в реальном времени или оцифровкой после)
5. Два города (Веллингтон и Сидней) в передали статистику ответов о выборе кандидата и не собирали другие данные (отметка времени одинакова для всех записей)

Мы не можем различить сбор реальном времени vs. оцифровывание бумажных анкет позже, т.к. не собирали параметр про это.
16
17
Мы знаем, что в реальном времени собирались почти все данные в Нидерландах, в Швеции и большая часть в Кракове.
18
19
Timestamp во временной зоне CET за исключением источника данных "Электронная анкета - Токио", где GMT+9 (Tokyo time)
20
21
Вопрос о времени проживании за рубежом:
- в источник данных = "Электронная анкета - Прага" вопрос отличался "Как давно вы проживаете в стране, где сейчас голосуете?"
- в остальных городах - "Как давно вы не живете в России?"
22
23
"Как долго вы добирались до избирательного участка?" - ответы могут быть искажены тем, что многие стояли во многочасовой очереди, чтобы попасть на участок.
Многие волонтеры уточняли, что вопрос о времени в пути до начала очереди.
Мы не знаем, кто из избирателей учитывал или не учитывал время в очереди при ответе на вопрос.
24
25
Демографические параметры (пол, возраст, время проживания итд) отсутствуют в анкетах из источников данных
- "Статистика ответов - Веллингтон"
- "Статистика ответов - Сидней", т.к. эти волонтеры не собирали эту информацию
26
27
Отказавшиеся отвечать вообще ("Не хочу отвечать" в поле "За какого кандидата вы проголосовали"):
- не учитывались вообще в "Статистика ответов - Сидней" вообще
- существенно недоучтены в Париже
- возможно, учитывались не полностью в ряде других городов
28
29
Время закрытия участка изменено на реальное время закрытия в некоторых (не всех) участках, в остальных указано объявленное время закрытия
30
31
Кипр, Никосия - аномальные 36.000+ бюллетеней досрочного голосования
32
33
Что отфильтровано из результатов и raw данных:
- Все анкеты волонтеров от имейлов, которые не были верифицированы координаторами (1214 анкет)
- Анкеты QR кодов, в которых PIN и УИК не соответствуют проверочным данным, а также предыдущие ответы в случае повторных отправок (94 анкеты)
34