Выборы и рулетка
corbulon — 02.03.2012 Теги: ЧуровГолая
школьная математика
(модель статьи)
Волнующий вопрос о достоверности результатов выборов в Госдуму 4 декабря становится все менее актуальным – люди привыкают ко всему. Зато скоро станет сверхактуальным вопрос о президентских выборах 4 марта. Достоверность декабрьских результатов можно проверить иным способом, который пока не обсуждался широко, который прост и понятен, хотя не сможет, наверно, дать ответ на вопросы: КТО, КАК, КОГДА, ЗАЧЕМ и НАСКОЛЬКО вмешивался и корректировал результаты.
1. Немного почти школьной арифметики
Если представить себе колесо вроде
рулетки, но с 10 цифрами, то нетрудно догадаться, что закрутив
колесо 100 раз, мы получим примерно по 10 выпадений каждой цифры.
«Примерно» – потому что, возможны случайные отклонения. Но, с
другой стороны, если все 100 раз колесо остановится на цифре «3»,
вряд ли кто сочтет такой результат случайным совпадением. Граница
между «случайностью» и «закономерностью» чуть ли не со времен
Гаусса, то есть уже 200 лет, принимается равной некоей величине,
которую называют «три сигма» - 3σ.
Величину σ можно подсчитать
по школьной формуле, это √(pqN). В нашем
случае p=0.1 – вероятность выпадения одной определенной цифры из
десяти, а q=0,9 – вероятность противоположного исхода, N – число
испытаний, в нашем примере это 100. Тогда получится, что «3 сигма»
равна 9. То есть результат для каждой цифры колеблется вокруг 10, с
размахом 9, а значит от 1 до 19. Довольно «либерально», не правда
ли? Но теория вероятностей утверждает, что в 99.7% случаев
результат укладывается в этот диапазон. Можно и просто разделить
число выпадений цифры на число опытов с рулеткой
N и тогда мы должны ждать, что каждая цифра
будет выпадать с частотой около 0,1 и с
σ=√(pq/N)
Вот, что получится, если не 100, а сто тысяч раз закрутить рулетку с 10 цифрами.
Рис1
Зеленые линии как раз показывают плюс/минус три сигмы к средней величине 0,1 и видно, что все точки лежат внутри такого «зеленого коридора». При этом ясно, что если одна цифра встречается чаще, то другие должны встречаться реже, однако все же примерно одинаково реже.
Но уж если результаты НЕ укладываются в коридор «три сигма», тогда произошло что-то существенное. Для физика-экспериментатора выход измеряемой величины за пределы «3 сигма» практически означает доказательство.
Но это лишь одна из десяти цифр. Может оказаться так, что точки хотя и лежат внутри зеленого коридора, но многие из них слишком близко подходят к границам. Чтобы учесть это обстоятельство и расположение сразу всех десяти цифр, используют величину, которую назвали - χ2 (читается «хи-квадрат») или критерием Пирсона. Это сумма квадратов отклонений числа результатов по каждой цифре от ожидаемого значения. В нашем примере с сотней опытов эта разница от десяти, отнесенная к самому ожидаемому результату. Есть таблицы, которые показывают, что если в нашей рулетке χ2 стало равно 14,7, то такое может получиться в 10% случаев, ну а если достигло 27,9 – то это уже совсем неправдоподобно редко – лишь 0,1%.
Можно и сразу считать вероятность, с которой получается такое χ2, что мы и будем делать. Так если подсчитать χ2 для нашего графика, то она окажется равной 5,5, а вероятность составит 78%. Значит на графике результаты хорошей, честной рулетки.
2. А теперь займемся выборами.
Ведомство господина Чурова, повинуясь закону, сделало доступным результаты выборов по каждому из почти 100 тысяч избирательных участков России. Правда оно запрятало эти данные так глубоко, так тщательно разбило их на отдельные фрагменты, что рядовой и даже не рядовой пользователь интернета до них не доберется, а если и доберется, то только до отдельных фрагментов, которых без малого 100. А дальше придется или терпеливо собирать пазл, или просить помощи.
Но вот все трудности преодолены и у вас есть полная таблица с протоколами всех 95228 избирательных участков. В протоколах много граф. Выберем из них те, числа в которых, как правило, большие. Это 1) число избирателей в списках; 2) число избирателей получивших бюллетени в помещении для голосования; 3) число бюллетеней, признанных действительными (то есть не испорченных), а также число голосов за каждую из двух самых больших партий. Всего у нас получится пять граф.
В каждом из этих 95228 чисел, в каждой из 5 граф будем смотреть лишь на ПОСЛЕДНЮЮ ЦИФРУ. Но и тут побеспокоимся – не будем брать в расчет однозначные и двузначные числа, только большие: трехзначные и четырехзначные: в них последняя цифра должна встречаться равновероятно, как в нашей мысленной рулетке с 10 ячейками.
Но сначала проделаем всё это для парламентских выборов 2010 года в Швеции. Просто для того, чтобы убедиться, что метод работает.
Рис.2
Ну что же – как и в нашей рулетке, здесь все точки пляшут внутри коридора, да и вероятность более 60%. Значит, и тут нет оснований сомневаться.
А теперь взглянем, используя тот же самый алгоритм и программу, на Российские выборы 4 декабря.
Рис.3
Разница не может не удивлять. На графике точки далеко вылезают из «зеленого коридора». Количество нулей среди последних цифр в России неправдоподобно велико, они встречаются много чаще, чем разрешает «три сигма». Да что там жалкие «три сигма», если такого не разрешают и 10 сигм! Вероятность, что такой результат получился совершенно случайно, описывается дробью, в знаменателе которой число большее, чем масса Земли в граммах (1027). А вот девятки встречаются почти столь же неправдоподобно редко. Даже семерки оказываются «нелюбимым» числом, всего лишь в 0,3% случаев такое может получиться случайно. И лишь «круглая пятерка» обладает заметным преимуществом.
Но стоит лишь отодвинуть от подсчета голосов подчиненных господина Чурова («Россия без Ч»), то есть взять лишь те участки, где бюллетени считали не люди, а автоматы, то как по волшебству (или все же без «волшебства»?) всё становится почти таким же, как в Швеции (кстати, и число избирательных участков в этих случаях близкое: 4374 и 6063, и численность избирателей от 7 до 8 миллионов).
Рис. 4
Почему «почти обыденным»? Да просто потому, что и в «Россию без Ч.» попадают числа избирателей в списках и числа выданных избирателям бюллетеней, а тут уж без людей не обошлось, так частым нулям и пятеркам с редкими семерками можно не очень удивляться.
А если взять Дагестан с его более полутора миллионами избирателей,
Рис. 5
то там из 7176 чисел из протоколов УИК, цифрой «0» заканчивается
1495 чисел, в два с лишним раза чаще, чем ожидается, а вот цифрой
«1» лишь 575, хотя число повторений каждой цифры с вероятностью
99,7% должно укладываться в диапазон от 642 до 794. Разница
уже не шесть, а 36 сигм! (Обратите внимание на то, что масштаб для
Дагестана пришлось брать раз в 10 мельче – иначе числа просто не
умещаются.)
И без всякой математики понятно, что если
в нашей рулетке из 10 цифр сто раз из ста (!!!) выпала одна и та же
цифра, то рулетка явно мошенническая, а ведь в этом примере
разница всего лишь 11 сигм, а не 36.
Однако вернемся к выборам. Видно, что «5», как и «0»,
снова пользуется явным преимуществом перед остальными, особенно
соседними (и очень многозначительно соседними) цифрами .
Значения
χ2 в Дагестане
превосходят многие сотни, а мы помним, что уже значение
χ2=28 дает вероятность, которую не
встретишь на практике, менее 0,1%. Вероятность того, что такие
огромные отклонения как на рисунке произошли в результате
случайного стечения обстоятельств, равна дроби 1/10204,
в знаменателе которой стоит число, много большее, чем число
элементарных частиц во всей Вселенной (жалкие
1080!).
Результаты выборов на Кавказе на самом
верху вертикали власти наивно объясняли особой
тейповой структурой общества и уважением к старшим
(начальству). Обществом, в котором все голосуют так, как сказал
старейшина.
Пусть так, поверим. Но, как мы видим, тогда
придется объяснить, почему тейпы преимущественно состоят из целых
десятков людей, которые так и живут десятками (лишь бы не по
7 или 11 человек), и на выборы ходят десятками, и
партию выбирают десятками? Что это за чудеса? Может быть стоит
объяснять это по-другому, попроще? Может быть, рисуя "из головы"
табличку с двумя дюжинами чисел, люди вольно или невольно округляют
их до десятка или пятерки?
Читателю должно быть понятно, что таким способом можно заметить лишь самые грубые подделки, те, которые делаются без оглядки на возможные проверки, на какой-либо контроль, в твердой убежденности, что наверху «схавают» всё - лишь бы был приятный результат. Создается впечатление, что в некоторых местах выборов не было вообще, а результаты просто рисовали в протоколах круглыми числами, не утруждая себя даже и процедурами подсчета бюллетеней.
3. Регионы и тенденции
Точно такой же анализ можно сделать и по всем регионам России. У каждого из 85 получится свое значение вероятности: от совершенно неправдоподобной, как в Дагестане, до вполне разумной, как в Орловской области, где вычисленная по χ2 вероятность более 80%.
Теперь можно последовательно выключать из подсчетов результата голосования регионы, в которых вероятность, вычисленная по χ2, слишком мала, и смотреть на итоги. Ведь если преобладание нулей и недостаток единиц и девяток есть результат лишь маленького, простого и невинного округления, то на явке и результатах голосования это не должно сказаться, не правда ли? Действительно, пусть кто-то простодушно округлил 739 до 740. Мелочишка - всего 1500 голосов на весь полуторамиллионый Дагестан, 0,1%. А кто-то округлил 741 до 740 - так что и это скомпенсировалось. Может быть мы зря "ловим блох"?
Но проверим и это объяснение, и вот что тогда увидим (явка здесь рассчитывалась по отношению числа действительных бюллетеней к списочному составу избирателей, а процент ЕР по отношению голосов ЕР к числу выданных бюллетеней).
Здесь каждой точке соответствуют итоги
голосования по таким регионам, в которых достоверность результатов
не ниже указанной на оси х. (На поле графика стрелками указано
число избирателей, получивших бюллетени в каждой категории, в
миллионах).
Оказывается, что результат голосования все же
зависит уровня достоверности, и при этом вполне отчетливо: чем выше
достоверность, тем ниже явка и хуже результат одной из партий.
Точки на левом краю графика дают явку и результат ЕР,
представленный ЦИК. Но если последовательно отбрасывать наименее
правдоподобные результаты, то значения упорно снижаются. При
достоверности уже чуть большей, чем 1%, результат ЕР падает
ниже 50%, при этом остается учтенным почти 39% всех активных
избирателей. Остальные 60% с лишним (а значит мнение почти 40
миллионов граждан России) бессмысленно и беспощадно испорчены
посторонним вмешательством.
Но если такая зависимость есть, то тогда мы все же сможем ответить и на вопрос, который был задан в самом начале: «КТО, КАК, КОГДА, ЗАЧЕМ и НАСКОЛЬКО вмешивался и корректировал результаты?».
КТО: региональные и местные власти. КАК: переписыванием или прямым «сочинением» результатов. КОГДА: при подготовке протоколов. ЗАЧЕМ: чтобы обеспечить цифры, которые понравятся «вертикали власти». НАСКОЛЬКО: настолько, чтобы вывести результат, нужный «вертикали», на требуемый ею уровень.
А теперь попробуем предсказать совсем
уже близкое будущее: выборы 4.03.2012. Для этого точно тем же
методом подсчитаем достоверность прошлых Российских выборов,
результаты которых нам доступны. Это выборы в Госдуму (2003, 2007 и
2011 годы) и пара президентских выборов: (2004 и 2008 годы). Тогда
увидим следующее:
Прогнозная точка внизу справа для предстоящих
президентских выборов находится еще не «в Дагестане» (там логарифм
больше 200), но неуклонно приближается к нему. Последний график,
конечно, почти шутка: слишком мало точек. Но только почти…
Заключительные вопросы вместо
выводов
Есть три вопроса, которые нужно задать не друг другу, а г-ну В.Чурову.
1. Почему такой, или более сложный анализ, не делает он и люди его ведомства?
2. Почему ЦИК не посылает строгие инспекции в регионы, в которых достоверность результатов падает до умопомрачительно малых величин?
3.Чем занят Центризбирком и его аппарат, которым именно за организацию честных выборов, а в первую очередь честного подсчета голосов, налогоплательщики платят немалые деньги?