сряда, 22 октомври 2014 г.

Особености на предизборното прогнозиране в България

Изборните резултати са известни и докато партиите се пазарят за бъдещото управление е време да погледнем назад и да анализираме как се справиха нашите прогнози и проучванията на обшественото мнение, на които те са базирани.

С две думи, не много добре (ок, с три думи). От една страна, нашите предвиждания посочиха правилно партиите, които преминаха 4-процентовата бариера, което е може би най-важният резултат от изборите. От друга страна, обаче, за някои определени партии разликите между прогнозните и реалните резултати са много, много големи. Освен това, няколко индивидуални проучвания на обществените нагласи се представят по-добре от нашата прогноза, която агрегира всички проучвания. Всичко това води до интересни изводи за измерването на политическите нагласи в България и до важни уроци за бъдещите ни усилия в прогнозирането на изборните резултати.




За начало, ето графика, която сравнява последната редакция на нашите предвиждания от 3 октомври (черни точки и интервали) и резултатите от изборите на 5 октомври (червени точки). Процентът гласове за поне четири партии и коалиции драстично се различава от прогнозите - Герб, БСП, Реформаторския блок (РБ) и Патриотичния фронт (ПФ). Нашият модел значително надценява подкрепата за БСП и Герб и подценява тази за РБ и ПФ. Отклоненията са извън границите на доверителни интервали, което не е добре. Но преди да се впуснем в детайлите, нека видим общата картина.

Цялата абсолютна грешка на БГ Пулс (нашият агрегатор) е 14.12 процентни пункта (за 8-те партии). Този резултат бие повечето индивидуални прогнози (някои от които имат грешки от порядъка на 24 процентни пункта!), Но последните три проучвания публикувани преди изборите (на Галъп, Алфа Рисърч и АФИС) имат по-малка абсолютна грешка (12.14, 12.94 и 12.62 съответно), макар и разликите с БГ Пулс да са нищожни. Като цяло, прогнозата на Галъп, която бе и последната публикувана, е сравнително най-точна. Но дори и тя е далеч, далеч от истината, като резултатите за няколко партии са извън 'доверителните' интервали, което не би трябвало да се случва.



Графиката горе показва средната абсолютна грешка на прогнозите според датата на проучването. Очевидно, колкото повече се приближаваме към изборите, толкова по-точни стават те. Тенденцията не е неочаквана, но степенттта, до която по-старите прогнози са далеч от истинските резултати, е. Всъщност, прогнозите отпреди 23 септември са толкова зле и толкова систематично зле, че заблуждават и нашия агрегатор.

На какво да се дължи тази тендинция? Едно възможно обяснение би било, че предизборната кампания значително е променила политическите настроения в страната между края на август и датата на изборите. Превдид изключително вялата кампания, а и изказванията на самите изследователски агенции, че кампания почти липсва, тази интерпретация е изключително трудно да се приеме. Но фактът, че прогнозите от последната седмица са значително по-точни остава.

Урокът за нашия модел и агрегатор БГ Пулс е, че на данните от прогнози проведени по-близо до изборният ден трябва да се дава по-голяма тежест, отколкото на по-старите, дори и когато става въпрос за разлика от дни.  



Ако се фокусираме върху резултатите за конкретни партии, картината е следната. Резултатът за Герб е доста по-нисък от нашата прогноза - 32.67 вместо 35.3 и извън доверителния интервал (33.7-36.6). Но всички прогнози след 20 август надценяват, по-малко или повече, резултата на Герб! Сова Харис от 23 Септември (датите са от средния ден на проучването, а не датата на публикуването му) дава 37% за тази партия, а ИМП няколко дни по-късно 35%! Последните три проучвания са по-близо да целта, на все още 'отгоре' (между 33.5% и 34.1%). За сега, агрегаторът БГ Пулс може да коригира систематични изкривявания от различните изследователски агенции, но предпоставката е, че средната грешка на всички агенции е (като цяло) нула, т.е. грешките на различните агенции се компенсират. Когато всички агенции грешат в една и съша посока, ни трябва друг модел. Лошото е, че преди реалните резултати да станат известни, не може да знаем, с какъв тип грешка трябва да се справим.



Най-неточни се оказаха прогнозите за БСП и коалиция. Всички агенции без изключение надценяват резултата за тази партия, повечето с повече от  5%, а някои с повече от 7%. Грешки от порядъка на 5% са извън 95%-те доверителни интервали и би трябвало да се случват изключително рядко. За жалост това не е така. Тука е момента да подчертаем, че доверителните интервали предоставани от агенциите, базирани само на извадкова грешка, за този тип резултата са неверни и подвеждащи (и не само, защото изборните резултати ги опровергаха). Тези интервали оценяват несигурността относно подкрепата за дадена партия в обществото, а не на изборната прогноза, която е производна на два факта - (1) колко хора подкрепят дадена партия  и (2) колко от тях ще гласуват. Затова Сова Харис може да прогнозира 25% (резултат на БСП е 15.4%) две седмици преди изборите - разлика, която е толкова голяма, че формално не би трябвало да се случи и за милиони избори, ако се гледа само извадковата грешка на изследването.

Урокът за нашия модел е, че несигурността около всяка прогноза трябва драстично да се увеличи, което няма да направи графиките по-красиви, но може да направи предвижданията по-валидни.






Предвижданията ни за ДПС са почти точно в целта, но вотът за тази партия е традиционно предвидим. Не стоят така нещата с Реформаторския блок. Резултатът от 8.89% е повече от 2.5% по-висок от предвидените от БГ Пулс 6.3% и извън доверителният интервал. Въпреки това, нашата прогноза е по-близо до резултата от всички индивидуални проучвания, с изключение на две. На всичкото отгоре, всички проучвания грешат в една и съща посока - подценяване на резултата на Блока. Много сходни са нещата с Патриотичния фронт - сравнително големи грешки от порядъка на 2-3% и всички грешки в една посока - подценяване. Интересно е да се отбележи, че по отношение на тези две партии последните три проучвания не са особено по-точни от другите.





Предвижданията за България без цензура, АБВ и Атака са сравнително по-успешни. БГ Пулс е много близо до крайните резултати за тези партии, и доста по-добре от мнозинството индивидуални проучвания. Но в тези случаи индивидуалните грешки са в двете посоки, което позвялява силата на агрегатора да се изяви.

Трудно е  да се избере една причина, на която да се отдаде слабостта на предизборните прогнози за октомврийските парламентарни избори 2014 в България. Изключително ниската избирателна активност е една възможност. Но пък тя изглежда добре прогнозирна. Галъп прогнозира 3 400 000 гласуващи, което не е твърде далеч от 3 283 192-те реализирани гласа. Алфа Рисърч дава между 3.2 и 3.3 милиона, което е точно в целта. Предвиждането на АФИС между 3.4 милиона и 3.7 милиона също е сравнително близо.

Слаба мобилизация на потенциалните избиратели на двата най-големи политически субекта и сравнително силна мобилизация за по-малките може да обясни големите грешки на проучванията. Така дори и изследователите да имат добра представа за потенциалния брой избиратели на малките партии, това не може да се превърне в добра прогноза за процента гласове от всички валидни такива, които те ще получат. Тази интерпретация е по-вероятна от прехвърляне на гласове от по-големите към по-малките партии в последния момент.

За съжаление, няма ясно решение, как могат да се подобрят предизборните прогнози предвид на явно огромната несигурност около това колко хора ще гласуват (в допълнение на тази, коя партия ше подкрепят). Със сигурност, обаче, тази несигурност трябва да рефлектира в цифрите, които агенциите предоставят като измервания и прогнози. Иначе обществото се заблуждава, че изборните резултати са по-ясни и предвидими отколкото те де факто са.

Съшо така, би било добре изследователските агенции да публикуват не само прогнозите си, но и повече информация за първичните данни, на които те са базирани, за да можем сами да моделираме вероятния вот предвид отделните политически нагалси в обществото (подкрепа за отделните партиите и вероятност за гласуване в изборния ден).

Няма коментари:

Публикуване на коментар