У дома Данни на Guide-Bulgaria.com Използване на алгоритми за прогнозиране на избори: чат с изтеглена лайнер

Използване на алгоритми за прогнозиране на избори: чат с изтеглена лайнер

Anonim

Дрю ще се представя на срещата на върха за големи данни за 30 и 31 януари в Лас Вегас: http://analytics.theiegroup.com/bigdata-lasvegas, заедно с говорители от Обама за Америка, Best Buy, LinkedIn, The New York Times, Nokia, Bitly, Barnes & Nobles, Walmart Labs и много други.


Връзка за регистрация: http://bit.ly/Zs3wms


Това интервю беше проведено от Джордж Хил и публикувано в списанието Big Data Innovation Magazine.


Каква реакция имаше към вашите прогнози?


По-голямата част от реакцията се фокусира върху разликата в точността между онези от нас, които изследваха проучванията на общественото мнение, и прогнозите за „усещане на червата“ на популярните фенове и коментатори. В деня на изборите анализатори на данни като мен, Нейт Силвър (блогът на New York Times FiveThirtyEight), Саймън Джакман (Университета в Станфорд и Хъфингтън Поуст) и Сам Уанг (Изборният консорциум в Принстън) поставиха шансовете за преизбиране на Обама на над 90% и правилно предвидиха 332 избирателни гласа за Обама като най-вероятният резултат. Междувременно специалисти като Карл Роув, Джордж Уил и Стив Форбс заявиха, че Ромни ще спечели - а в някои случаи и лесно. Това доведе до разговори за „победа за квантите“, която се надявам да пренесе към бъдещи избори.


Как оценявате алгоритъма, използван при вашите прогнози?


Моят прогнозен модел оценяваше резултатите от гласуването на държавата и окончателния вот на изборите на всеки ден от кампанията, започваща през юни. Исках оценката на тези прогнози да бъде възможно най-справедлива и обективна - и да не ми оставя никакво помещение, ако грешат. И така, около месец преди изборите публикувах на уебсайта си набор от осем критерия за оценка, които бих използвал, след като резултатите са били известни. Както се оказа, моделът работеше перфектно. През лятото прогнозираха, че Обама ще спечели всичките си държави през 2008 г. минус Индиана и Северна Каролина и едва не се отдръпна от това прогнозиране, дори след като подкрепата за Обама се повиши през септември, след което изчезна след първия президентски дебат.


Обемът на данните, използвани през тази кампания както от независими анализатори, така и от екипи на кампаниите, е огромен, какви последствия има това за използването на данни през 2016 г.?


Кампанията за 2012 г. доказа, че множество, разнообразни източници на количествена информация могат да бъдат управлявани, доверени и прилагани успешно за различни цели. Ние, аутсайдерите, успяхме да предвидим крайния резултат преди изборите. В рамките на кампаниите бяха постигнати огромни крачки в насочването на избиратели, проследяването на общественото мнение, набирането на средства и избирателната активност. Сега, когато знаем, че тези методи могат да работят, мисля, че няма връщане назад. Очаквам репортери и коментатори на кампаниите да вземат много по-сериозно събирането на проучвания през 2016 г. И въпреки че изглежда, че Обама и демократите в момента притежават предимство в технологията на кампанията, бих се изненадал, ако републиканците не се настигнат бързо.


Смятате ли, че успехът на тази кампания, ориентирана към данни, означава ли, че сега мениджърите на кампании трябва да бъдат аналитик и стратег?


Възможно е мениджърите на кампаниите да не се нуждаят сами да бъдат анализатори, но те трябва да оценят по-добре как данните и технологиите могат да бъдат използвани в тяхна полза. Кампаниите винаги са използвали проучвания за проучване, за да формулират стратегия и да измерват настроението на избирателите. Но сега са налични редица други мощни инструменти: уебсайтове за социални мрежи, бази данни за избиратели, мобилни смартфони и имейл маркетинг, за да назовем само няколко. И това е в допълнение към скорошния напредък в методологиите за проучване и статистическото моделиране на мнението. В момента в политиката на американската кампания се случват много иновации.


Успяхте да прогнозирате резултатите от изборите 6 месеца преди това, каква според вас е реалистичната максимална времева рамка за точно прогнозиране на резултат, използвайки вашите техники за анализ?


Около четири или пет месеца е приблизително толкова назад, колкото науката ни позволява да отидем в момента; и това дори го натиска малко. Преди това анкетите просто не са достатъчно информирани за евентуалния резултат: твърде много хора са или не са решили или не са започнали да обръщат внимание на кампанията. Историческите икономически и политически фактори, за които е доказано, че корелират с резултатите от изборите, също започват да губят своята прогнозна сила, след като достигнем приблизително 4-5 месечния диапазон. За щастие, това все още дава достатъчно време на кампаниите да изготвят стратегия и да вземат решения за това как да разпределят ресурсите си.

Използване на алгоритми за прогнозиране на избори: чат с изтеглена лайнер