Использование персональных данных в США для получения голосов избирателей на самом деле старая технология. Уже в 1980-е годы сотрудники предвыборных штабов заводили картотеки. Они были заведены на всех избирателей района и сортировались в зависимости от того, готов человек проголосовать за кандидата или еще не решил.
В агитационной кампании самая важная информация об избирателе – это данные о его регистрации, содержащиеся в открытом доступе, и готовность сделать взнос на избирательную кампанию. Данные о подписке на прессу, модели телефона или марке автомобиля могут дополнить картину. Сведения, которые сами избиратели не раскрывают, представители предвыборного штаба покупают. Не один год некоммерческие организации и местные отделения демократов и республиканцев в США создавали по всей стране базы данных избирателей. В отделении Демократической партии в штате Айова, например, собрали информацию обо всех своих избирателях на единой платформе, которую назвали «The Van». За взнос в размере от 75 тысяч долларов можно получить доступ к данным о регистрации избирателей, их участии в предыдущих выборах или политических предпочтениях. За такой информацией следят, чтобы определить степень лояльности к партии.
Между тем политикам, чтобы найти более личную информацию об избирателях, часто приходится выложить довольно крупную сумму. Существует много способов, позволяющих коммерческим компаниям, например издательским домам, обойти прописанные в договоре с клиентом обязательства не передавать его персональные данные третьей стороне. В таком случае компании могут продать эту информацию участникам предвыборного штаба. Например, когда читатель оформляет подписку на The New York Times, то подписывает договор, где закреплены условия обслуживания. В какой-то момент The New York Times просит подписчика поучаствовать в опросе о качестве их продуктов и услуг, и здесь могут быть другие условия обслуживания, а потом издатели газеты просто продают эти данные. По сведениям некоторых экспертов, двенадцать лет назад политики платили до 150 тысяч долларов в месяц, чтобы поучить доступ к постоянно обновляющейся базе клиентской информации, сегодня цена такой информации намного выше.137
В США с численностью избирателей более 230 млн в предвыборных кампаниях используется много баз данных, в некоторых из них около 4000-5000 элементов на каждого человека, соотнесенные с домашним адресом и телефонным номером. Рядом с именем человека будет возраст, пол, работа, какой журнал он читает, какие у него есть хобби, какой гольф-клуб посещает, к какой церкви принадлежит, какую еду ест, в какой социальной сети сидит.
В Европе законодательная среда обычно сводится к принципу opt in (пользователь указывает, какие данные о нем можно использовать сторонним лицам), а в США эта система устроена по принципу opt out (данные становятся доступны для кампаний, если пользователь не отметил, что их нельзя использовать). Можно купить или получить лицензию на базы данных у агрегаторов информации, которые аккумулируют сведения кредитных картах, карт лояльности супермаркетов, продажи билетов, из социальных сетей, церковных списков и др. Базы данных формируются различными способами: общедоступные бесплатные сведения, телефонный опрос, сделки по обмену сведениями, получение лицензии дата-центров на использование информации с определенной ценой за 1000 записей. Цена может быть $10, $20, $30 за каждую тысячу.
На самом деле на протяжении десятилетий кампании применяли и совершенствовали методы сбора данных, рассматривая религиозную принадлежность, привычки, покупки, демографические черты, истории голосования, достижения в образовании, подписки на журналы и т.п. Начиная с рубежа веков, на нескольких избирательных циклах республиканцы имели преимущество, создавая базу данных под названием Voter Vault, которая позволяла партийным работникам понимать избирателей все более и более тонко. Например, во время президентской кампании 2004 года команда Буша опросила большую выборку этих избирателей для оценки их отношения и поведения и рассортировала их по тридцати группам, каждая из которых имела свои интересы, образ жизни, идеологию.
На выборах 2008 году, когда выдвигался Барак Обама на первой срок, преимущество в области «микрозахвата» аудитории переместилось к демократам, которые разработали свою собственную базу данных избирателей под названием VoteBuilder. Работу по созданию базы вел Демократический национальный комитет, а также команды, поддерживающие кандидатов партии. В итоге была сформирована национальная база данных численностью 240 млн человек, сведения о которых были взяты из переписи населения и других публичных записей, включая коммерческие сведения, данные о закупках и инвестициях, внесении пожертвований, профессиональной информации, а также хобби. На президентских выборах 2012 года шансы Барака Обамы быть избранным на второй срок оказались под большим вопросом. Многих американцев не устраивало то, что страна слишком медленно восстанавливается после экономического кризиса – самого тяжелого со времен Великой депрессии 1930-х годов.
По мнению многих экспертов, Барак Обама победил на выборах президента в 2012 году благодаря неординарной кампании, основанной на сборе личных данных избирателей. Многие аналитики в Вашингтоне и по всей стране уверены: своей победой на выборах президент Обама во многом обязан главе предвыборного штаба Джиму Мессине, который на системной основе собирал массивы данных об избирателях. Целью Мессины был поиск, архивирование и упорядочивание любой доступной информации о потенциальных сторонниках Барака Обамы, чтобы получить от них пожертвования на президентскую кампанию, а впоследствии – и голос на выборах. Уже через пару месяцев команда Обамы собрала около 800 единиц информации о каждом избирателе. Джим Мессина достиг новых высот в своей стратегии «микротаргетирования» избирателей, которой занимался на тот момент уже десять лет.
В 2008 и 2012 годах у демократов также были более сложные модели, предсказывающие, как люди с определенными атрибутами могут голосовать. В жизни потенциального избирателя Обамы не было практически ничего, что могло бы скрыться от целеустремленного политменеджера. Какие журналы человек читает, каким смартфоном пользуется, в какую церковь ходит, какой у него автомобиль. Даже посты в Facebook и Twitter изучались на предмет политических предпочтений. «Собрав большое число единиц информации о конкретном человеке, вы начинаете составлять его профиль, – объясняет Хёрб Ашер, почетный профессор Университета штата Огайо и эксперт по избирательным кампаниям. – Вы начинаете делать вероятностные суждения». Если человек ходит в фундаменталистскую церковь, читает консервативные новостные журналы и является членом Национальной ассоциации стрелков, очень вероятно, что на выборах он проголосует за консервативного кандидата, объясняет эксперт. Хёрб Ашер констатирует: «Никакого личного пространства больше не существует».138
С помощью сложных алгоритмов сотрудники американских предвыборных штабов берут большие объемы данных и используют социальные сети и локализованную телевизионную рекламу, чтобы посылать индивидуальные сигналы конкретному избирателю. На президентских выборах 2016 года эта стратегия нашла более широкое применение. Мессина помогал вести избирательную кампанию потенциальному кандидату в президенты от Демократической партии Хиллари Клинтон. Американские политтехнологи сделали ставку на большие данные, формируемые путем сбора персональных сведений об избирателях.
В штаб-квартире кампании Хиллари Клинтон было несколько головных офисов, которые возглавляли руководитель кампании Робби Мук, председатель кампании Джон Подеста и доверенное лицо кандидата Хума Абидин. «Цифровым офисом» руководил Элан Кригель, директор по аналитики кампании. Топ-консультанты Клинтона редко принимали решения в главном офисе в Бруклине без предварительной консультации с Кригелем. Он был одним из ее первых нанятых специалистов, оставаясь практически неизвестным за пределами закрытого сообщества политических консультантов. По некоторым сведениям, он относился к числу самых высокооплачиваемых менеджеров кампании. Его «цифровая команда» состояла из более 60 математиков и аналитиков, представляя собой своего рода «центральную нервную систему кампании». Кригель построил аналитическую команду Клинтон на основе специалистов из своей компании BlueLabs, которая выделилась из компании Civis Analytics главного аналитического советника Обамы Дэна Вагнера.
Подразделение Клигеля формировало статистические модели кампании, занималось медиа-планированием, производило оперативное распространение информационных месседжей и интерпретировало реакцию избирателей. «Цифровая команда» показала свою эффективность на этапе праймериз, когда были определены приоритетные каналы и форматы коммуникации, штаты для обеспечения голосов делегатов за Клинтон. Некоторые эксперты, рассматривали эти технологии как «секретное оружие в соперничестве с Берни Сандерсом».
Во время праймериз считалось, что Дональд Трамп практически ничего не вкладывал в аналитику больших данных. Тогда как работа группы Кригеля не только стимулировала кампанию Клинтон, но и обеспечила ей решающее тактическое преимущество в избирательной кампании. Это одна из причин, по которым команда Клинтон была уверена в том, что, даже если предвыборная гонка станет напряженной, то до ноября она сохранит технологического превосходство. Целевые контакты с избирателями достигнут лучших и самых восприимчивых аудиторий.
По образному сравнению стратега кампании Робби Мука, «самолет Клинтон почти никогда не взлетает без данных Кригеля, начертавшего приоритетные направления». Робби Мук считал аналитические данные Кригеля «невидимой направляющей рукой» кампании.
Однако внутри команды Клинтон сильное влияние Кригеля было источником трений. Клинтон поручила провести исследования, чтобы оценить эффективность различных методов распространения информации среди избирателей – телевидение, радио, прямая рассылка, онлайн реклама, веб-видео, телефонные звонки и т.д. Выводы часто шли вразрез с коммерческими выгодами медийных групп интересов.
Аналитическая группа Кригеля разрабатывала методики работы в социальных сетях. Старалась оперативно отвечать на коммуникативные вопросы: с кем, как, что, когда говорить. Она определяла лучшее время для контакта с избирателями. Этот вопрос, который имел решающее значение для мобилизации избирателей в 2012 году, никогда не анализировался. Имея полный календарь конкурентных праймериз, Кригель и его команда провели целый ряд экспериментов с контрольными группами, чтобы выведать ответы на такие вопросы. Руководитель кампании Робби Мук называл исследования Кригеля «новаторской работой, которая позволяет понять, какие каналы наиболее эффективны при мотивировании и убеждении разных групп избирателей». Стратег команды Клинтон был убежден, что «нельзя выиграть выборы из-за больших данных, но кампанию можно провести более эффективно, обладая большими данными. Клинтон должна каждый день выходить и делать свое дело».139
Алгоритм работы группы Кригеля исходит из определения проблемных точек. Кампания охватывает каждый округ по выдвижению в Конгресс. В каждом округе имеется разное количество делегатов, распределенных пропорционально. Для моделирования ожидаемого уровня поддержки Клинтон нужно было провести опрос и определить насколько близка Клинтон к порогу победы. В «шатких» округах прилагались наибольшие медийные усилия, чтобы поднять рейтинг кандидата. По вероятности, агитация там может переманить делегата на сторону Клинтон. Далее определялись оптимальные каналы коммуникации с неопределившимися избирателями. Каждый телевизионный рынок достигает разного количества избирателей в разных районах. Однако в проблемных штатах, которые Клинтон выиграла, алгоритм Кригеля приводил к большим расходам на медиа.
Например, покупка рекламы в Техасе, основанная на моделировании Кригеля, показывает, как медиа-бюджет Клинтон «охотился» за делегатами, а не за голосами избирателей. Техас – особенный штат, в котором существуют законодательные округа штата для выдвижения делегатов. Клинтон потратила 1,2 миллиона долларов на рекламные объявления. Сандерс потратил $ 0. Она потратила больше на рекламу в крошечном Браунсвилле ($ 127 000) и Вако ($ 142 000), чем в многомиллионном Хьюстоне ($ 105 000). Но это окупилось: в одном только Техасе Клинтон заработала на 72 делегата больше, чем Сандерс, – маржа, которая более чем компенсировала затраты.
В избирательной кампании Хиллари Клинтон опиралась на наследие первого президента социальных сетей Барака Обамы. Ее команда имела списки адресов Демократической партии, собирала миллионы долларов в сети, получала технологическую поддержку от Google.
3 ноября 2016 года за несколько дней до дня голосования Джим Мессина, который руководил переизбранием президента Барака Обамы в 2012 году, опубликовал в «Нью-Йорк таймс» статью, в которой сделал вывод: «Когда мы переходим в последние дни избирательного цикла 2016 года, «умные деньги» находятся в кампании миссис Клинтон, которая использует силу больших данных, чтобы найти, возможно, последний голос». Кампания Трампа, заявил Мессина, не делала этого.
Мессина также обозначил, что «большие данные» были устаревшей технологией, а будущее политической агитации зависит от того, что он назвал «небольшими данными»: «Огромные объемы данных часто менее полезны для понимания электората, чем один или два ключевых пункта – например, какой вопрос наиболее важен для конкретного неопределившегося избирателя».140
Трамп называл большие данные «переоцененным» активом и относился к ним скептически. Изначально цифровая кампания Трампа состояла из одного человека: Брэда Парскаля – «маркетолога и неудачного стартап-основателя, который продвигал Трампа на веб-сайте за 1500 долларов». Однако после того как Трамп гарантировал себе выдвижение в президенты от Республиканской партии, Джарат Кушнер зять Трампа вместе с Брэдом Парскалем начали амбициозную цифровую операцию, которую они окрестили «Проект Аламо». Кушнер подключил людей из Силиконовой Долины, негласных поклонников Трампа, экспертов по цифровому маркетингу. В итоге база данных «Проекта Аламо» начала определять политическую стратегию Трампа и маршруты его агитационных поездок.
Издание Bloomberg так запечатлела деятельность «цифровой команды»: «В святая святых кампании Трампа, компьютерном центре, работает больше сотни человек: от европейских специалистов по обработке данных до пожилых волонтеров из call-центра. Несмотря на высказывания Трампа, будто он не верит результатам опросов, его команда тратит $100 тысяч в неделю на соцопросы и использует сложные модели, имитирующие день выборов. Результаты показывают то же самое, что и другие прогнозы – Трамп проигрывает Клинтон. В отличие от организаторов классических соцопросов, «цифровые гуру» Трампа получают результаты очень быстро. И вычисляют, на кого именно направить свои усилия. Так 13,5 млн избирателей в 16 штатах попали в категорию «не определившихся, но убеждаемых».141
Сотрудники центра Трампа утверждали, что им удалось вычленить избирателей, которые просто не хотят признаваться в поддержке Трампа и потому отказываются участвовать в опросах. Команда Трампа построила специальную модель «Battleground Optimizer Path to Victory», чтобы постоянно следить за ситуацией в штатах, данные по которым говорят об их критической важности для получения победных 270 голосов выборщиков.
На три целевые группы потенциального электората Хиллари Клинтон вели адресные атаки: белые либералы-идеалисты, молодые женщины и афроамериканцы. На первых должен был оказать влияние скандал с электронной перепиской Клинтон, на вторых — череда свидетельниц, обвинявших Билла Клинтона в сексуальных домогательствах, на третьих — подчеркивание фразы Клинтон 1996 года, когда она назвала афроамериканских мужчин «суперхищниками».
Команда Трампа приложила усилия, чтобы отвратить от Клинтон женщин и афроамериканцев, живущих в квартале Литтл-Гаити в Майами: им адресно рассылали сообщения о сомнительных операциях Фонда Клинтон на Гаити. Обычно политики во время предвыборных кампаний тратят миллионы, чтобы понять интересы собственных потенциальных избирателей, но Трамп в данном случае обращался к избирателям оппонентки.
Вместе с тем огромные средства расходовались и на мотивацию активных сторонников Дональда Трампа, большую часть которых удалось определить, благодаря Facebook. Ближе ко дню выборов команда Трампа рассчитывала получить 12-14 миллионов адресов электронной почты и другую контактную информацию (включая данные кредитных карт) людей, делающих небольшие пожертвования на президентскую кампанию республиканца.
«Если вы открываете бургерную, людям надо объяснить, что ваши бургеры хороши, и заставить их прийти в заведение, – говорил источник, близкий к Трампу. – Примерно тоже самое обстоит с выборами: вы должны узнать, что нужно людям, а потом убедить их: ваш продукт — самый лучший». Интернет-кампания Трампа была, среди прочего, направлена на то, чтобы отследить избирателей, которым уже понравились его «бургеры», и убедить их «купить больше».142
Брэд Парскаль начал экспериментировать с базой данных избирателей, которую он купил у беспартийного продавца, чтобы узнать, кто выступает за Трампа. Большинство данных поступило из заявок на билеты на предвыборные митинги. Затем Парскаль создал свою систему, которая требовала от сторонников, покупающих билеты, подтверждения по мобильному телефону – так в распоряжении Парскаля оказались и телефонные номера.
Парскалю выделили деньги, чтобы расширить эту базу, и он решил все потратить на Facebook. Он разработал модели, которые соотносят имена избирателей с их профилями в социальной сети, вычленяют их друзей с похожими интересами. Брэд вложил в рекламу для этой аудитории $2 млн. Также он использовал аналитический инструмент Brand Lift, с помощью которого оценивают эффективность рекламных стратегий, и следил, как и кто из пользователей реагирует на ролики с Трампом или в его поддержку (можно определить пол, возраст, и другие характеристики зрителей). «Меня всегда удивляло, что люди из политики относятся к этим технологиям как к чему-то мистическому, – говорил Парскаль, – а это обычные инструменты, которые используют в коммерческой сфере».
Глава РНК Райнс Прибус рассказывал, что с 2012 года вложил более $100 млн в базы данных избирателей и электронную инфраструктуру партии. Работой с электронными почтовыми адресами 6 миллионов сторонников республиканцев в США занимался отдел из дюжины человек. Чтобы тоже получить доступ к этим данным, Трамп провел с РНК отдельные переговоры о партнерстве. Условия оказались жесткими. Республиканская партия намерена была оставлять себе 80% средств при их сборе через свои базы, отдавая лишь 20-процентный остаток на кампанию кандидата.
В июне 2016 года команда Трампа разослала по базе первое электронное письмо с предложением пожертвовать денег, 60 % этих сообщений оказались у пользователей в папке «Спам». Тем не менее за первые две недели удалось собрать $40 млн. Тогда Парскаль использовал и расширил собственный список сторонников Трампа. Он бомбардировал их сообщениями на Facebook, покупал новые почтовые базы потенциальных сторонников – например, поклонников известнейшего республиканца Ньюта Грингича. Ссылки в сообщениях вели прямо на страницу для пожертвований, или – посредством кнопок с надписями: «Будь с Трампом», «Поддержи Трампа» – на страницу, где пользователя просили оставить контактные данные. Из 100 000 вариантов «трамповского» контента, запущенного в сеть, были выбраны самые эффективные послания, с их создателями Парскаль и продолжил работать. В итоге труды подразделения Брэда Парскаля не только окупились – стали крупнейшим источником дохода для кампании Трампа.143
После прохождения этапа праймериз отношение Трампа к большим данным изменилось. Он усилил цифровое подразделение компанией Cambridge Analytica, которая работала с его соперником по партии Тедом Крузом. В состав совета директоров Cambridge Analytica входит Стив Бэннон,144 начальник избирательного штаба Трампа.145 Скорее всего, именно это обстоятельство, а не работа с Тедом Крузом, обеспечило лондонской фирме доступ к Дональду Трампу.
Компания Cambridge Analytica была образованна в 2013 году. Она специализируется на технологиях применения массивов данных в PR и политике. Компания входит в британский холдинг SCL Group. Cambridge Analytica, который финансировал американский миллиардер Роберт Мерсер, бывший инженер и программист, в последнее время он известен как активный спонсор и организатор политических кампаний.146 По другим источникам, Роберт Мерсер фигурирует в качестве владельца компании.147
По итогам расследования журнал «Das Magazin» сделал заключение, что «новейшие технологии, которые собирают исчерпывающую информацию о каждом человеке – от цвета кожи до сексуальной ориентации – помогли республиканцу Дональду Трампу одержать победу на выборах президента США и обеспечили результат на референдуме о выходе Великобритании из Евросоюза».148 По словам журналистов издания «Das Magazin» Грассеггера и Крогеруса, Cambridge Analytica использовала психологические данные, собранные в Facebook, в сочетании с огромным количеством информации о потребителях, приобретенной у компаний по созданию баз данных, для разработки алгоритмов, которые якобы могли идентифицировать психологические особенности каждого избирателя в американском электорате. Позже компания разработала политические сообщения, адаптированные к эмоциям каждого из них.
Главное, чем занимается Cambridge Analytica – применение метода психологического таргетирования в соцсетях. Его суть заключается в том, чтобы сначала собрать как можно больше данных о пользователях, а затем, анализируя психологический склад каждого из них, выдавать им таргетированную рекламу.
Технологии Cambridge Analytica имеют научные основания в исследовании больших данных. Большие данные также означают, что все, что пользователи делают, будь то в социальной сети или вне ее, оставляет «цифровые следы». Каждая покупка с картой, каждый запрос Google, каждое движение с телефоном в кармане сохраняется.
Психометрия, иногда называемая психографией, является научной попыткой измерить личность человека. В современной психологии стандартным стал так называемый «метод океана» (OCEAN – анаграмма пяти измерений на английском языке). В 1980-х годах психологи смогли доказать, что каждая черта человека может быть измерена пятью личностными измерениями «Большая пятерка»: Открытость (как он относится к новому?), Добросовестность (до какой степени он перфекционист?), Экстраверсия (насколько он общительный?), Толерантность (насколько он доброжелателен и открыт к сотрудничеству?) и Невротизм (легко ли вы уязвимы?). На основе этих измерений можно сказать относительно точно, что для человека, с которым приходится иметь дело, важно, какие у него есть потребности и страхи, а также как он будет вести себя. Однако данный метод нельзя назвать универсальным, сложность его использования заключалась в том, что сбор данных необходимо производить в течение длительного времени, так как респонденту нужно заполнить сложный личный вопросник.
Основателем новой «цифровой методики» анализа поведения человека стал Михал Косински. В 2008 году он был принят в Кембриджский университет в Англии в Центре психометрии в Лаборатории Кавендиша, первой в мире психометрической лаборатории. Михал Косински разработал метод для тщательного анализа людей на основе их поведения на Facebook.
Процесс, который Михал Косински разработал за последующие несколько лет, достаточно прост. Во-первых, тестируемый получает список вопросов, онлайн-тест. Из ответов на него ученые вычисляют личные ценности испытуемого. Далее изучают действия испытуемого: лайки и репосты в Facebook, а также его пол, возраст и место жительства. Так исследователи получают информацию. Из простого анализа данных в сети могут получиться необычные выводы. Например, если мужчина подписан на страничку бренда косметики MAC, он с высокой вероятностью является геем. Наоборот, сильный показатель гетеросексуальности – если человек поставил лайк хип-хоп группе Wu-Tang Clan из Нью-Йорка. Поклонник Леди Гаги с высокой долей вероятности экстраверт, а человек, ставящий «нравится» философским постам – интроверт.
Косински и его команда постоянно совершенствовали модели измерения и прогнозирования. В 2012 году Косински доказал, что в среднем из 68 лайков пользователя в Facebook может предсказать, какой у него цвет кожи (с точностью 95%), является ли он геем (вероятность 88%), является ли он демократом или республиканецем (85%). Можно также рассчитать уровень интеллекта, религиозную принадлежность, склонность к алкоголизму, потреблению сигарет и наркотиков. По данным можно выявить, остались ли вместе молодые родители в возрасте до 21 года или нет. Ожидается, что вскоре модель Косински сможет оценить человека лучше, чем коллеги на основе десяти лайков в Facebook. 70 лайков достаточно, чтобы превзойти знание друга, 150 родителей, по 300 лакам машина может предсказать поведение человека. С еще большим количеством лайков знания о респонденте могут превзойти то, что он думает и что знает о себе. В тот день, когда Косински публикует научную работу с этими данными, он получает два звонка: иск и предложение о работе в Facebook.
В настоящее время Facebook делает различие между публичными и частными сообщениями. В «частном» режиме только собственные друзья могут видеть личные сообщения, но это не препятствует сборщикам данных. Косински всегда спрашивал о согласии пользователей Facebook, так как многие онлайн-опросы требуют доступа к конфиденциальным данным в качестве предварительного условия для тестирования личности. Если пользователя не беспокоят собственные данные, и он хочет оценить себя на основе собственных предпочтений на Facebook, то они можете сделать это на странице Kosinski applymagicsauce.com, а затем сравнить результаты с результатами «классической» анкеты Ocean: discovermyprofile.com/ person.html .
Косински и его команда могут оценивать людей по методике «Океана» на основании портретной фотографии. Или по числу контактов пользователя в социальных сетях. Человек также «рассказывает» о себе, когда находимся в автономном режиме. Например, датчик движения показывает, как быстро мы двигаем телефон или как далеко мы путешествуем (коррелируется с эмоциональной нестабильностью). Смартфон, отмечает Косински, представляет собой огромную психологическую анкету, которую мы постоянно и бессознательно заполняем. Модель, которую изобрел Косински, некоторые эксперты квалифицируют как «поисковую систему человека».
Косински все более ясно видит потенциал, но также и опасность своей работы. Это дух целого поколения, начало нового века без пределов физического мира. Но это и средство манипулирования людьми. В своих научных статьях он предупреждает, что его методы могут «угрожать благополучию людей, свободе или даже жизни». Моральные принципы не позволили Косински продолжить сотрудничество с Cambridge Analytica.
В 2014 году Cambridge Analytica в той или иной форме работала на 44 выборах разных уровней в США, но широкую известность получила в 2016 году благодаря кампании Теда Круза. Круз, сенатор-республиканец из Техаса, выдвигался на пост президента вместе с Дональдом Трампом. В начале кампании он считался аутсайдером, однако по ходу праймериз одержал несколько неожиданных побед и в результате оказался главным соперником Трампа. Кампанию спонсировал Роберт Мерсер, и в СМИ появилось множество публикаций о том, что секретное оружие Теда Круза — Cambridge Analytica и успешное применение психологического микротаргетинга.149
В сентябре 2016 года, за несколько недель до президентских выборов, глава Cambridge Analytica Александр Никс выступил с лекцией на технологической конференции Concordia Summit в Нью-Йорке. В презентации Никса успехи Теда Круза объяснялись революционными методами таргетинга, которые успешно применяются в его фирме. По словам Никса, совершенный метод Cambridge Analytica позволил штабу Круза направлять пользователям социальных сетей разные по содержанию рекламные сообщения, в зависимости от их психологических черт. Никс также упомянул, что Cambridge Analytica работает над предвыборной кампанией Дональда Трампа в США.
По словам CEO Cambridge Analytica Александра Никса, компания работала три года, собирая данные к президентским выборам 2016 года. Они разрабатывали модели и тестировали их в 2014 году на 42 кампаниях по всей Америке. Компания работала с двумя кандидатами на первичном этапе президентских выборов. «Помните, данные – это всего лишь ингредиенты. Вы можете пойти в супермаркет и купить там продукты. Но это не означает, что из них у вас получится хорошая еда. Вам нужны лучшие шеф-повара. Поэтому инвестиции в дата-исследователей, которые мы сделали, – это гарантия хорошего продукта. Предположим, что вы даете мне нужные ингредиенты, нужные данные. Есть несколько вещей, которые мы можем сделать. Мы можем помочь понять вашу целевую аудиторию. Если мы вам сможем назвать каждого человека в стране, который, наиболее вероятно, проголосует за вас, то вы можете попросить этих людей, стать донором или поддержать вашу кампанию, быть волонтером. Если мы бы могли вам назвать тех людей, которые вообще никогда не проголосовали за вас, вы бы просто не потратили деньги на коммуникацию с ними. Потом мы также могли бы сказать вам, кто те люди посередине, которые еще не определились. Мы бы рассказали вам, какие сообщения для них были бы самыми действенными, чтобы убедить этих людей проголосовать. Вы можете быть озадачены образованием, а ваша жена – медицинским обслуживанием. И нет никакого смысла присылать сообщение о медицине вам, а ей – об образовании. Нам нужно сформировать наиболее точное сообщение для каждого».150
Cambridge Analytica работает по идентичной процедуре, разработанной Косински модели. Компания также использует IQ-тесты и прочие небольшие приложения, чтобы привлечь внимание пользователей Facebook. Cambridge Analytica во главе с Никсом делает то, от чего предостерегал Косински: «У нас есть психограммы всех совершеннолетних американцев, это 220 млн человек».
На основании научных изысканий Косински Cambridge Analytica разработала модель, которая может определять индивидуальные характеристики практически каждого взрослого в США. Технология маркетинга Cambridge Analytica основана на сочетании трех элементов: психологическом поведенческом анализе в соответствии с «моделью океана», анализе больших данных и таргетинг сообщений. Под таргетингом сообщений понимается персонализированная реклама, которая максимально приближается к характеру и потребностям пользователя.
Cambridge Analytica покупает личную информацию из многих источников: записи в регистре земельных участков, карточки лояльности, списки избирателей, членство в клубе, подписки на журналы, медицинские записи и др. Глобальными дилерами данных обозначены компании Acxiom и Experian. В США практически все личные данные могут быть приобретены. Если заказчик хочет знать, например, где живут еврейские женщины, то он может легко купить эту информацию, включая телефонные номера. Cambridge Analytica пересекает эти номера с избирателями из Республиканской партии и онлайн-данными, такими как Facebook Likes, затем вычисляется профиль личности «методом океана»: цифровые следы становятся настоящими людьми с опасениями, потребностями, интересами и домашним адресом.
Яркие высказывания Трампа, частая критика в его адрес порождали огромное количество разных сообщений и как следствие потоки эмоционально окрашенного контента. Строптивое, неординарное поведение Трампа внезапно оказалось его большим преимуществом, представляя интерес для многих избирателей. «Трамп действует как совершенно оппортунистический алгоритм, который зависит только от реакции аудитории», – отмечала математик Кэти О'Нил в августе 2016 года. В день третьих дебатов между кандидатами команда Трампа отправило 175 000 различных вариаций своих сообщений, прежде всего через Facebook. Сообщения отличались только деталями, чтобы оптимально соответствовать получателям психологически: разные названия, цвета, субтитры, фотографии или видео. Мелкое зерно адаптации сводится к небольшим группам. Одна из целей: потенциальные избиратели Клинтон. Например, в районе Майами выходцам из Гаити вбросили информацию о неудачных действиях Фонда Клинтонов после землетрясения в Гаити, чтобы они стали испытывать неприятие Хиллари. «Темные сообщения», которые покупаются как реклама в Facebook на определенный срок, видят только пользователи с соответствующими профилями. Таким способом видеоролики, в которых Хиллари Клинтон называет чернокожих хищников, доставлялись адресной группе афроамериканцев.
Команда Cambridge Analytica, по сообщениям, составляла только дюжину человек. Она получила около 100 000 долларов от Трампа в июле, 250 000 долларов в августе и 5 миллионов долларов в сентябре. По опубликованным данным, Cambridge Analytica получила около 15 миллионов долларов.
Cambridge Analytica на президентских выборах 2016 года сосредоточила усилия на работе с избирателями в 17 штатах, отслеживая прогресс избирательной кампании в режиме реального времени. Она ежедневно представляла отчеты в течение последних месяцев кампании, используя свежие данные для отслеживания смещения восприятия избирателей. Компания опрашивала 1500 человек в неделю в каждом штате, получив ценную информацию, которая настроила маркетинговую стратегию. Исследование позволило оценить реакцию штатов на все политические события и понять любые неожиданные сдвиги в намерениях голосования. Согласно отчету, привлеченные компанией интервьюеры опросили онлайн и по телефону в общей сложности 180 000 человек в 17 «горячих штатах». Эта информация позволила говорить с избирателями таким образом, чтобы они поняли вопрос и ответили определенно.
На основании науки о данных, используя знания в области статистики и интеллектуальных аналитических материалов, Cambridge Analytica создала 20 пользовательских моделей данных, которые можно было бы использовать для прогнозирования поведения избирателей. Каждый раз, когда человека опрашивали, полученную информацию сопоставляли с существующими данными в созданной базе данных. Анализируя все от своей истории голосования до марки автомобиля, определялось поведение, которое соотносилось с решениями о голосовании. Эти модели позволили предсказывать, как люди будут голосовать – даже если их политические убеждения неизвестны. Избирателей можно разместить в разных категориях и определять лучший способ повлиять на них посредством маркетинга. Технология позволяет определить, какие избиратели могут поддержать Дональда Трампа.
Применяя алгоритмы Cambridge Analytica, ученые-исследователи Трампа построили модель, которую они назвали Path Optimization – Path to Victory (Путь оптимизации – путь к победе). Модель призвана оценивать и взвешивать электоральные состояния, необходимые для получения 270 голосов в избирательных коллегиях выборщиков штатов. Разработанные алгоритмы использовались для ежедневного моделирования выборов. Благодаря этой работе «цифровая команда» выявила 13,5 млн неопределившихся избирателей в 17 «шатких» штатах и разработала выигрышные стратегии.151
После того, как модель оптимизации электората показала, что электорат штатов «ржавого пояса» имели большую склонность голосовать за Трампа, цифровая команда Трампа сосредоточила все свои ресурсы в последние несколько недель на этих избирателях. Включая пребывание самого кандидата в штатах Мичиган, Висконсин и Пенсильванию в дни перед выборами. Кроме того, Cambridge Analytica обнаружила, что предпочтение американским автомобилям является лучшим показателем потенциальных избирателей Трампа. Решение сосредоточиться на Мичигане и Висконсине в последние недели основано на анализе больших данных.
Маркетинговая операция использовала ряд платформ, включая социальные медиа, рекламу в поисковых системах и YouTube. Помимо влияния на намерения избирателей, это вдохновляло людей на конкретные действия. Пожертвования увеличились, события стали расширяться, а неактивные избиратели, которые выступали за Трампа, были мотивированы, чтобы проголосовать за него в день выборов.
Работа Cambridge Analytica информировала о ходе реализации стратегии кампании и означала, что ключевые избиратели, которые могли бы остаться дома, пошли на выборы. Это в конечном итоге способствовало победе Дональда Трампа на президентских выборах 2016 года. Cambridge Analytica обозначает свои конкурентные преимущества: «Мы сделали это за меньшее время, с меньшим количеством людей и с гораздо меньшим бюджетом. Наше упорядоченное, основанное на больших данных, сквозное решение зиждется на науке и постоянном новаторстве».152 Работа Cambridge Analytica в избирательной кампании Трампа является ярким примером того, как методы маркетинга, основанные на данных, могут изменять поведение в целевых группах населения. Применительно к коммерческому сектору эти методы могут стратегически привлекать ключевые аудитории, улучшая коэффициент конверсии и увеличивая продажи.
В ходе выборов в 2016 году кампания Трампа в конечном итоге опиралась на несколько баз данных избирателей: предоставленную Cambridge Analytica, с ее данными на 220 млн американцев и его собственный проект под названием Project Alamo.
«Cambridge Analytica провела работы, ориентированные на анализ больших массивов данных, которые в конечном итоге существенно повлияли на результаты президентских выборов 2016 года. Успех кампании получил признание со стороны многих национальных новостных изданий и получил несколько наград, в том числе взяв золото в 2017 году в категории «Большие данные» в конкурсе фонда «Рекламные исследования». Результаты этой кампании впечатляют: «CA достигла 50 млн пользователей Facebook, создала 1,5 млн показов в Twitter и 3,3 млн на Snapchat, набрала более 28 млн просмотров на цифровых видеороликах и еще миллионы на телевизионной рекламе, направленной на неопределившихся избирателей по всей стране».153 В то время как другие компании следовали за основным повествованием о том, что Хиллари Клинтон с уверенностью выиграет президентство, CA следила за своими собственными данными, которые более точно диагностировали электорат в «горячих штатах», что позволяло чрезвычайно эффективно расходовать рекламный бюджет.
Эффективность своей работы Cambridge Analytica оценивает высоко: коммерческие кампании обеспечивают подъем продаж по сравнению с традиционным маркетингом на 10-25%. Сторонним аудитором был нанят Google, чтобы сделать независимую оценку работы компании. По оценке Google, Cambridge Analytica обеспечила подъем на 11% по сравнению с традиционной рекламой. По информации CEO Cambridge Analytica Александра Никса, в целом в течение кампании Трамп потратил около $120 млн, чтобы вести кампанию в цифровых медиа.154
Косински наблюдал за избирательной кампанией из своей лаборатории в Стэнфорде. После подведения выборов Косински отвечает на события научным анализом. Вместе со своим коллегой-исследователем Сандрой Мац он провел серию тестов. Первоначальные результаты оказались весьма тревожными: психологический таргетинг, используемый Cambridge Analytica, увеличивает ставки кликов в рекламе Facebook более чем на 60%. Коэффициент конверсии, то есть число людей, которые после просмотра персонализированной рекламы действуют соответственно, совершая покупку или просто голосуя, увеличивается на невероятные 1400%.155
Мир изменился. Британцы покидают ЕС, в Америке правит Дональд Трамп. «Нет, - тихо говорит Косински, качая головой, – это не моя вина. Я не создал бомбу. Я просто показал, что она существует».156 Все началось с человека, который действительно хотел предупредить об опасности.
В европейских и американских СМИ вышло множество заметок, критикующих резонансную публикацию журнала «Das Magazin», в которой были обозначены эти показатели. В большинстве подвергались сомнению подсчеты – так, влиятельная швейцарская газета NZZ утверждает, что реальный рост конверсии после применения описанного метода может составлять 60%, но никак не 1400%, причем для разных социальных сетей рост, разумеется, окажется разным.157
Математик Кэти О'Нил в комментарии к Bloomberg, называла технологию Cambridge Analytica «просто больше кетчупа». По ее мнению, психологические черты воздействия на избирателя задействовал в своей кампании каждый кандидат. Секрет кроится в противоречивой натуре Трампа, его беспринципности. От него исходила из «целая прорва различных сообщений, что неожиданно сыграло ему на руку. В августе 2016 года Кэти О’Нил отмечала: «Трамп действует как идеальный оппортунистский алгоритм, который опирается лишь на реакцию публики».158
Коллега Михаила Косински Сандра Мац утверждает, что результаты не получены в ходе эксперимента, из которого вытекали бы показатели, «неприятия голосования» или «изменение позиции». Изначально речь шла об игровых приложениях. Респонденты были экстравертами и интровертами, объединенными в соответствующие группы. Благодаря рекламе в Facebook они могли скачать два вида игр (одна ориентированная на экстравертов, вторая – на интровертов. Приложения были бесплатными, загрузки подсчитывались. Скорость кликов увеличилась до 60%, а коэффициент конверсии – до 1400%.
Некоторые эксперты критиковали доказательную базу журналистов издания «Das Magazin». Их заявление о могущественности метода159 Cambridge Analytica основывается на сведениях, полученных всего из двух источников: от гендиректора самой Cambridge Analytica и от стэнфордского ученого Михала Косински, который считается одним из авторов научного метода. Авторы крупного американского блога The Hill отметили также и то, что среди сторонников Дональда Трампа было особенно много белых американцев без высшего образования – а в этой группе очень много людей, которые вообще не пользуются интернетом.160 Профессор маркетинга Cass Business School (Лондонский городской университет) Том ван Лер сформулировал эти претензии так: «Статья, которую вы мне прислали, написана неплохо, но это чистой воды спекуляция и погоня за сенсацией. Не следует быть наивными и верить заявлениям, которые делает сама о себе некая PR-фирма».
Таргетированная реклама действительно более эффективна, чем реклама, не адаптированная к запросам аудитории. Это объясняется тем, что аудитория с большей вероятностью поймет и запомнит рекламные сообщения, подготовленные с учетом ее запросов. Однако между восприятием рекламного сообщения и самим действием — например, голосованием за Трампа на избирательном участке – есть разница. На выбор избирателя влияет очень много факторов; успешная реклама – лишь один из них. На выбор человека также влияет его экономическое положение, наличие работы, его ценности (например, отношение к правам человека, к сексуальным меньшинствам и другим подобным вопросам).161
При этом объективно оценить роль этого метода в успехах политических кампаний Теда Круза или Дональда Трампа невозможно. Различные методы микротаргетинга применяются сейчас почти во всех крупных политических кампаниях – разумеется, в штабе Хиллари Клинтон эти инструменты тоже не отставили без внимания.162 Более того, та же Cambridge Analytica в ходе праймериз работала не только над относительно успешной кампанией Теда Круза, но и над очевидно провальной кампанией Бена Карсона.163
Эксперты признают, что микротаргетинг используется в предвыборных кампаниях уже много лет, а оценить его эффективность в условиях тайного голосования затруднительно. Очевидно, что победу Дональда Трампа обеспечило множество факторов, и метод Cambridge Analytica не является единственным или ключевым.
137 www.dw.com/ru/на-что-идут-политтехнологи-в-сша-ради-голосов-избирателей/a-19041304
138 www.dw.com/ru/на-что-идут-политтехнологи-в-сша-ради-голосов-избирателей/a-19041304
139 www.politico.com/magazine/story/2016/09/hillary-clinton-data-campaign-elan-kriegel-214215
140 www.nytimes.com/2016/11/03/opinion/campaign-stops/the-election-polls-that-matter.html?ref=opinion
141 www.bloomberg.com/news/articles/2016-10-27/inside-the-trump-bunker-with-12-days-to-go
142 www.bloomberg.com/news/articles/2016-10-27/inside-the-trump-bunker-with-12-days-to-go
143 www.bloomberg.com/news/articles/2016-10-27/inside-the-trump-bunker-with-12-days-to-go
144 Стив Бэннон с 20 января по 18 августа 2017 года занимал, созданную для него должность главного стратега, старшего советника президента, но не получившего пост главы администрации в Белом доме
145 www.independent.co.uk/news/world/americas/cambridge-analytica-steve-bannon-robert-rebekah-mercer-donald-trump-conflicts-of-interest-white-a7435536.html
146 www.washingtonpost.com/politics/cruz-campaign-paid-750000-to-psychographic-profiling-company/2015/10/19/6c83e508-743f-11e5-9cbb-790369643cf9_story.html?utm_term=.db9ca800c55a
147 www.wired.com/2016/08/trump-cambridge-analytica/
148 www.dasmagazin.ch/2016/12/03/ich-habe-nur-gezeigt-dass-es-die-bombe-gibt/
149 www.breitbartunmasked.com/2016/02/18/meet-the-data-lords-who-want-to-make-ted-cruz-president/
150 http://biz.liga.net/all/it/intervyu/3711533-data-analitik-trampa-pochemu-nashi-vybory-proshlyy-vek.htm
151 www.nybooks.com/articles/2017/06/08/how-trump-used-facebook-to-win/
152 https://ca-political.com/casestudies/casestudydonaldjtrumpforpresident2016
153 https://ca-political.com/casestudies/casestudymakeamericanumber12016
154 http://biz.liga.net/all/it/intervyu/3711533-data-analitik-trampa-pochemu-nashi-vybory-proshlyy-vek.htm
155 www.dasmagazin.ch/2016/12/03/ich-habe-nur-gezeigt-dass-es-die-bombe-gibt/
156 www.dasmagazin.ch/2016/12/03/ich-habe-nur-gezeigt-dass-es-die-bombe-gibt/
157 www.nzz.ch/feuilleton/medien/psychological-targeting-eine-1400-prozent-bombe-ld.133792
158 www.nybooks.com/articles/2017/06/08/how-trump-used-facebook-to-win/
159 https://blog.wdr.de/digitalistan/hat-wirklich-der-grosse-big-data-zauber-trump-zum-praesidenten-gemacht/
160 http://thehill.com/blogs/pundits-blog/presidential-campaign/307438-stop-blaming-facebook-for-trumps-election-win
161 www.ushistory.org/gov/4b.asp
162 www.politico.com/magazine/story/2016/09/hillary-clinton-data-campaign-elan-kriegel-214215
163 http://adage.com/article/campaign-trail/cambridge-analytica-toast/305439/