Клуб читателей
ГОРДОН
 
Джейсон Джей Смарт

Директор политтехнологической компании The Office of Jason Jay Smart, LLC.

ЭКСКЛЮЗИВ «ГОРДОНА»

Наука о данных позволяет спрогнозировать, какой продукт вы купите или за кого проголосуете. Это быстроразвивающаяся отрасль, которая не остановится

Этот материал можно прочитать и на украинском языке

Недавно вышел новый фильм под названием "Большой взлом" (The Great Hack), вызвавший бурную реакцию – во всем мире людей стал мучить вопрос, каким же образом наука о данных (data science) – или, как ее называют, "большие данные" (big data) – использовалась компанией Cambridge Analytica на президентских выборах 2016 года в США и во время многих других победных избирательных кампаниях по всей планете. Дело в том, что Cambridge Analytica, сейчас будучи самой известной компанией в сфере работы с данными, предлагала сервисы, не сильно-то и отличающиеся от услуг сотен других корпораций по всему миру. Рассказы о "волшебстве" Cambridge Analytica подкреплялись тем, что они помогли избраться президенту Трампу, а также победить в голосовании за Brexit кампании "Голосуй за выход".

По сути, наука о данных – это анализ больших объемов данных о случившихся событиях с целью создания корреляций, позволяющих прогнозировать события будущие. В случае коммерческих и политических кампаний они получают эти данные от поставщиков, продающих их фирмам, занимающимся анализом этих данных (как Cambridge Analytica). Фильм упускает из виду тот важный факт, что ваши данные не были украдены: в основном люди сами их предоставляют продавцам. Именно поэтому юридический текст на заявках и документах для выдачи таких вещей, как дисконтные карты магазинов (именно поэтому магазины и предоставляют дисконтные карты – ради повышения лояльности и создания профиля о том, какие покупки вы, скорее, будете совершать), кредитные карты (заинтересованные фирмы могут легально приобрести данные о ваших покупках, хотя они продаются без привязки к вашему имени), протоколы выборов, документы об образовании, записи о покупках, подлежащих хранению в государственных архивах (например, земли) и данные социальных сетей – везде есть предупреждение об отказе от ответственности, согласно которому информация будет либо находиться в открытом доступе, либо может использоваться для других коммерческих целей, как только вы подпишетесь/согласитесь.

Опять же, наука о данных не столь страшна, как ее рисуют: это просто использование статистики для установления корреляции между переменными в попытке предсказать вероятность того, что вы предпримете какие-то действия (например, купите конкретный продукт или проголосуете за конкретного кандидата). Для иллюстрации науки о данных в том виде, в каком она используется в коммерции, возьмем пример дисконтных карт в аптеках. Представьте себе женщину, заполняющую форму на получение такой карты в местной аптеке: она указывает свое имя, адрес (в зависимости от того, где/как она живет, можно сделать много оценок и выводов насчет ее социально-экономического класса), а также номер телефона.

Далее логика такова: если она регулярно покупает детские подгузники – велика вероятность того, что у нее есть ребенок. Если она покупает в два раза больше подгузников, чем обычный родитель, то велика вероятность того, что у нее два ребенка. Если она каждый месяц покупает двt взрослые зубные щетки и в два раза больше зубной пасты, чем обычный потребитель, – вероятность того, что она замужем, выше. Если она перестанет покупать контрацептивы и начнет покупать тесты на беременность, существует большая вероятность того, что она пытается завести ребенка. Если вскоре после этого она перестает ежемесячно покупать прокладки – это большая вероятность того, что забеременеть ей удалось... И это мы еще не говорим о том, что может предсказать список лекарств, которые вы покупаете.

Некоторые могли бы пожаловаться, что такие данные являются личными и даже интимными, и что никто не может иметь на них права. Однако, несмотря на личностный характер, это те данные, которые добровольно были переданы аптеке в обмен на скидку: гипотетическая "она" заполнила бланк, идентифицировав себя и дав согласие на то, что ее покупки могут отслеживаться. Давайте представим, как много всего другого можно было бы предсказать о ней, если бы у нас были данные ее кредитных карт, выписки по страховке, документы о членстве в профсоюзе, список газет, которые она покупает, информация с других скидочных карточек (например, в продуктовый магазин, на АЗС, в кафе и т.д.).

Несмотря на то, что доступ к данным Facebook ныне более затруднен, данные "ВКонтакте" и "Одноклассников" остаются легкодоступными, а оттуда мы знаем, кто ваши друзья и к каким группам вы присоединились. Исходя из того, какие группы в социальных сетях вы лайкнули, наука о данных может предсказать, кто из ваших друзей, скорее всего, разделяет с вами политические предпочтения. Мы также можем предсказать, кто из ваших друзей наиболее влиятельный (эдакий лидер мнения), тем самым ясно давая нам понять, кто представляет наибольшую ценность для рекламы, так как имеет большое влияние на свои контакты.

Ответ на вопрос, почему это имеет отношение к политике, не отвратителен и не страшен, а крайне прост: политические кампании – это всего лишь рекламные кампании, направленные на то, чтобы убедить избирателей проголосовать за кандидата X и не голосовать за кандидата Y. Именно поэтому в ходе политкампаний проводятся опросы общественного мнения: если мы знаем, что мужчины в возрасте 25–35 лет, проживающие в сельской местности, заинтересованные в экономике, чаще всего собираются голосовать за нашего кандидата, то мы должны провести фокус-группы, чтобы выяснить, какой именно аспект экономики больше всего их (опять же, мужчин 25–35 лет, сельская местность) интересует, чтобы можно было разработать брошюры, рекламные щиты и объявления в соцсетях, которые будут им интересны. Но это не говорит нам о том, каковы эти люди: что им нравится? Что движет их интересом? Какие аспекты экономики оказывают на них наибольшее влияние?

Теперь благодаря науке о данных мы можем пойти еще дальше и не только рассматривать очень широкие переменные (как возраст, пол, место проживания и т.д.), но смотреть еще глубже, например: "мужчины 25–30 лет, живущие на бульваре Тараса Шевченко, но не на проспекте Победы в Киеве, которые работают на заводе "Большевик", но не являются членами профсоюза, имеют среднее 10/11-летнее образование, не женаты, но имеют одного ребенка, у которых нет машины, которые читают "Обозреватель" и "ГОРДОН", в повседневности общаются на украинском, любят охоту и больше всего беспокоятся об инфляции и ценах на продукты", скорее всего, проголосуют за нашего кандидата. Тогда мы знаем: чтобы добиться успеха в убеждении этих избирателей, наша лучшая стратегия – это создать агитматериалы и рекламу, которые будут демонстрировать, что наш кандидат контролирует рост цен на потребительские товары для людей рабочего класса, проживающих там-то и там-то, у которых есть ребенок, и эти материалы будут написаны на украинском. Таким образом, каждый отдельный сегмент общества разбивается на еще более узкие категории для того, чтобы понять, как лучше всего на них можно повлиять.

В любом из случаев реклама, которую избиратель увидит в социальных сетях, будет о людях, похожих на него (картинка будет показывать человека того же возраста, расы, уровня достатка, с таким же количеством детей и т.д.) и с месседжем, наиболее важным конкретно для него на этих выборах (будь то потребительские цены, дороги, школы, налоги, внешняя политика или что-либо другое). Если мы покажем им сообщение на тему, которая избирателю безразлична, или покажем людей, к которым они не имеют отношения (бедный 75-летний мужчина хочет видеть стариков, на него не окажет положительного влияния реклама, в которой богатые дети играют со своей 24-летней матерью с высоким уровнем дохода) – это не даст положительного результата в переубеждении. Более того, такая реклама может навредить и отвернуть избирателей от нас.

Если это звучит потрясающе – так оно и есть. Если это звучит очень сложно – так оно и есть. Чтобы дать представление о том, насколько именно это сложно: моя политконсалтинговая компания подписала контракт с Cambridge Analytica в 2016 году (консалтинг по процессу выборов президента США). Cambridge Analytica (в рамках этой кампании) состояла из 12 человек: все они были докторами наук в областях математики (преимущественно в астрофизике), у них были степени докторов наук престижных университетов (преимущественно Кембриджа), они работали круглые сутки, чтобы определить статистические данные, на основании которых можно было бы сделать выводы по аудитории.

Хотя внутренняя ценность некоторых корреляций невысока (например, избиратели-республиканцы чаще пьют пиво, нежели вино), есть и другие связи, весьма ценные (например, избиратели Республиканской партии с большей вероятностью будут смотреть телевизор ранним вечером, чем поздним, – это означает, что миллионы долларов, потраченные нами на телевизионную рекламу, были сосредоточены на тех временных слотах и телепрограммах, которые шли поздним вечером – их с большей вероятностью могли смотреть наши избиратели). Анализ также показал, какие именно темы представляют наибольший интерес для наших потенциальных избирателей – мы точно знали, какие брошюры должны отправить им по почте, какое послание волонтеры будут им читать при обходе от двери к двери и какую рекламу они должны увидеть в социальных сетях.

Таким образом, когда волонтер стучал в их дверь, приложение для iPhone или Android, которое мы разработали, позволяло волонтеру кликнуть местоположение: например, "ул. Главная, 123, кв. 1". Если бы мистер Смит открыл дверь, специалисты по сбору данных уже (предварительно) подсчитали бы, что волонтеру нужно будет прочитать подготовленный текст, в котором обсуждается инфляция среди потребителей и необходима поддержка мистера Смита, поскольку существует 63% вероятность, что мистера Смита можно переубедить проголосовать за нас. Однако если бы дверь открыла миссис Смит, наши расчеты показали бы, что волонтер должен прочитать текст о необходимости улучшения дорог, и что вероятность того, что она будет голосовать за нас, составляла бы уже 92% (была бы выше). Тут суть сообщения заключалась бы не в убеждении голосовать за нас, а просто в напоминании ей о важности голосования в день выборов.

Если бы расчеты показали, что вероятность того, что мистер Смит-младший, открывший дверь, проголосует за нас, составляет 0% (потому что он не голосует), мы бы просто дали ему брошюру, не тратили бы время и ушли. Поскольку цель выборов – максимально использовать ресурсы (время и деньги), чтобы набрать как можно больше голосов, тот, кто не голосует или голосует против нас, не стоит этих ресурсов. Если бы было 85% шанса, что Смит-младший проголосует против нас на выборах, можно было бы вместо брошюры оставить ему информацию о том, почему предпочитаемый им кандидат – на самом деле плохой выбор – так бы мы увеличили шанс того, что в день выборов он останется дома и не будет голосовать ни против нас, ни за другого кандидата, тем самым не портя рассчитанных нами итогов выборов.

Да, кто-то может пожаловаться, что все это – вторжение в частную жизнь, но тут я бы спросил: почему вы решили сделать информацию доступной для бизнесов? Если вы не хотите делиться ею – вы всегда можете отказаться от дисконтной карты. Более того, я бы сказал, что почти все серьезные кампании по всему миру уже начали использовать эту технологию по той же причине, что и все крупные фирмы (аптеки, поисковые системы, Facebook, продуктовые магазины) используют науку о данных на протяжении стольких лет: это эффективно. Так клиент/избиратель получает наилучшее обслуживание от компании. Наука о данных – это быстроразвивающаяся отрасль, которая не остановится. Поэтому вместо того, чтобы спрашивать политиков, хорошо это или плохо, нужно принять это как факт и выяснить, как (и с помощью кого – опытного политконсультанта) использовать это в своих кампаниях, потому что оппоненты, вероятно, уже внедрили "большие данные" в свою стратегию.

Источник: "ГОРДОН"

Если вы нашли ошибку в тексте, выделите ее мышью и нажмите Ctrl+Enter

КОММЕНТАРИИ:

 
Уважаемые читатели! На нашем сайте запрещены нецензурная лексика, оскорбления, разжигание межнациональной и религиозной розни и призывы к насилию. Комментарии, которые нарушают эти правила, мы будем удалять, а их авторам – закрывать доступ к обсуждению. Редакция не вступает в переписку с комментаторами по поводу блокировки, без серьезных причин доступ к комментированию модераторы не закрывают.
 
Осталось символов: 1000
МАТЕРИАЛЫ ПО ТЕМЕ
 
 
 
 

Нажмите «Нравится», чтобы читать
Gordonua.com в Facebook

Я уже читаю Gordonua в Facebook

Свежие блоги