最成功,最丑闻的数据科学项目:Cambridge Analytica

图片

Cambridge Analytica首席执行官Alexander Knicks。解码2016年演示文稿

女士们,先生们,亲爱的同事们,今天我很荣幸与您谈谈大数据和心理学对选举过程的影响,尤其是我们对克鲁斯参议员的总统竞选所做的贡献。

容易忘记,一年半前,克鲁兹参议员是最受欢迎的总统候选人之一。他是最受批评的。除此之外,他的名字并不为人熟知-与80年代中期的杰布·布什(Jeb Bush)商店相比,只有40%的选民听说过他。他参加了共和党政治中竞争最激烈的领域之一。此外,他正在寻找一种在很大程度上同质的听众中进行听取的方式。

然而,在2016年5月,克鲁兹参议员成为唯一的严重对手,是对唐纳德·特朗普现象的唯一真正威胁。那他是怎么做到的呢?

克鲁斯的公司迅速使用了三种技术,三种方法,使他们获得了成功。

行为主义


这些技术中的第一个是行为科学(行为主义)。我认为用示例进行解释将是最简单的。想象一下,您现在拥有自己的私人海滩。而且您希望其他人停止使用它。

图片

您可以在此处放置左侧所示的标志。

它非常有用,其任务是影响文化态度。或者,您可以使用右侧的标志。这是行为交流的一个例子。他的目标是探测土壤。它吸引了更强大的潜在动机。毫无疑问,害怕被鲨鱼吞噬会成为您渴望在海滩游泳的障碍。但是,这很难做到,随后大多数沟通活动(公关公司)仍按受众特征和地理指标细分受众。

图片

但是,即使您想一秒钟,这种想法也开始显得荒谬。所有女性只会因为性别而以相同的方式感知信息的想法。或绝对是所有非裔美国人,因为他们的种族,或者与老年人,富人或年轻人,仅是由于总体人口特征。

只是没有任何意义。当然,人口统计和地理指标以及经济状况会影响您的世界观,但是心理因素同样重要,甚至更为重要。这是对您个人素质的一种理解,因为正是他们控制了行为,而行为显然会影响您的投票对象。

那怎么可能呢?在剑桥,我们引入了详细的定量工具包,以发现基本的个人素质并形成人格观念。这是实验技术中最先进的模型,称为OCEAN模型。

OCEAN是以下概念的首字母缩写:

  • 开放性(Openness)-表示您准备接受新体验的程度;
  • 责任心-表示您是否更喜欢生活中的秩序,习惯和计划;
  • 外向性-表示您的社交能力。
  • 顺从性(顺从性)-表示您是否可以将他人,社会,社区的需求置于自己之上;
  • 神经质(Neuroticism)-表示您多久担心一次。


图片

在对成千上万的美国人进行调查之后,我们能够创建一个能够预测美利坚合众国每个成年公民的个人素质的模型。

那么,这如何影响选举过程中的营销和沟通?

图片

在初选阶段(党内选举),第二项修正案可能是选民的普遍问题。如果您知道演讲对象的性质,则可以调整演讲方式和内容,以更好地向目标受众反映信息。

因此,对于非常神经质和有意识的听众,您将需要一条基于正义或情感概念的理性信息。在这种情况下,抢劫的威胁以及获得武器保险政策的可能性将非常有说服力。在相反的情况下,对于更加封闭和合规的观众(这些人非常重视传统,习惯,家庭和社区意识。也许祖父教他的儿子开枪,而父亲反过来会教他的儿子)关于他们的价值观将使您传递信息的过程更加高效。

资料分析


大便的第二部分是数据分析。沟通现在正在发生根本变化。在60年代(请参阅马修·韦纳(Matthew Weiner)的《狂人》系列),在创意领导的推动下,沟通是上下进行的。然后,才华横溢的人们汇聚在一起,并撰写了口号,例如“ Beans – Means Heinz”(原著Beanz Meanz Heinz)或“ This is可口可乐”(原著可口可乐就是它!)。在他们将这些口号推广给听众之后,希望她能做出回应。

今天,我们不必猜测哪种创意解决方案会起作用。我们可以使用目标受众的成千上万个单独的数据点来确切地了解哪种消息会比创意过程开始更早地吸引哪些受众。

图片

那么什么是大数据?

大数据是最大数量的单个数据点的并集。它们在一个数据库中合成,经过验证,然后用于创建目标受众的想法。

该信息可以包括诸如人口统计和地理指标,年龄,性别,种族,宗教背景等数据。它还可能包含心理特征或您的安装因素。这些包括作为消费者的日常习惯和喜好:您拥有哪种汽车,在商店中购买了哪些商品,阅读了哪些杂志,您属于哪个高尔夫俱乐部,您去了哪些教堂。

当然,它包括有关您的性格的信息,也包括行为信息。我们之前讨论过。这是有关您如何感知世界,真正驱动您的数据。

图片

举例说明大数据的工作原理是最简单的方法。这是我们为克鲁斯竞选活动准备的数据结构,以准备在爱荷华州举行的竞赛(选举会议)。布局看起来令人生畏,但实际上非常简单。

在这里您可以看到图表。 X轴显示该党的承诺水平分布情况:热情的共和党人在右边,民主党人在左边。 Y轴表示选民进入核心小组的可能性:在图表的顶部是最有可能这样做的人,而在底部的人根本没有选民。

该信息对于活动经理已经非常有用。但是,如果我们在此图中选择单个段,则信息将变得更加高效。

图片

在这种情况下,我们确定了一个我们称为“说服”的小组。这些人一定会投票并成为焦点。但是,要使他们开始支持Cruise,需要将其稍微移到图表中心的右侧。为此,他们需要一条能够说服他们的信息。

我们可以看到这个约有45,000人的群体,他们的主要特征是神经质等级的低指标,开放度的等级很低,意识等级的等级稍高。

我们可以进一步隔离单个概念。我们可以看看他们特别关心什么问题。我选择了武器权,这进一步缩小了分析范围。现在我们知道我们需要关于武器权的演讲,该演讲必须具有说服力,而且必须建立在我们感兴趣的选民的人格特质上。

图片

我们可以在地图上看到这些人的位置。如果我们想进一步研究细节,我们可以在个人级别上调整数据,在该级别上,每个美利坚合众国成年人都有大约4或5000个数据点。

定向广告


最后是定向广告技术。它使您可以获取所有这些脱机信息并进行比较,从而使其成为交流的引擎。

全球广告。全球广告这一观念已经破灭,即一亿人在时事通讯上收到相同的信件,看到相同的电视和数字广告的想法。

我的孩子们当然永远不会理解这种大众传播的概念。今天,交流变得越来越有针对性。她可以适应在场的每个人。因此,您将永远不会收到您不感兴趣的商品和服务的广告。您只会看到商品和服务的广告,或者在选举的情况下,看到对您最重要的问题的广告,并且将根据您的世界观进行量身定制。

我们可以使用Cookie来比较离线信息,该Cookie以社交网络等上的横幅形式成为数字广告的引擎。当然,我们可以使用此信息来自定义邮件列表中的广告。例如,丈夫和家庭中的其他每个人都收到相同的通讯。但是,他的妻子可能会收到与邮件列表中稍有不同的信件,尽管该信件甚至可能是同一主题。

最令人惊讶的是,我们可以获取这些数据并将其与来自机顶盒的信息相结合。每次观看电视时,都会录制您所观看的节目,并将此信息发送给您的提供商。而且,我们可以使用您观察到的数据来选择目标受众中有更多人观看的节目,以便在其中投放广告。

这不仅大大降低了广告价格,而且当然可以提供最佳的投资回报率。

那么结果如何呢?

图片

泰德·克鲁兹(Ted Cruz)不仅在电视和数字广告领域中运用了我们的信息,我们的行为理念,还在他的现场运营中,说服选民,筹款活动以及资源分配中运用了我们的信息。

所有这些都意味着他以不到5%的选票开始,并且非常缓慢,但与此同时,自信地上升到了35%以上。是什么让他在竞选中成为第二最具威胁性的总统竞争者。

当然,克鲁斯的公司现在结束了。但是我可以告诉你,在这次选举中仍在竞选中的两名候选人之一使用了这些技术。看看它们如何影响接下来的七个星期将非常有趣。谢谢。

聚苯乙烯


一部关于Cambridge Analytica的纪录片的预告片(在torrent上可用)





图片
通过参加SkillFactory在线课程,了解如何从头开始获得热门职业或技能和薪资水平提高的详细信息:



阅读更多



All Articles