Le projet Data Science le plus réussi et le plus scandaleux: Cambridge Analytica

image

Alexander Knicks, PDG de Cambridge Analytica. Décodage de la présentation de 2016 .

Mesdames et Messieurs, chers collègues, j'ai l'honneur de vous parler aujourd'hui de l'impact des mégadonnées et de la psychographie sur le processus électoral, et en particulier de la contribution que nous avons apportée à la campagne électorale présidentielle du sénateur Cruise.

Il est facile d'oublier qu'il y a tout juste un an et demi, le sénateur Cruz était l'un des candidats présidentiels les moins populaires. Il a été le plus critiqué. En plus de cela, son nom n'était pas bien connu - seulement 40% des électeurs ont entendu parler de lui par rapport au magasin de Jeb Bush au milieu des années 80. Et il a combattu dans l'un des domaines les plus compétitifs de la politique républicaine. De plus, il cherchait un moyen de se faire entendre auprès d'un public largement homogène.

Cependant, en mai 2016, le sénateur Cruz est devenu le seul adversaire sérieux, la seule véritable menace pour le phénomène Donald Trump. Alors, comment l'a-t-il fait?

L'entreprise de Cruise a rapidement utilisé trois technologies, trois méthodes, ce qui les a conduites au succès.

Behaviorisme


La première de ces technologies était la science du comportement (behaviorisme). Je pense que ce sera plus facile à expliquer avec un exemple. Imaginez que vous avez maintenant votre propre plage privée. Et vous voulez que d'autres personnes cessent de l'utiliser.

image

Vous pouvez y mettre un tel panneau, comme présenté ici à gauche.

Il est très instructif et sa tâche est d'influencer les attitudes culturelles. Ou vous pouvez utiliser le panneau à droite. Ceci est un exemple de communication comportementale. Son objectif est de sonder le sol. Elle fait appel à un motif sous-jacent plus puissant. Sans aucun doute, la peur d'être mangé par un requin peut devenir un obstacle à votre envie d'aller nager sur leur plage. Cependant, cela est difficile à faire et, par conséquent, la plupart des campagnes de communication (entreprises de relations publiques) subdivisent encore l'audience en fonction d'indicateurs démographiques et géographiques.

image

Mais si vous y réfléchissez même une seconde, une telle idée commence à paraître ridicule. L'idée que toutes les femmes percevront le message de la même manière qu'en raison de leur sexe. Ou qu'il en sera ainsi avec absolument tous les Afro-Américains en raison de leur race ou avec les personnes âgées ou les riches ou les jeunes simplement en raison des caractéristiques démographiques générales.

Cela n'a aucun sens. Bien sûr, les indicateurs démographiques et géographiques, ainsi que la situation économique affecteront votre vision du monde, mais la psychographie est tout aussi importante, voire plus importante. C'est une compréhension de vos qualités personnelles, car ce sont elles qui contrôlent le comportement, et le comportement affecte évidemment pour qui vous votez.

Alors, comment est-ce possible? À Cambridge, nous avons introduit une boîte à outils quantitative détaillée afin de découvrir les qualités personnelles de base et de se faire une idée de la personnalité. Il s'agit du modèle le plus avancé en technologie expérimentale connu sous le nom de modèle OCEAN.

OCEAN est un acronyme pour des concepts tels que:

  • ouverture (ouverture) - indique le niveau de préparation à une nouvelle expérience;
  • Conscience - indique si vous préférez l'ordre, les habitudes et la planification de la vie;
  • Extraversion - indique le niveau de votre sociabilité.
  • conformité (Conformité) - signifie si vous pouvez mettre les besoins des autres, de la société, de la communauté au-dessus de vous;
  • névrosisme (névrosisme) - indique la fréquence à laquelle vous vous inquiétez.


image

Après avoir mené cette enquête auprès de centaines de milliers d'Américains, nous avons pu créer un modèle capable de prédire les qualités personnelles de chaque citoyen adulte des États-Unis d'Amérique.

Comment cela affecte-t-il le marketing et la communication dans le processus électoral?

image"

Au stade des primaires (élections intra-parti), le deuxième amendement peut être une question populaire parmi les électeurs. Si vous connaissez la nature des personnes à qui vous dirigez votre discours, vous pouvez ajuster votre méthode de présentation et son contenu pour mieux refléter votre message à votre public cible."

Ainsi, pour un public très névrosé et conscient, vous aurez besoin d'un message rationnel et basé sur le concept de justice ou d'émotions. Dans ce cas, la menace de vol et la possibilité d'obtenir une police d'assurance pour les armes seront très convaincantes. Dans le cas contraire, pour un public plus fermé et plus docile (ce sont des gens qui attachent une grande importance aux traditions, aux habitudes, à la famille, au sens de la communauté. sur leurs valeurs rendra le processus de transmission de votre message beaucoup plus efficace.

Analyse des données


La deuxième jambe du tabouret est l'analyse des données. La communication est en train de changer fondamentalement. Dans les années 60 (voir la série Mad Man de Matthew Weiner), la communication se faisait de haut en bas, portée par un leadership créatif. Puis des esprits brillants se sont réunis et ont composé des slogans tels que «Beans - signifie Heinz» (orig. Beanz Meanz Heinz) ou «This is Coca-Cola» (orig. Coca-Cola Is It!). Après avoir promu ces slogans auprès du public dans l'espoir qu'elle réagirait.

Aujourd'hui, nous n'avons pas à deviner quelle solution créative fonctionnera. Nous pouvons utiliser des centaines et des milliers de points de données individuels du public cible pour comprendre exactement quel message attirera ce public bien avant le début du processus de création.

image

Qu'est-ce que le Big Data?

Le Big Data est l'union du plus grand nombre possible de points de données individuels. Ils sont synthétisés dans une base de données, vérifiés puis utilisés pour créer une idée du public cible.

Ces informations peuvent inclure des données telles que les indicateurs démographiques et géographiques, l'âge, le sexe, l'origine ethnique, l'appartenance religieuse, etc. Il peut également contenir des informations psychographiques ou vos facteurs d'installation. Il s'agit notamment des habitudes et des préférences de tous les jours en tant que consommateur: quel type de voiture vous possédez, quels biens vous achetez dans les magasins, quels magazines vous lisez, à quel club de golf vous appartenez, à quelles églises vous allez.

Et, bien sûr, cela comprend des informations sur votre personnalité, c'est aussi des informations comportementales. Nous en avons parlé plus tôt. Ce sont des données sur la façon dont vous percevez le monde, sur ce qui vous motive vraiment.

image

La façon la plus simple d'illustrer le fonctionnement des mégadonnées est d'utiliser un exemple de vie. Il s'agit de la structure de données que nous avons compilée pour la campagne de Cruise en préparation du concours (réunion préélectorale) dans l'Iowa. La disposition semble intimidante, mais c'est en fait très simple.

Ici vous voyez le graphique. L’axe des X montre la répartition du niveau d’engagement du parti: ardents républicains à droite, démocrates à gauche. L'axe des Y indique la probabilité que les électeurs viennent au caucus: en haut du graphique se trouvent ceux qui sont les plus susceptibles de le faire, et ceux qui sont en bas n'en ont pas du tout.

Ces informations sont déjà très utiles pour le gestionnaire de campagne. Mais si nous distinguons des segments individuels dans ce diagramme, les informations deviendront encore plus efficaces.

image

Dans ce cas, nous avons identifié un groupe que nous appelons «Convaincu». Ce sont des gens qui vont certainement voter et se concentrer. Cependant, pour commencer à prendre en charge Cruise, ils doivent être légèrement décalés vers la droite du centre du graphique. Pour ce faire, ils ont besoin d'un message qui les convaincra.

Nous pouvons regarder ce groupe d'environ 45 000 personnes et voir que leurs principales caractéristiques sont de faibles indicateurs sur l'échelle de névrosisme, assez bas sur l'échelle d'ouverture et légèrement plus élevés sur l'échelle de conscience.

Nous pouvons isoler davantage les concepts individuels. Nous pouvons voir de quel problème ils sont particulièrement préoccupés. J'ai choisi le droit aux armes, ce qui a encore réduit le champ d'analyse. Et maintenant, nous savons que nous avons besoin d'un discours sur les droits aux armes, qui doit être convaincant et nécessairement fondé sur les traits de personnalité des électeurs qui nous intéressent.

image

Et nous pouvons voir sur la carte où se trouvent ces personnes. Si nous voulions aller plus loin dans les détails, nous pourrions ajuster les données à un niveau individuel auquel nous avons environ 4 ou 5 000 points de données pour chaque citoyen adulte des États-Unis d'Amérique.

Publicité ciblée


Et enfin, la technologie de la publicité ciblée. Il vous permet de prendre toutes ces informations hors ligne et de les comparer pour qu'elles deviennent un moteur de communication.

Publicité mondiale. La publicité mondiale, l'idée que cent millions de personnes reçoivent la même lettre sur le bulletin d'information, voient la même publicité télévisée et numérique, est morte.

Mes enfants, bien sûr, ne comprendront jamais ce concept de communication de masse. Aujourd'hui, la communication devient de plus en plus ciblée. Elle s'adapte individuellement à toutes les personnes présentes ici. Ainsi, vous ne recevrez jamais de publicités pour des biens et services qui ne vous intéressent pas. Vous ne verrez que des annonces de biens et services, ou en cas d'élections, des questions les plus importantes pour vous, et elles seront adaptées précisément à votre vision du monde.

Nous pouvons comparer les informations hors ligne à l'aide de cookies, qui deviennent le moteur de la publicité numérique sous forme de bannières sur les réseaux sociaux et autres. Nous pouvons bien sûr utiliser ces informations pour personnaliser la publicité dans les listes de diffusion. Par exemple, le mari et tous les autres membres de la famille reçoivent le même bulletin. Cependant, sa femme peut recevoir une lettre légèrement différente de la liste de diffusion, même si elle peut même être sur le même sujet.

La chose la plus étonnante est le fait que nous pouvons prendre ces données et les combiner avec les informations du décodeur. Chaque fois que vous regardez la télévision, les programmes que vous regardez sont enregistrés et ces informations sont envoyées à votre fournisseur. Et nous pouvons utiliser les données que vous regardez pour sélectionner des programmes qui sont regardés par plus de personnes du public cible afin d'y placer des publicités.

Cela permet non seulement de réduire considérablement le prix de la publicité, mais aussi, bien sûr, d'obtenir les meilleurs taux de retour sur investissement.

Quels ont donc été les résultats?

image

Ted Cruz a appliqué nos informations, nos idées de comportement non seulement dans le domaine de la télévision et de la publicité numérique, mais aussi dans ses opérations sur le terrain, dans la méthodologie de persuasion des électeurs, dans une campagne de financement, ainsi que dans l'allocation des ressources.

Et tout cela signifiait qu'il a commencé avec moins de 5% des voix et très lentement, mais en même temps avec confiance, a atteint plus de 35%. Ce qui fait de lui le deuxième candidat présidentiel le plus menaçant de la course.

Bien sûr, la compagnie de Cruise est maintenant terminée. Mais je peux vous dire que l'un des deux candidats qui est resté dans la course à cette élection utilise ces technologies. Il sera très intéressant de voir comment ils affectent les sept prochaines semaines. Remercier.

PS


Bande-annonce d'un documentaire (disponible sur torrents) sur Cambridge Analytica





image
Apprenez en détail comment obtenir une profession recherchée à partir de zéro ou passer au niveau supérieur en compétences et en salaire en suivant les cours en ligne de SkillFactory:



Lire la suite



All Articles