Qu'est-ce que le Big Data?

Le terme «big data» ou «big data» a commencé à gagner en popularité depuis 2011. Aujourd'hui, tout le monde l'a entendu au moins une fois. Le problème est que souvent le concept n'est pas utilisé par définition. Par conséquent, comprenons en détail de quoi il s'agit.

image

Avec le développement de la technologie, la quantité de données a commencé à augmenter de façon exponentielle. Les outils traditionnels ne couvrent plus la nécessité de traiter et de stocker des informations. Pour traiter des données dont le volume dépasse des centaines de téraoctets et augmente constamment, des algorithmes spéciaux ont été créés. Ils sont appelés «big data».

Aujourd'hui, les informations sont collectées en grande quantité à partir de différentes sources: Internet, centres de contact, appareils mobiles, etc. Le plus souvent, ces données n'ont pas une structure et un ordre clairs, de sorte qu'une personne ne peut les utiliser pour aucune activité. Pour automatiser l'analyse, des technologies de «big data» sont utilisées.

Quand les premiers big data sont-ils apparus?


Les mégadonnées sont apparues dans les années 60-70 du siècle dernier avec les premiers centres de données (centres de données). En 2005, les entreprises ont commencé à comprendre l'étendue du contenu créé par les utilisateurs de services Internet (Facebook, YouTube, etc.). Dans le même temps, la première plate-forme conçue pour interagir avec de grands ensembles de données, Hadoop, a commencé à fonctionner. Aujourd'hui, il s'agit d'un large éventail de technologies de traitement de l'information. Un peu plus tard, NoSQL a commencé à gagner en popularité - un ensemble de méthodes pour créer des systèmes de gestion de Big Data.

La quantité d'informations générées a commencé à augmenter avec l'avènement des grands services Internet. Les utilisateurs téléchargent des photos, parcourent du contenu, etc. Toutes ces informations sont collectées en gros volumes pour une analyse plus approfondie, après quoi vous pouvez apporter des améliorations aux services. Par exemple, les réseaux sociaux utilisent les mégadonnées pour montrer aux utilisateurs des publicités pertinentes (c'est-à-dire qui correspondent à leurs besoins et intérêts) dans une cible. Cela permet aux réseaux sociaux de vendre aux entreprises la possibilité de mener des campagnes publicitaires précises.

Caractéristiques clés du Big Data


Au tout début de l'article, nous avons identifié trois propriétés principales du Big Data à partir d'une définition généralement acceptée. Ouvrons-les plus en détail:

  • . « » , . : , — . « » .
  • . . «big data». .
  • . , . — .

Au cours des dernières années, la popularité des mégadonnées a augmenté, ce qui leur a valu deux propriétés (caractéristiques) supplémentaires: la valeur et la fiabilité. La valeur est déterminée par chaque entreprise à sa manière. Les experts évaluent si les informations reçues bénéficieront à l'entreprise. Et la fiabilité montre si les données utilisées peuvent être fiables (à quel point elles sont vraies), car des informations inexactes peuvent nuire à l'entreprise et à ses activités.

Comment travaillent-ils avec eux?


Le Big Data contient de nombreuses informations utiles, sur la base desquelles les entreprises créent de nouvelles opportunités et forment des modèles commerciaux. Le travail avec le Big Data est divisé en 3 étapes: intégration, gestion et analyse.

Étape 1. Intégration

À ce stade, l'entreprise intègre dans son travail des technologies et des systèmes qui lui permettent de collecter de grandes quantités d'informations provenant de diverses sources. Des mécanismes de traitement et de formatage des données sont introduits pour simplifier le travail des analystes avec les «big data».

2 étages. Contrôle

Les données reçues doivent être stockées quelque part, ce problème est résolu avant de travailler avec elles. La décision est prise sur la base de nombreux critères, dont les principaux sont les préférences en matière de format et de technologie de traitement. En règle générale, les entreprises utilisent le stockage local, des services de cloud public ou privé pour le stockage.

3 étages. Analyse

Les données volumineuses commencent à bénéficier après l'analyse. C'est la dernière étape de l'interaction avec eux. Pour cela, l'apprentissage automatique, une association de règles d'apprentissage, des algorithmes génétiques et d'autres technologies sont utilisés. Après analyse des données, il ne reste que le plus précieux pour l'entreprise.

Exemples de Big Data


En termes généraux, avec le "big data" trié. Mais la question importante demeure - où peuvent-ils être appliqués dans la pratique? Réponse: dans tout domaine d'activité qui fonctionne avec les données nécessaires à l'analyse. Regardons quelques exemples du monde réel. Cela vous aidera à mieux comprendre pourquoi le Big Data est nécessaire et comment vous pouvez en bénéficier.

Big Data dans les banques

Dans le secteur bancaire russe, Sberbank a été la première à utiliser le big data. Sur la base des «big data» et d'un système biométrique, ils ont développé en 2014 un système d'identification de l'identité d'un client à l'aide de photographies. Le principe de fonctionnement est très simple: comparer l'image actuelle avec une photo de la base de données que les employés prennent lors de l'émission d'une carte bancaire. Le nouveau système a permis de réduire de 10 fois les cas de fraude.

Aujourd'hui, Sberbank continue d'utiliser le Big Data dans son travail: la collecte et l'analyse d'informations vous permettent de gérer les risques, de lutter contre la fraude, d'évaluer la solvabilité des clients, de gérer les files d'attente dans les agences et bien plus encore.

Un autre exemple du secteur bancaire russe est le VTB24. La société a commencé à implémenter le «big data» un peu plus tard que Sberbank. Aujourd'hui, ils utilisent le Big Data pour segmenter et gérer les sorties clients, générer des états financiers, analyser les avis sur Internet, et bien plus encore.

Alfa-Bank Big Data permet de surveiller l'image de marque sur Internet, d'évaluer la solvabilité des nouveaux clients, de personnaliser le contenu, de gérer les risques, etc.

Big data en entreprise

Beaucoup de gens croient à tort que travailler avec les mégadonnées n'est pertinent que pour le secteur bancaire et les sociétés informatiques. Cela réfute l'exemple de la sidérurgie Magnitogorsk, qui a développé le service Sniper pour réduire les coûts des matières premières dans la production. La technologie recueille de grandes quantités d'informations, les analyse et fournit des recommandations pour optimiser les coûts des matériaux.

Surgutneftegas utilise un système spécial pour suivre les principaux processus commerciaux en temps réel. Cela aide à automatiser la comptabilité des produits, la tarification, à fournir au personnel les bonnes données, etc.

Big Data en marketing

Les spécialistes du marketing utilisent le Big Data pour prédire les résultats des campagnes publicitaires. L'analyse permet également d'identifier le public le plus intéressé. Google Trends est un exemple frappant de «big data» dans le marketing. Le système reçoit une énorme quantité de données, et après analyse, l'utilisateur peut évaluer la saisonnalité d'un produit (travail, service).

Difficulté à utiliser


Là où il y a de grandes opportunités, de grandes difficultés s'y attendent. Cette règle n'a pas ignoré les mégadonnées.

La première difficulté que rencontrent les entreprises est que les mégadonnées occupent beaucoup d'espace. Oui, les technologies de stockage s'améliorent constamment, mais en même temps, la quantité de données augmente régulièrement (en moyenne, deux fois tous les deux ans).

L'acquisition d'un immense stockage ne résout pas tous les problèmes. Le simple stockage de données n'aura aucun sens, vous devez travailler avec eux pour obtenir des avantages. De là, une autre complication se pose - organiser le traitement des données volumineuses reçues.

Désormais, les analystes consacrent 50 à 80% de leur temps de travail à mettre les informations sous une forme acceptable pour le client. Les entreprises doivent embaucher plus de professionnels, ce qui augmente les coûts.

Et un autre problème est le développement rapide des mégadonnées. De nouveaux outils et services pour le travail apparaissent régulièrement (par exemple, Hbase). Les entreprises doivent dépenser beaucoup de temps et d'argent pour être "à la mode" et ne pas être à la traîne du développement.

Ainsi, les mégadonnées sont une combinaison de technologies pour traiter de grandes quantités d'informations (des centaines de téraoctets et plus) et aujourd'hui, peu de gens nient leur importance à l'avenir. Leur popularité augmentera et la distribution dans l'entreprise augmentera. Par la suite, ils développeront des technologies pour l'automatisation de l'analyse et non seulement les grandes entreprises travailleront avec le big data, mais aussi les moyennes avec les petites.

Vous voulez apprendre à travailler avec le Big Data et étendre vos connaissances en analytique? Inscrivez-vous à notre cours en ligne Big Data Analyst. Découvrez les détails!


All Articles