什么是大数据?

自2011年以来,“大数据”或“大数据”一词开始流行。今天,每个人都至少听到过一次。问题在于,通常该概念未按定义使用。因此,让我们详细了解它是什么。

图片

随着技术的发展,数据量开始呈指数增长。传统工具不再涵盖处理和存储信息的需求。为了处理容量超过数百TB并不断增加的数据,已经创建了特殊的算法。它们被称为“大数据”。

如今,信息是通过各种来源大量收集的:Internet,联系中心,移动设备等。大多数情况下,此类数据的结构和顺序不明确,因此人们无法将其用于任何活动。为了使分析自动化,使用了“大数据”技术。

第一批大数据何时出现?


大数据与上一个数据中心(数据中心)一起出现在上世纪60-70年代。在2005年,公司开始了解由Internet服务(Facebook,YouTube等)的用户创建的内容的范围。同时,第一个旨在与大型数据集交互的平台Hadoop开始工作。今天,它是处理信息的大量技术。不久之后,NoSQL开始流行-一种用于创建大数据管理系统的方法。

随着大型Internet服务的出现,生成的信息量开始增加。用户上传照片,浏览内容等。大量收集所有这些信息以进行进一步分析,然后您可以对服务进行改进。例如,社交网络使用大数据向用户显示目标中的相关广告(即与他们的需求和兴趣相匹配的广告)。这使社交网络可以向企业销售进行准确的广告活动的机会。

大数据的主要特征


在本文的开头,我们从一个公认的定义中识别了大数据的三个主要属性。让我们更详细地打开它们:

  • . « » , . : , — . « » .
  • . . «big data». .
  • . , . — .

在过去的几年中,大数据的普及度有所提高,因此它们还具有两个附加属性(特征):价值和可靠性。价值由每个公司以自己的方式确定。专家评估接收到的信息是否对企业有利。可靠性表明所使用的数据是否可以信任(它们的真实性),因为不正确的信息会损害公司及其活动。

他们如何与他们合作?


大数据承载了许多有用的信息,在此基础上,公司创造了新的机会并形成了商业模式。处理大数据分为三个阶段:集成,管理和分析。

阶段1。集成

在此阶段,该公司将技术和系统集成到其工作中,从而可以从各种来源收集大量信息。引入了数据处理和格式化机制,以简化“大数据”分析人员的工作。

2阶段。控制

接收到的数据需要存储在某个地方,在使用它们之前,此问题已解决。该决定是基于许多标准做出的,其中主要是格式和处理技术的偏好。通常,公司使用本地存储,公共或私有云服务进行存储。

3阶段。分析

大数据经过分析后开始受益。这是与他们互动的最后阶段。为此,使用了机器学习,学习规则,遗传算法和其他技术的关联。分析数据后,仅保留对业务最有价值的信息。

大数据示例


一般来说,用“大数据”进行整理。但是重要的问题仍然存在-它们可以在实践中应用吗?答:在任何活动领域中,都需要进行分析所必需的数据。让我们看一些真实的例子。这将帮助您更好地理解为什么需要大数据以及如何从中受益。

银行中的大数据在

俄罗斯银行业中,Sberbank是第一个使用大数据的人。他们在“大数据”和生物识别系统的基础上,于2014年开发了一种使用照片识别客户身份的系统。操作原理非常简单:将当前图像与员工发行银行卡时从数据库中拍摄的照片进行比较。新系统使欺诈案件减少了10倍。

如今,Sberbank继续在其工作中使用大数据:信息的收集和分析使您可以管理风险,打击欺诈,评估客户的信誉,管理分支机构的队列等等。

俄罗斯银行业的另一个例子是VTB24。该公司比Sberbank稍晚开始实施“大数据”。如今,他们使用大数据来细分和管理客户外流,生成财务报表,分析Internet上的评论等等。

Alfa-Bank大数据可帮助监视Internet上的品牌形象,评估新客户的信誉度,个性化内容,管理风险等。

大数据业务

许多人错误地认为处理大数据仅与银行部门和IT公司相关。这驳斥了Magnitogorsk钢铁厂的示例,该公司开发了Sniper服务以降低生产中的原材料成本。该技术收集了大量信息,对其进行分析,并提出了优化材料成本的建议。

Surgutneftegas使用特殊的系统实时跟踪主要业务流程。这有助于自动进行产品核算,定价,为员工提供正确的数据等。

营销大数据

营销人员使用大数据来预测广告活动的结果。该分析还有助于确定最感兴趣的受众。Google趋势是营销中“大数据”的一个突出例子。该系统接收大量数据,经过分析,用户可以评估产品(工作,服务)的季节性。

使用困难


哪里有很多机会,哪里就有很多困难。该规则并未绕过大数据。

公司面临的第一个困难是大数据占用大量空间。是的,存储技术在不断改进,但是与此同时,数据量也在稳定增长(平均每两年两次)。

购置巨大的存储并不能解决所有问题。简单的数据存储是毫无意义的,您需要与他们合作以获取好处。从这里出现了另一种复杂情况-安排接收到的大数据的处理。

现在,分析师花费50-80%的工作时间将信息转换为客户可以接受的形式。公司必须雇用更多的专业人员,这增加了成本。

另一个问题是大数据的快速发展。经常出现用于工作的新工具和服务(例如Hbase)。企业必须花费大量时间和金钱才能“处于趋势中”而不落后于发展。

因此,大数据是用于处理大量信息(数百TB甚至更多)的技术的组合,如今很少有人否认未来的重要性。他们的知名度将会增加,并且业务分布也会增加。随后,他们将开发分析自动化技术,不仅大型公司,中小型公司也将使用大数据。

是否想学习如何使用大数据并扩展您的分析知识?订阅我们的大数据分析师在线课程。找出细节!


All Articles