加速在Segezha森林保护区内实施AI项目



在我们的RAIF人工智能论坛上,听到Segezha集团内部控制和审计副总裁Dmitry Bocharov的一个有趣案例。德米特里(Dmitry)讲述了俄罗斯最大的木工工厂如何使用机器学习工具以及如何克服实施障碍。我们请他发言。

首先,关于公司的几句话


Segezha集团是该国最大的垂直整合木工林产地之一。



我相信你们中很多人都听说过我们公司。最后,如果您在宜家看到一个纸袋,“ ABC of Taste”或“ Auchan”,它是由我们公司生产的。



现在,我一方面要传达人工智能在解决特定业务问题方面的价值,另一方面要讲述我们的经验,甚至是我们在处理此案时遇到的设计难题。

收获过程


首先,介绍一些伐木工作:



使用特殊设备-采伐机砍伐森林。然后,工件由带有机械手的木材运输工具运送到仓库,以便从那里通过铁路或公路运输到工厂,在工厂中运送纸浆,纸张,胶合板,木材和其他纸制品。

木材测量机构


甚至不是塞格扎(Segezha)的关键问题之一,而是整个行业的关键问题,是测量这种林产品或原木的过程。



现在这是怎么回事?



借助特殊的标尺,可以测量烟囱的高度,长度和宽度,将其乘以各种系数,甚至在苏联的各种州标准和行业标准中也是如此。最基本的系数是“全木系数”,即堆栈中的实际立方体数减去原木之间的间隙的指标。这就是人为因素的问题所在-如果员工没有经验,他可能会测量不正确。

但是,从审计的角度来看,最大的困难是故意违规,因为向我们运送森林的雇员的总薪金低于木材卡车的木材成本(一立方米的成本为4-5千卢布)。一点数学-在这里,您将有机会进行各种阴谋,虐待,操纵...。这样就无法理解真正有多少“森林”。有一辆汽车,甚至有一个记录着原木数量的行为,但如果那里有那么多原木,就没有证据,除了用尺子测量的那些。在这里,问题甚至不在于我们不信任我们的所有员工或承包商的员工。在此过程中,根本没有足够的清晰度,首先,真实的文件证据表明已对某些内容进行了实际测量。

现代方法


我们开发了一种特殊的算法,该算法基于照片,使用神经网络,不仅可以确定原木的数量和每个原木的直径(对我们而言也是重要的指标),而且可以考虑相同的整木系数,但主要是它不是从某些GOST中获取的,而是经过校正的特定的林产品堆栈。

这些照片与汽车的地理位置相关,并存储在一个特殊的数据库中。因此,在我们可以随时进行验证之后:这个森林真的是多少?接下来几个月的计划是对该系统进行培训,以便它可以通过启发式搜索自动比较出发和到达的汽车。首先,系统在汽车从森林中离开地块时为汽车拍照,然后在汽车已经到达工厂时进行第二次摄影。此外,它会自动检查照片并修复某些日志是否已从上方删除以及是否已被替换。这种自动控制是基于人工智能的。这极大地简化了例如安全部门的工作,因为我们无法穿越俄罗斯的所有森林(我们的砍伐面积接近800万公顷!),就像我们无法控制每个伐木工人一样,因为它昂贵且效率低下。

当我们尝试与进行试点项目的公司一起实施该系统时,我们从Telegram机器人开始,以演示该算法的功能。



顺便说一下,这个Telegram机器人还在那里。

主要问题及其解决方案


我们面临着所有实施人工智能或相关项目的公司所面临的基本问题。首先,预算问题是从哪里获得资金的。其次,成本合理性问题第三,最大的问题是采购程序和招标

我们自己解决了以下问题:Segezha Group在采购程序中拥有所谓的“试点项目”。如果我们想引入一些新的和较小的东西,除了以前没有描述的,就不需要发明传统知识。我们尚不知道这将如何工作,因此,编写适当的传统知识只是浪费时间。这样的项目有一定的预算,并且根据采购委员会的决定,绝对有可能正式选择承包商之一。因此,我们公司本着创业的精神工作。我们已经准备好亏掉这笔钱,但是我们可以尝试解决一个特定的问题。

我的同事Segezha IT副总裁在一个论坛上谈到了我们这样的一个项目:花费几百万卢布,但可以带来三亿卢布。我们抓住了一个机会,做了一个“飞行员”,结果收获了很多次-也许不是一百次,但肯定至少十次。显然,这样的实验会蒙受损失,但是您可以并且应该尝试,因为任何实施的案例都是非常宝贵的经验。使用针对特定业务问题开发的技术正在取得成果。但是这里也必须知道该措施-人工智能和机器学习不应仅在任何地方都实施。

另一个内部生活技巧:我们与同事(与金融家,采购商和公司管理层一起)同意,我们将在未来将类似项目带给我们的部分资金再投资-也就是说,我们将不断将节省下来的资金投资于新技术和大多数在塞格扎(Segezha)宣传类似的故事。



现在,我们刚刚完成“木”案的试验。为了明确说明经济效果:使用根据GOST的标准尺进行测量的方法中的误差为5%,但实际上误差要大得多。 Segezha Group每年采伐和购买木材的价格为150亿卢布。即使您承担此金额的1%,这也是巨大的损失。同时,这些项目无需花费数十亿甚至几亿卢布,因此可以关闭这些风险区域。也许没有直接的经济影响(也就是说,我们不会赚到更多或我们不会有新的生产),但是从防止伐木可能造成损失的角度来看,高效率是显而易见的。

我认为许多人都对这种原型的生产时间感兴趣,我想提供更具体的数字。由于明显的原因,我无法命名数字,但我将指定最有问题的点-获取相关数据。例如,训练神经网络需要拍摄什么照片或数据?我们不能使用手动测量的结果(与标尺相同的测量结果),因为这样一来,该算法将可以处理不正确的数据。我们必须带上每辆木材卡车,并进行所谓的“点”:将原木从木材卡车上完全卸下,并分别测量其直径和长度。因此,可以以最小的误差确定所有木材的可靠体积。另一个特点是木材是不同的:松木,云杉,落叶松……因此,每种木材在尺寸上都有其自己的特征。衡量一切我的员工不得不前往不同的地区-基洛夫,阿尔汉格尔斯克州,克拉斯诺亚尔斯克,卡累利阿-并在那里测量每个木材运输商。因此,主要时间(大约两周)花费在收集足够有代表性的样本上以训练模型。

Segezha Group内部控制与审计副总裁Dmitry Bocharov 发布

All Articles