📖 👩🏼‍🔬 ⏺️ 如何向机器人解释您的观点 🤐 💙 ⏰

有没有想过为什么今天需要机器人？从小就对我来说，机器人似乎在现代工厂的某个地方，它离我们很远。或在科幻小说中。
但现在不再。如今的机器人是任何常规过程的自动化。它们既可以放在农场，也可以放在汽车维修店。

如果以前这种自动化的价格不菲，那么现在它正在下降。可以使用更复杂的技术操作。 Roboruki本质上就是这样一种通用机械手，无需针对每个任务进行设计，=>降低了实施成本，加快了实施速度（尽管roboruk可能比执行类似操作的输送机要贵得多）。

但是roboruk只是过程的一半。下半场是教罗博鲁克思考。直到最近，情况还是很糟糕。没有任何工程师可以配置的通用方法。我们需要聘请程序员/开发人员/数学家来提出问题，并设法解决。当然，这种情况不可能长期存在。是的，经过深入培训的计算机视觉技术不断发展。因此，现在，已经出现了某种主要的自动化，而不仅仅是严格重复的过程。今天我们将谈论她。

选择

该公司提供了一种解决方案，使您可以使用各种roboruk捕获各种对象。作为其解决方案的一部分-3D相机和专用软件，用于训练对象捕获和后续捕获的培训。

（搜索圆柱形物体）

工业中经常有预训练的形式：平行六面体，圆柱体。
使用顺序大致如下：

客户端显示要从多个侧面捕获的3D摄像机对象（或上载零件的CAD文件）
指示要捕获的方向（不一定是唯一的方向）
配置机器人与Pick-it软件的集成以执行捕获任务并配置必要的操作。

当然，这听起来并不复杂，但是需要在客户端获得一些资格。
主要的缺点是，一旦外部参数（样式/照明/表格）发生变化，系统可能会停止工作，而且重新训练的原因出在哪里总是很明显的。没有稳定的过程。

计算机视觉技术：

无法确切地说出公司使用了哪种技术堆栈。但是，从公司成立之时起，就可以使用有关Internet上的技术信息和其他间接标志来判断，使用的是用于3D场景的“深度学习”技术堆栈。例如，搜索3D变换以更好地对齐点云（ICP方法和RANSAC方法）。有时会使用特殊的点，有时会采用棘手的方式来组合点云或将方法与某些启发式方法结合起来。

（基于双向最大熵准则的鲁棒3D点云配准，张学涛，简丽波，徐美峰）

在这种情况下，成功的关键是您自己的优质3D扫描仪，其质量决定了所有这些方法的可靠性。同样重要的是，样本对象和需要捕获的对象的形状偏差不要太大。
大型机器人制造商也有类似的系统：
ABB | 库卡 | Fanuc以及（Cognex）。
但是，Pick-it涵盖了应用程序范围内的更多可变性。

现在针对可变对象的标准方法

由于计算机视觉中的深度学习技术的出现，某些类型的对象训练卷积网络变得更加容易，该卷积网络除了进行检测外，还可以评估必要的参数。

这种方法的最大范围是农业。从工厂检查到水果采摘。在某种程度上，一个经典的例子是采摘樱桃番茄。以下是一些收集农作物的公司的示例：

收集西红柿。估计尺寸/距离/颜色

如果仔细观察，它收起来的效果会很差。

通常，正确的耕种已经是机器人的95％。

关于这种恐怖，准确度高达89％，即使有关哈布雷的文章也是如此。
这些初创公司中的大多数都使用诸如SSD或YOLO之类的检测器，随后（或同时）评估成熟度参数。通过3D或立体相机估计要捕获的相同水果空间的位置。

因此，制造商（和部分解决方案集成商）面临以下任务：识别识别质量，在实际条件下补充训练样本，定期训练，编写与CV零件，3D评估零件和捕获零件相关的算法。
根据我们的经验，每次解决此类问题都需要几个月的时间。

另一种方法

并且，如果您想在深度学习中使用学习系统，而不是只停留在一个应用程序上？并且即使没有复杂的配置软件也可以针对客户端的每个任务进行培训。
告诉机器人该怎么做会很棒，然后他会以某种方式出现。但是，这是如何展示机器人？
Google（指向其中一个项目的链接）和OpenAI（他们没有看到另一个项目）正在执行机器人试图跟随人类双手并重复动作的项目。但是，精度在实际应用中远非必需，并且现有技术水平的数学难以扩展。

还有其他办法吗？
在某个时候，当我们解决3D空间中VR控制器的定向问题时，我们又遇到了另一个难题。毕竟，虚拟现实早已存在。您可以向机器人显示虚拟现实控制器如何抓取对象。但实际上并没有像OpenAI这样的模拟器。只需在其中草拟一个操纵器，然后显示捕获的方向即可。

结果很直观。几分钟后，一个人开始了解如何抓取物体或与他进行一些操作，从而实际控制机器人。

了解是否有可能做机器人想要做的事情总是很重要的。这一切都很简单：如果VR中的人可以向机器人展示如何解决问题，那么他就可以被训练去做这样的事情。可以显示的一切都在现代机器学习水平的能力之内，并且可以保证使用任何现有的机器人手臂来执行。而且它消除了现代ML的主要缺点-您不需要训练的庞大示例数据库。

这种方法的优点是什么？好吧，例如，您不需要规定低级逻辑。为什么要检测玻璃杯，然后再说在哪一侧如何抓住玻璃杯？设置确切的捕获位置。您可以显示：

玻璃杯通常放在桌子上-抓住墙壁
玻璃在侧面-抓住它
玻璃杯倒立-抓住底部

瞧，一个小时后，我们得到了结果：

好吧，或更艰巨的任务：我们想收集成果，但是我们需要保留一个分支-这是一个困难的可编程逻辑。但是她只是学到：

或一个非常简单的示例是抓取并切黄瓜（~~当然，只有抓取是经过训练的~~）：

现在，智能机器人有点像80年代的个人计算机。有各种各样的假设，一切都会来临。机器人的租金等于工人的平均工资，这意味着越来越多的劳动领域的机器人化是不可避免的。没有人知道他们将如何在五年内处理所有这一切，但是从机器人的价格如何下降以及其安装数量在增长的情况来看，一切都在不断发展。

价格：

数量：

如何向机器人解释您的观点

选择

计算机视觉技术：

现在针对可变对象的标准方法

另一种方法

More articles: