机器学习的灵活性和自动化

在本文中,我想谈一谈机器学习自动化的主要困难,它的性质和优点,并考虑一种更灵活的方法,该方法可以使您摆脱某些缺点。

图片

从定义上说,自动化Mikell P. Groover的一项技术,通过该技术可以以最少的人力参与来执行流程或过程。长期以来,自动化一直可以提高生产率,这通常可以降低单位产品的成本。自动化方法及其应用领域正在迅速改善,并且在过去的几个世纪中,它已从简单的机制演变为工业机器人。自动化开始不仅影响体力劳动,而且也影响智力,涉及相对较新的领域,包括机器学习-自动化机器学习(auto ml,aml)。同时,机器学习自动化已经在许多商业产品(例如Google AutoML,SAP AutoML等)中找到了其应用。

图片图片图片

免责声明
本文并不伪装成该领域的教条,而是作者的愿景。

自动化机器学习


数据处理和机器学习领域的任务与由于系统的复杂性而出现的许多因素相关联,并使它们的解决方案变得复杂。其中包括(根据Charles Sutton所述):

  • 不确定性和不确定性的存在会导致缺乏对数据的先验知识和所需的依存关系。因此,研究要素始终存在。
  • “一千割死了。” 实际上,在建立用于数据处理,分析和后续建模的管道时,您必须做出许多大小决定。例如,是否有必要对数据进行规范化(如果需要),该方法应具有什么方法以及应具有哪些参数?等等。
  • 由于不确定性导致的反馈回路的存在。沉浸在任务和数据中的时间越长,您对它们的了解就越多。这导致需要退后一步,并对现有的处理和分析机制进行更改。
  • 另外,通过机器学习算法获得的模型的结果仅是现实的近似值,即 显然不准确。

图片

因此,获得数据处理和分析的完整流水线的过程可以被认为是复杂的系统(即,复杂的系统)。

复杂系统
Peter Sloot, « » « », . , () , , () , () .. , , .

一方面,这些因素的存在使机器和深度学习问题及其自动化的解决方案复杂化。另一方面,不断增长的和可访问的计算功能使我们可以将更多资源附加到任务上。

图片根据通用的CRISP-DM标准,与数据分析相关的项目的生命周期包含六个主要阶段:理解业务任务(业务理解),理解和研究数据(数据理解),处理数据(数据准备),建模(建模),质量评估(评估)和实际应用(部署,应用)。实际上,今天并非所有这些步骤都可以有效地自动化。

大多数作品或现有的库(h2o,auto-sklearn,autokeras)都专注于建模自动化,部分关注质量评估。但是,将方法扩展到数据处理自动化可以涵盖更多阶段(例如,已在Google AutoML服务中应用)。

问题的提法


可以通过多种方法解决与老师一起进行机器学习的任务,其中大多数方法被简化为使损失函数最小化 J或最大化似然函数 L为了获得参数的估计 θ^m基于可用的样本-训练数据集 yt

All Articles