人工智能关键技术,看完你就都清楚了!

发布时间: 2021-02-24 13:57:02   行业资讯   作者:猎维科技

导读: 机器学习是一种自动将模型与数据匹配,并通过训练模型对数据进行“学习”的技术。机器学习是AI最常见的形式之一。

本文会更深入地描述这个表中的每种技术及其功能。我还将论述每种技术在商业AI世界有多普遍。下面是对每一项技术及其功能的深入描述。

人工智能7大关键技术

统计机器学习、神经网络和深度学习

机器学习是一种自动将模型与数据匹配,并通过训练模型对数据进行“学习”的技术。机器学习是AI最常见的形式之一。神经网络是机器学习的一种更为复杂的形式,该技术出现在20世纪60年代,并用于分类型应用程序,例如确定信贷交易是否为欺诈行为。它根据输入、输出、变量权重或将输入与输出关联的“特征”来分析问题。它类似于神经元处理信号的方式,但把它比作大脑就有些牵强了。

最复杂形式的机器学习将涉及深度学习,或通过很多等级的特征和变量来预测结果的神经网络模型。得益于当前计算机架构更快的处理速度,这类模型有能力应对成千上万个特征。

与早期的统计分析形式不同,深度学习模型中的每个特征通常对于人类观察者而言意义不大。这导致的结果就是该模型的使用难度很大或者难以解释。在德勤的调查中只有34%的人在使用深度学习技术。

深度学习模型使用一种称为反向传播的技术,通过模型进行预测或对输出进行分类。AI技术已推动了该领域的许多最新进展,从在围棋大赛中击败人类专家到对互联网图像进行分类,便是使用反向传播的深度学习。在多伦多大学及谷歌任职的杰弗里·辛顿(Geoffrey Hinton)通常被称为深度学习之父,部分原因就在于他在反向传播方面的早期研究。

机器学习采用了上百种可能的算法,其中大多数算法有些深奥。它们的范围从梯度增强(一种构建用于解决先前模型错误的模型的方法,从而增强预测或分类能力)到随机森林(作为决策树模型集合的模型)。

越来越多的软件工具(包括DataRobot、SAS和谷歌的AutoML)支持机器学习模型的自动构建,这些模型可以尝试许多不同的算法来找出最成功的算法。一旦通过训练数据找到了能够进行预测或分类的最佳模型,就可以部署它,并对新的数据进行预测或分类(有时称为评分过程)。除了所使用的算法外,机器学习的另一个关键是模型如何进行学习。有监督学习模型(到目前为止是业务中最常用的类型)是使用一组对输出做了标记的训练数据进行学习。有监督学习与在评分模型中部署的传统分析方法(如回归分析)非常相似。在回归分析中,目标是创建一个模型,使用一组与输出有关而且其值已知的输入变量来预测一个已知结果。一旦模型开发完成,就可以用它通过相同输入变量的已知值来预测一个未知的结果。

开发无监督模型通常更难一些,它要从未做标记的数据中检测模式并预测未知的结果。强化学习是第三种变体,它是指机器学习系统制订了目标而且迈向目标的每一步都会得到某种形式的奖励。它在玩游戏中非常有用,但也需要大量数据(在许多情况下,太多的数据对该方法不起作用)。

需要指出的是,有监督的机器学习模型通常不会持续学习。它们从一组训练数据中学习然后继续使用同一个模型,除非使用新的一组训练数据来训练新的模型。机器学习模型是以统计为基础的,而且应该将其与常规分析进行对比以明确其价值增量。它们往往比基于人类假设和回归分析的传统“手工”分析模型更准确,但也更复杂和难以解释。相比于传统的统计分析,自动化机器学习模型更容易创建,而且能够揭示更多的数据细节。

考虑到学习所需的数据量,深度学习模型在图像和语音识别等任务上非常出色(远远优于以前针对这些任务的自动化方法,并且在某些领域接近或超过了人类的能力)。

自然语言处理

自20世纪50年代以来,理解人类语言一直是人工智能研究者的目标。这一领域被称为自然语言处理。包括诸如语音识别、文本分析、翻译、生成的应用程序及其他与语言有关的目标。

统计NLP是以机器学习为基础,而且其性能提升的表现要快于语意NLP。它需要一个庞大的“语料库”或者语言体系来学习。例如,在翻译中它需要大量的翻译文本,而通过统计分析可以发现西班牙语和葡萄牙语中的amor在统计上与英语中的love一词高度相关。这虽然有点靠“蛮力”,但通常是相当有效的方法。

语义NLP是近十年来唯一的现实选择,如果能用单词、语法和概念之间的关系有效地对系统进行训练那么它就会相当高效。语言的训练和知识工程(通常指为特定领域所创建的知识图谱)可能会消耗大量的人力和时间。然而,它需要开发知识主体或者单词与短语之间的关系模型。虽然创建语义NLP模型难度很大,但现在有些智能座席系统已经在使用该方法。