首页 > 编程笔记 > Python笔记

机器学习的发展历史以及算法演进

机器学习是一门不断发展的学科，虽然只是在最近几年才成为一个独立学科，但机器学习的起源可以追溯到 20 世纪 50 年代以来人工智能的符号演算、逻辑推理、自动机模型、启发式搜索、模糊数学、专家系统以及神经网络的反向传播BP算法等。虽然这些技术在当时并没有被冠以机器学习之名，但时至今日它们依然是机器学习的理论基石。

从学科发展过程的角度思考机器学习，有助于理解目前层出不穷的各类机器学习算法。机器学习的大致演变过程如表1所示。

表1：机器学习算法大致演变过程
机器学习阶段	年份	主要成果	代表人物
人工智能起源	1936	自动机模型理论	阿兰•图灵（Alan Turing）
	1943	MP模型	沃伦•麦卡洛克（Warren McCulloch）、沃特•皮茨（Walter Pitts）
	1951	符号演算	冯• 诺依曼（John von Neumann）
	1950	逻辑主义	克劳德•香农（Claude Shannon）
	1956	人工智能	约翰•麦卡锡（John McCarthy）、马文•明斯基（Marvin Minsky )、克劳德•香农（Claude Shannon）
人工智能初期	1958	LISP	约翰•麦卡锡（John McCarthy）
	1962	感知器收敛理论	弗兰克•罗森布拉特（Frank Rosenblatt）
	1972	通用问题求解（GPS）	艾伦•纽厄尔（Allen Newell）、赫伯特•西蒙（Herbert Simon）
	1975	框架知识表示	马文•明斯基（Marvin Minsky）
进化计算	1965	进化策略	英格•雷森博格（Ingo Rechenberg )
	1975	遗传算法	约翰•亨利•霍兰德（John Henry Holland）
	1992	基因计算	约翰•柯扎（John Koza）
专家系统和知识工程	1965	模糊逻辑、模糊集	拉特飞•扎德（Lotfi Zadeh）
	1969	DENDRA、MYCIN	费根鲍姆（Feigenbaum )、布坎南（Buchanan )、莱德伯格（Lederberg）
	1979	ROSPECTOR	杜达（Duda）
神经网络	1982	Hopfield 网络	霍普菲尔德（Hopfield）
	1982	自组织网络	图沃•科霍宁（Teuvo Kohonen）
	1986	BP算法	鲁姆哈特（Rumelhart）、麦克利兰（McClelland）
	1989	卷积神经网络	乐康（LeCun）
	1998	LeNet	乐康（LeCun）
	1997	循环神经网络RNN	塞普•霍普里特（Sepp Hochreiter）、尤尔根•施密德胡伯（Jurgen Schmidhuber）
分类算法	1986	决策树ID3算法	罗斯•昆兰（Ross Quinlan）
	1988	Boosting 算法	弗罗因德（Freund）、米迦勒•卡恩斯（Michael Kearns）
	1993	C4.5算法	罗斯•昆兰（Ross Quinlan）
	1995	AdaBoost 算法	弗罗因德（Freund）、罗伯特•夏普（Robert Schapire）
	1995	支持向量机	科林纳•科尔特斯（Corinna Cortes）、万普尼克（Vapnik）
	2001	随机森林	里奥•布雷曼（Leo Breiman）、阿黛勒• 卡特勒（Adele Cutler )
深度学习	2006	深度信念网络	杰弗里•希尔顿（Geoffrey Hinton）
	2012	谷歌大脑	吴恩达（Andrew Ng）
	2014	生成对抗网络GAN	伊恩•古德费洛（Ian Goodfellow）

机器学习的发展分为知识推理期、知识工程期、浅层学习（Shallow Learning）和深度学习（Deep Learning）几个阶段。

知识推理期

知识推理期起始于 20 世纪 50 年代中期，这时候的人工智能主要通过专家系统赋予计算机逻辑推理能力，赫伯特·西蒙（Herbert Simon）和艾伦·纽厄尔（Allen Newell）实现的自动定理证明系统 Logic Theorist 证明了逻辑学家拉赛尔（Russell）和怀特黑德（Whitehead）编写的《数学原理》中的 52 条定理，并且其中一条定理比原作者所写更加巧妙。

知识工程期

20 世纪 70 年代开始，人工智能进入知识工程期，费根鲍姆（E.A. Feigenbaum）作为知识工程之父在 1994 年获得了图灵奖。由于人工无法将所有知识都总结出来教给计算机系统，所以这一阶段的人工智能面临知识获取的瓶颈。

浅层学习

实际上，在 20 世纪 50 年代，就已经有机器学习的相关研究，代表性工作主要是罗森布拉特（F. Rosenblatt）基于神经感知科学提出的计算机神经网络，即感知器，在随后的十年中浅层学习的神经网络曾经风靡一时，特别是马文·明斯基提出了著名的 XOR 问题和感知器线性不可分的问题。

由于计算机的运算能力有限，多层网络训练困难，通常都是只有一层隐含层的浅层模型，虽然各种各样的浅层机器学习模型相继被提出，对理论分析和应用方面都产生了较大的影响，但是理论分析的难度和训练方法需要很多经验和技巧，随着最近邻等算法的相继提出，浅层模型在模型理解、准确率、模型训练等方面被超越，机器学习的发展几乎处于停滞状态。

深度学习

2006 年，希尔顿（Hinton）发表了深度信念网络论文，本戈欧（Bengio）等人发表了“Greedy Layer-Wise Training of Deep Networks”论文，乐康（LeCun）团队发表了“Efficient Learning of Sparse Representations with an Energy-Based Model”论文，这些事件标志着人工智能正式进入了深层网络的实践阶段，同时，云计算和 GPU 并行计算为深度学习的发展提供了基础保障，特别是最近几年，机器学习在各个领域都取得了突飞猛进的发展。

新的机器学习算法面临的主要问题更加复杂，机器学习的应用领域从广度向深度发展，这对模型训练和应用都提出了更高的要求。随着人工智能的发展，冯·诺依曼式的有限状态机的理论基础越来越难以应对目前神经网络中层数的要求，这些都对机器学习提出了挑战。

机器学习的发展历史以及算法演进

知识推理期

知识工程期

浅层学习

深度学习

所有教程

优秀文章