为大众科普一下当下的人工智能到底是什么?
2016年,AI系统阿尔法go横空出世,打败人类顶级职业棋手李世石。一时间人工智能被推上了媒体的风口浪尖。资本开始大量进入相关行业进行布局,AI+安防,AI+教育,AI+金融,AI+制造。。。。仿佛突然,人工智能成为了各行各业的宠儿。
本文较长主要有以下几个方面:
一是:为大众科普一下当下的人工智能到底是什么?
二是:人工智能在当下有哪些应用场景和前景?
三是:人工智能对于个人有着怎样的发展机遇?
一、人工智能:机器学习与深度学习
深度学习 ⊂ 机器学习 ⊂ AI
1.1 AI的出世
让我们把时间拉回到上个世纪50年代。1956年,在达特茅斯会议(Dartmouth Conferences)上,在一群先驱们的思想碰撞中,首次提出了"AI"术语,AI由此诞生。AI代表了人类的一种愿景,即由人工生产出智能!
在后面的几十年中,这样的愿景让无数的研究者前赴后继,也让无数的研究者处处碰壁。人们多么的期望能有像《终结者》里面那样的智能机器人。但理想很丰满,现实很骨感。他们发现强人工智能是如此的遥不可及,于是先驱们开始退而求其次,开始大力的研究弱人工智能,虽然机器不能完全像人一样思考,但是在某些特定的任务上也许他能做得比人好,比如识别图片,比如垃圾邮件辨别。
1.2 机器学习的战争
又是跌跌撞撞是十几年,机器学习成为了弱人工智能实现的一个主要方向,期间还爆发了一场"战争"。一场统计学习和符号学习的"战争",这场战场持续了很久,双方都有着完善的数学理论作为"心法"。"既然大家各执一词,那咱们就看谁实战更厉害吧"统计学习如是说道。
最终符号学习败下阵来,大量例子表明在效果上,统计学习优势更大。于是统计学习几乎成为了机器学习的代言者。似乎一切都欣欣向荣,直到2012年的"华山论剑"(Imagenet:ILSVRC比赛),一位"老者"从中脱颖而出。
1.3 深度学习的崛起
一年一度的ILSVRC比赛是一个面向全世界的比赛,主要内容是通过人工智能对图像进行识别分类。这时的机器学习已经有了很完善的数学理论做支撑。有PAC理论来支撑机器学习的"合法性",有凸优化理论支撑着SVM这类分类器的"有效性"。似乎一切都欣欣向荣。但是在一些比较抽象的任务上,却迟迟没什么进展。比如上面提到的ILSVRC比赛。
传统的机器学习,即使通过使用SIFT这种精心设计的特征抽取方法,也迟迟没法提高ILSVRC比赛上正确率,似乎机器学习在这种比较抽象的任务上遇到了一些麻烦,且迟迟没有进展。
直到2012年,一位"老者"从中脱颖而出,他的名字叫做"深度学习"。之所以叫他"老者",是因为他出现的时间几乎和AI一同出现,只是那个时候他的名字叫"神经网络"。
这位老者没有复杂的数学心法做"支撑",但是他招式的威力之大,几乎称霸了所有的弱人工智能的比赛。从计算视觉,到语音处理,从自然语言处理到推荐系统,一次又一次的刷新着榜单。
1.4 深度学习的困境
虽然"深度学习"已经在很多的任务上超越了传统机器学习,在近几年也有了长足的发展,但是其本身仍然存在一些问题。
一是非常依赖于大量的标记数据。
有的场景下,数据的标记成本非常的高,甚至有的场景下注定没法拥有大量的标记数据,比如风控中的黑样本。所以很多场景,特别是结构化数据的建模仍然是传统机器学习的天下。
二是暂时没有完善的理论做支撑。
深度学习不像机器学习(统计学习),它暂时没有完善的数学理论做支撑。一是导致深度学习的发展如同摸着石头过河。二是其不可解释性,注定在某些安全攸关的领域上,存在系统落地困难的问题。
1.5 到底在学习什么?
机器学习,深度学习,他们到底在学什么?
让我们把时间轴再拉远一些,拉到亿万年前,生命进化的初期。
生命的进化依托于基因,基因变异,然后交叉,最终选择,然后进行下一轮的迭代。基因的变异
和交叉是一种妥协,其目的是为了选择最优的最合适的基因以适应环境。既然没法一次选到最优的基因(因为组合数近乎无穷多种),那我就通过变异和交叉的方法慢慢逼近最优。经过一次一次的迭代,最终进化出了生命和智慧。所以生命和智慧的核心在于选择和变异
机器学习和深度学习也是一个道理,每一个任务,我们都可以看成是一个函数。我们想找到最优的函数。但是这个函数所在的函数空间有无穷多个函数,于是先驱们通过不同的方法设计了不同的算法,使得我们可以慢慢迭代去趋近于这个最优的函数,以此进化出"智慧"。
从无穷的基因组合中,逼近最优的基因组合,以适应环境
从无穷的函数空间中,逼近最优的模型参数,以适应任务
所以从某种本质上来说,深度学习可以认为是机器学习的一个子集。
1.6 总结
机器学习是弱人工智能的一种实现途径。机器学习目前的方法主要是统计学习。深度学习(又名深度神经网络)是机器学习中一个非常重要的子方向。两者相辅相成,分别适应于不同的业务场景。下文将介绍一下机器学习和深度学习的一些具体业务场景。
二、机器学习和深度学习的应用场景
人工智能就像是奶油,他必须依托于面包,没有面包只卖奶油是卖不出去的
机器学习和深度学习作为人工智能的一种实现途径,在某些业务场景下,他们能给这些业务"赋能",大幅度的增加"生产效率",所以说机器学习和深度学习是奶油,他能使得已有的面包(业务)变得更加的"可口"。下面就大致描述一下人工智能所应用的一些场景:
2.1 AI+安防:
弱人工智能非常大的一类方向是计算机视觉。基于深度学习的图像识别,目标检测,目标跟踪,人脸识别等技术已经越趋成熟。通过这些技术,结合城市的摄像头可以落地非常多的AI+安防的场景。
2.2 AI+教育:
线上教育的市场越来越大,除了传统的K12教育以外,职业技术培训,知识付费等也可以看作是"线上教育"的衍生。依托于AI进行自适应教育,通过AI语音识别纠正口语发音,通过AI对知识付费群体进行知识推荐等等将越来越普及。除此以外,以好未来为代表的新一代教育机构也在探索线上线下结合的"AI教学法"。
人工智能就像是奶油,他必须依托于面包,没有面包只卖奶油是卖不出去的
2.3 AI+金融:
金融领域不缺数据,对于AI的应用落地有着天然的优势(但是数据有大量的噪声)。在金融交易方面,强化学习在慢慢侵蚀普通交易员的饭碗,AI类的算法也在为传统的阿尔法等交易策略添加战力,甚至使用NLP领域的方法增加交易出入的数据维度(引入舆论信息等)。在金融风控方面,基于大量的用户行为和交易数据,通过AI可以轻易的对单个用户进行风险控制。
2.4 AI+制造:
智能制造是以后制造业的趋势。通过对设备检测数据的挖掘,我们可以建立系统对设备进行健康管理。通过机器人的使用,我们可以大幅度减少人工劳作。而这些和AI都息息相关。
2.5 总结
机器学习和深度学习在工业界的不同场景下都用很多的应用。有的任务适应于使用机器学习,有的应用适应于使用深度学习。还有的任务是机器学习和深度学习相结合。所以两者没有孰优孰劣。
三、学习规划和建议
3.1 把握技术的发展趋势
从时间先后顺序上来说:
科学 快于 技术 快于 资本 快于 媒体 快于 政策
人工智能(AI)就是完美的复合上面的发展趋势。
科学:
AI的一些科学理论基础,也就是我前面提到的数学心法,实际上已经出现了几十年,甚至一百年,几百年。只是那个时候这些数学家并不知道他能有什么实际的用处而已。(再比如费马小定理在RSA公钥系统上的应用等等)
技术:
之后由这些心法,发展出了AI技术,比如近几年的发展。但为什么恰是这几年,AI技术有了很进一步的发展?因为这些技术的产生和时机以及环境息息相关。
海量的数据
算力的提升
框架的推广
资本:
当技术稍有成果之后,资本开始蠢蠢欲动,大量的进入市场。
媒体:
当市场略有成效之后,媒体介入,之后则是大量的宣传,报道。
政策:
之后在经过了大量的验证之后,政府在政策上开始对相关技术的企业进行政策扶持。甚至将此方向作为以后大力发展的方向。
所以机器学习和深度学习暂时过了技术的红利期,已经进入了政策期。为什么说暂时,是因为随时有可能由引发一场新的技术革命。因为科学方面已经遥遥的走在了技术的前面。
3.2 定位好学习的境界
作为一个AI算法工程师(机器学习和深度学习),主要有四种境界。
科学家境界
工程师境界
应用者境界
知其然境界
科学家境界:科学家境界是很少很少一部分人能达到的境界,主要是那些从事AI研究的科学家,他们能原创出很多的算法和理论,解决一些难题。比如hinton,Ian goodfellow。
工程师境界:工程师境界也是很难的一种境界,需要用很强的理论背景和工程实现能力,能独立复现最新的论文,深刻理解论文的实现原理,并能在上面做一些小创新。
应用者境界:应用者境界是大部分算法工程师所在的境界,主要就是明白原理,知道如何实现,核心在于知道如何把他应用在一个实际的业务场景之中。
知其然境界:最后一个是知其然,也知其所以然境界,知道机器学习和深度学习大概是个什么东西,不会过分的去神话他,知道他们的优势,更知道他们的局限。
不同的境界对应不同的要求,简单点概括就是:
工程能力决定你的下界,理论能力与业务理解决定你的天花板。
3.3 定位好职业的岗位
目前来说,与机器学习和深度学习相关的岗位主要有如下几个岗位:
ETL工程师
BI分析师
数据分析师
数据挖掘工程师
AI算法工程师
AI平台工程师
ETL工程师:主要是做数仓相关的工作,可以粗浅理解为数据处理的一线员工。
BI:智能商务决策分析师,利用大数据工具做一些商业数据分析和数据的可视化。
数据分析师:通过大数据工作做一些数据的分析和可视化,业务更广泛。
数据挖掘工程师:对大数据进行建模工作,完成某些特定的业务场景。
AI算法工程师:开发机器学习,深度学习相关算法和模型组件,也可能会承担部分的建模工作。
AI平台工程师:主要对机器学习,深度学习的平台和组件进行开发工作,也包括模型优化工作(如使用CUDA进行模型改写)
实际上上面的几个职位并没有严格的界限,只能说有的更偏向于业务能力,有的更偏向于工程能力,有的更偏向于算法能力。
