人工智能目前比较火的领域是机器学习,而机器学习中一个表现比较好最近也证明行之有效的领域是深度学习。
深度学习之所以叫深度,是因为它有很多的表示层,层层过滤。它是从数据中学习表示的一种新方法,强调学习越来越有意义的表示的连续层(layers)。深度学习代表了连续层表示的思想。有多少层对数据模型有贡献被称为模型的深度。
深度学习模拟了人类学习的过程,它属于一种工程学,而不是类似数学和物理的科学。以人类为例,人类去分辨一只动物是猫,也是一个习得的过程。通过看到猫的实物、猫的照片、猫的素描、猫的卡通形象,各个各样千差万别的猫,总结出某些特定特征和规律的动物是猫。然后,人类看到一只新的符合自己总结特征标准的动物,从而称它为猫,旁边的家长或者其他人给出正面或者负面的反馈,再进行修正和学习。机器通过深度学习来识别猫的过程也是类似,通过大数据量的训练集去总结响应的规则,来尝试识别猫。然后去测试集验证自己学习到的规则是否适用。
这里就涉及到过度学习的问题,如果机器在训练集中学习太久,就可能陷入闭门造车的恶性循环,虽然花费了大量的时间和算力学习,但却可能走向歧途,对训练集的特征量拟合太深,反而对测试集的拟合有较大偏差。所以,如何把握好其中的程度是考验深度学习算法的一个指标。
深度学习算法对普通大众来说比较神秘,可能会以为其无所不能,从而陷入狂热中。实际上,深度学习有其擅长的领域,也有其不擅长的领域。目前应用比较成熟的领域有:
- 接近人类水平的图像分类
- 接近人类水平的语音识别
- 接近人类水平的手写文字转录
- 更好的机器翻译
- 更好的文本到语音转换
- 数字助理,比如谷歌即时(Google Now)和亚马逊 Alexa
- 接近人类水平的自动驾驶
- 更好的广告定向投放,Google、百度、必应都在使用
- 更好的网络搜索结果
- 能够回答用自然语言提出的问题
- 在围棋上战胜人类
人们仍然在探索深度学习能力的边界。已经开始将其应用于机器感知和自然语言理解之外的各种问题,比如形式推理。如果能够成功的话,这可能预示着深度学习将能够协助人类进行科学研究、软件开发等活动。当然,通过深度学习,让机器拥有人类的意识很难,短期内估计难有突破。就好像大多数的人类,都只是一句躯壳,他们以为自己拥有灵魂,其实只是别人的画板而已。机器通过深度学习可以模拟和逼近人类,却很难突破自己的边界。
人类学习和深度学习的区别,是人类有情感和直觉,从A到B,中间没有逻辑处理,直接到达,自然而然。深度学习只是模拟了一种简单的训练过程,在大的数据量和运算量的基础上,大力出奇迹,获得了一定程度上阶段性的成果,未来的道路还很长。
还是那句话,道路是曲折的,前途是光明的,深度学习已经开始应用在写读后感上,未来的事情谁知道呢?