深度学习是最好的AI解决方案？并非如此

腾讯数码 2017-07-19 作者：Guti

　　深度学习是一种人工智能领域的新方法，它是一种非常活跃、并且正在快速发展的全新领域。我们可以期待在未来的几年里，这种技术将会越来越多的出现在市场上。不过，现在市场对于深度学习技术的概念炒作已经有点泛滥，甚至变成了一种流行语，这容易导致人们误以为其它人工智能算法是独立于深度学习技术存在。毕竟从表面意思上看，不是在深度学习，就是“肤浅”的学习，不是吗？

　　在网络安全方面，我们使用过各种技术，比如统计、概率理论和多种机器学习算法（深度学习就是其中一个例子）。通过查看用例和可用的数据，选择最佳的算法。我们从不同的来源获取数据，包括App日志和源代码等，根据我们对数据集和用例的理解选择正确的算法。这个过程可以通过手工完成，由于使用的是一个相对较小的数据集，因此所检测到的行为通常变化非常微妙。比如从源代码的审计日志中检测到内部的威胁，而深度学习是人工智能的另一种特殊技术。

　　简单的说，深度学习是一种机器学习算法，通过使用大量的、多层的连接过程来学习，并且将这些处理器数据暴露出来。在不同的行业中，深度学习处理正在逐渐成为可能，因为我们可以访问大量的计算能力和处理单元，比如云和GPU这样的技术。有了这个庞大的数据集，想要深入研究深度学习技术就变得很快速。恶意软件检测就是一个很好的例子，而目前很多安全初创公司都正在做这件事。

　　使用深度学习技术检测恶意软件非常有意义，因为我们已经有了一个庞大的数据集来描述恶意软件的特征，而对于内部的威胁虽然不能说有同样的道理，但是目前还灭有获得足够的信息，从公司经历的攻击类型就能看出。通过一些基于实际事件和模拟数据，再加上深度学习网络使用，日志文件可以和内部威胁互相对应。尽管这可能会随着时间的推移而逐渐改变，如果没有大量的数据来支撑的话，深度学习技术就会过度解读内部威胁。

　　未来，对安全网络进行深度处理的能力，可以自动调整和增加数据量的连接，而这将改善学习的过程。特别是将使我们能够自动化并使用网络来专门研究某些领域。网络可以了解到哪些数据要比其它数据更容易预测，从而减少了对人类数据科学的依赖，并且对整个过程进行指导。这种“自动学习”对于安全性来说是非常重要的一件事。通过深入学习，安全系统可以通过尝试数十亿种组合，以及数百万的结果进行观察，而获得更准确的结果可能会让整个业界变得兴奋不已。

　　与此同时，深度学习系统也很难直接建立起来，这种技术不仅复杂，而且成本很高，许多所谓的参数在没有大量经验或者实验的情况下很难预先确定。与其它更直接的机器学习模型相比，训练一个深度学习模型需要几个数量级的计算成本和能力。比如逻辑回归模型非常简单，可以在一台机器上运行一个小型数据集，而对于很多分类任务来说，它仍然是一种非常有效的方法。而通过硬件加速的进展（包括GPU和最近谷歌的TPU），可以降低计算单元的成本。在今天，深度学习系统仍然是最昂贵的机器学习方法，而这可能会使这种方法超出大多数用例的范畴。

　　因此，深度学习仍然只是众多机器学习技术中的一种。这是一个非常有前途的技术，并且针对的是特定的问题，但并非万能。如果仅仅因为一项技术使用深度学习，并不意味着其它传统的人工智能和机器学习方法就没有实用价值。

　　人工智能是一种多用途的技术，不仅是安全领域，还包括其它行业，并且能够不断学习、迭代和改进。

责任编辑：王超

上一篇：谷歌新AI项目：把街景照片变成专业风景照

下一篇：太阳能除草机器人做你家后花园的园丁

科普中国APP 科普中国微信 科普中国微博