版权归原作者所有,如有侵权,请联系我们

科学家是怎么教会机器懂得学习的

科普江苏
原创
传播科学知识,弘扬科学精神。
收藏

在漫长的进化长河中,人类凭借非凡的学习能力脱颖而出,成为地球上的主导者。我们的大脑,这个由数百亿神经元构成的复杂网络,赋予了我们学习、记忆、创新的能力。如果机器能够像人类一样学习,这将是多么不可思议的场景?它们将不再仅仅遵循预先设定的指令,而是能够在实践中汲取经验,自主进化,甚至超越人类。


图/视觉中国

人工智能(AI)的目标就是让机器具备智能,而机器学习提供了实现这一目标的关键方法。通过机器学习,计算机可以从大量数据中自动学习规律,从而具备感知、认知和决策的能力。

如今,这一曾经充满科幻色彩的设想已经走进了现实。科学家通过模仿人类大脑的结构,创造了人工神经网络,借此把学习能力赋予机器。2024年的诺贝尔物理学奖也因此花落机器学习领域。

那么,机器学习究竟是如何实现的?人工神经网络在其中又扮演了怎样的关键角色?让我们一同走进机器学习的世界,开启一场关于智能与学习的奇妙之旅。

机器学习与人工神经网络

“机器学习”一词中的“机器”,指的可不是工厂车间里的那些铁疙瘩,而是可以通过算法、数据处理来学习和适应的计算机系统。通俗点儿来讲,机器学习就是计算机通过数据分析实现的自我学习。举个例子,我们让计算机完成一个新的任务,它自己会从以往的任务数据中寻找规律,然后用这些规律来自我指导并完成新任务。这就是机器学习。


图/视觉中国

人工神经网络则是实现机器学习的关键,这个名字可能会让人联想到生物神经网络。实际上,人工神经网络并不是先人工培育生物神经网络再将其放入机器中,而是模拟人脑处理复杂信息的能力所构建的一些数字化模型。机器学习的过程,本质上就是这些数字化模型的学习过程。

接下来,我们以经典的人工神经网络模型为例,一起探索它是如何学习的吧!

【人工智能学者获得2024年诺尔物理学奖】

2024年的诺贝尔物理学奖颁给了美国新泽西州普林斯顿大学的约翰·霍普菲尔德和加拿大多伦多大学的杰弗里·辛顿,以表彰他们利用人工神经网络实现机器学习的基础发现和发明。概括地讲,就是霍普菲尔德模拟人脑神经网络发明了一个人工神经网络,辛顿发明了人工神经网络的训练算法。


生物神经网络、人工神经网络和机器学习拼图游戏类比图  绘图/作者

霍普菲尔德网络的拼图游戏

霍普菲尔德网络是模仿我们脑中的神经元和突触而发明的一种人工神经网络。人脑中有大量的神经元,它们通过突触相互沟通。这些突触负责传递信号,信号的传递效率正取决于突触的强度。举个例子,当你反复记忆一件事情之后,你每次想起它都会快速且清晰,这就是突触强度高的表现。霍普菲尔德网络就是由大量节点组合而成,每个节点可以看作一个简化版的神经元,节点间的连接则类似突触。节点之间具有可以调整的权重,权重则类似突触的强度。霍普菲尔德网络的学习过程就是权重确定的过程。

如果把霍普菲尔德网络的运作比作玩一场拼图游戏的话,那么,权重的确定就像是拼图的拼接制造过程。在拼图被制造出来之前,通常会有原图作为参考,然后把原图分割为拼图块,每个拼图块代表了网络中的一个节点,而拼图块之间的凹槽和凸起则代表了节点之间连接的权重。当权重确定好之后,霍普菲尔德网络也就完成了学习,可以开始“玩拼图游戏”了。


图/视觉中国

我们在玩拼图游戏时,往往会从一个边缘块开始,逐渐找到与之匹配的拼图块,直到整个画面拼凑完整。霍普菲尔德网络也是从给定的不完整输入开始的,这就像是拿到了一个已经拼成一角的拼图。霍普菲尔德网络会根据节点间的连接强度确定节点的值,就像寻找拼图之间的凹槽与凸起是否适配一样,最终找到能够重现整个拼图的最佳配置。

理论上说,只要有足够多的节点,霍普菲尔德网络就会拥有完美的记忆能力,且极其擅长模式补全。但是,霍普菲尔德网络也有一个致命的缺陷,那就是它无法创造出一个新的模式。

创造力的缺失,始终是笼罩在机器学习头顶的乌云。

【霍普菲尔德网络是这样“玩拼图”的】

我们玩拼图游戏时,会尝试将不同的拼图块放在某个位置以验证是否匹配,霍普菲尔德网络也会尝试不同节点的状态组合。

我们知道,一个系统的能量越低,就越稳定。霍普菲尔德网络会评估每次尝试的能量状态,这里的能量可以类比为拼图的完成度。能量越低,拼图越接近完成。霍普菲尔德网络的目标是达到一个低能量状态,这通常对应一个稳定的解决方案,即最接近原始记忆的完整图像。

随着霍普菲尔德网络不断更新迭代,它将逐渐锁定在某个状态,这个状态就是网络对输入信息的最佳重建。这就好比在拼图游戏中,尽管一些拼图块可能会丢失或错位,但是通过不断尝试和调整,我们最终能够拼凑出一个完整的画面。

神奇的玻尔兹曼机

为解决机器学习的创造力问题,玻尔兹曼机诞生了!它为机器学习注入了“创造”的灵魂!如果说霍普菲尔德网络是对数据的复原,那么,玻尔兹曼机就是在理解数据的底层逻辑之后对其再创造。

那么,玻尔兹曼机是怎么做到这一点的呢?

相较于霍普菲尔德网络,玻尔兹曼机多了两样东西:一是隐藏节点,二是随机性

先说说隐藏节点。玻尔兹曼机将一部分节点设为了隐藏节点,这些节点的值不会被显示,但是会影响自己与其他节点之间连接的权重。我们可以依旧用拼图游戏来解释,这部分隐藏节点就像是那些无色拼图块,虽然它们本身不会对拼图最终呈现的图像有影响,但是它们的凹凸限制了其他拼图块拼接的可能性,从而限制了最终拼出的图像。我们可以把这些隐藏节点看作玻尔兹曼机学习后总结的经验,这些经验会影响最终学习结果的呈现。

再来说说随机性。和霍普菲尔德网络一样,玻尔兹曼机每个节点的值也由连接的权重所决定。不同之处在于,霍普菲尔德网络的权重一旦确定,节点的值也就随之确定了,而玻尔兹曼机是一个随机值,决定这个值的概率则由权重以及“温度”参数决定。这里的“温度”描述的是玻尔兹曼机的随机性强弱,“温度”越高,则随机性越强,创造性也就越强,反之则越弱。我们继续用拼图游戏来打比方,这次的拼图块变成了双面的,拼图时,它可能是正面,也可能是反面。而它是正面还是反面的概率,由玻尔兹曼机的学习经验以及创造性强弱来决定。这样,玻尔兹曼机就可以用一套双面拼图创作出一幅与之前完全不同的作品了。


基于激光诱导击穿光谱技术与机器学习方法实现燃烧程度的在线监测(作者团队科研成果)

机器学习和物理学的跨学科融合

2024年,诺贝尔物理学奖的桂冠落在了机器学习先驱者的头上。为什么诺贝尔物理学奖会花落这一领域呢?

一方面,机器学习源于物理学,是物理学的一种延伸。霍普菲尔德网络的发明灵感就源于物理学中的自旋系统,其中原子自旋间的相互作用被用来模拟网络中节点的连接。霍普菲尔德网络能够通过能量最小化,从模糊的输入中重构出清晰的信息,类似自旋系统达到稳定状态的过程。玻尔兹曼机的发明则基于统计物理学,它模仿玻尔兹曼分布来描述粒子在不同能量状态下的概率,并通过优化能量函数来学习数据的概率分布。

另一方面,机器学习在物理学中已经有了广泛的应用,是物理研究的重要工具。机器学习不仅是进行数据分析的工具,也是推动科学发现与创新的引擎。

机器学习源于物理,又反哺物理。它不仅改变了我们分析和处理数据的方式,还为物理学研究带来了重大变革。在人类科技发展的宏伟蓝图中,机器学习已然成为其中一块关键拼图。随着科技的不断进步,我们看到更多的、适用于不同场景的人工神经网络相继诞生,它们如同一把把钥匙,打开了通往未知世界的大门。


图/视觉中国

【机器学习帮我们课题组干了哪些活儿】

在实验物理中,机器学习可以帮助我们从海量的实验数据中提取有价值的信息。以我们课题组的一些工作为例,借助机器学习模型,我们能够精确地监测和分析大气中的污染物,预测燃烧过程中的碳排放,快速识别和追踪大气中的挥发性有机化合物(VOCs)。机器学习还能从复杂的光谱数据中识别出特定的分子特征,从而精确地分析和理解 VOCs 的解离机制。这些应用不仅提升了我们团队的研究效率,还为相关研究者深入理解大气化学过程和气候变化提供了新的视角。另外,我们还利用机器学习算法对工业燃烧过程中的燃料消耗和污染物排放进行实时监测、分析。通过激光诱导击穿光谱技术和机器学习的结合,我们能够实时测定燃烧过程中的多种元素和化合物,包括那些对环境和人类健康有害的物质。结合机器学习模型,我们不仅提高了对燃烧过程的监控效率,还优化了燃烧效率,指导相关单位减少了污染物的排放。

(文/刘玉柱、周华森、兰晶)


内容来自:江苏省科学传播中心

内容资源由项目单位提供

评论
胡格吉乐NMGXYQ
大学士级
人工神经网络则是实现机器学习的关键,这个名字可能会让人联想到生物神经网络。
2025-12-04
俄体镇科普88888
大学士级
2025-12-03