点击上方卡片关注👆7 月 14 日,第三届「知乎 AI 先行者沙龙」在深圳举行。知乎邀请众多 AI 行业从业者、专家、学者齐聚一堂,用最前沿的观点和最专业的思考,共同探讨大模型应用的新风口。本届沙龙以「探航」为主题,知乎高级副总裁、社区业务负责人张荣乐出席活动并致辞,香港大学计算与数据科学学院院长马毅、RWKV元始智能联合创始人罗璇、粤港澳大湾区数字经济研究院基础软件中心首席科学家张宏波、OPPO AI 中心技术战略规划总监陈晓春,分别围绕人工智能的本质、端侧模型与硬件的结合等议题进行主题演讲。 其中香港大学计算与数据科学学院院长马毅的演讲主题为:探索智能的本质以下为演讲实录。 各位知乎的朋友大家好,很高兴能够在知乎 AI 先行者沙龙与大家相会,因为行程安排紧张,很遗憾没有办法来到现场和大家面对面的交流,不过我也会开通一个知乎账号,未来有机会在知乎上跟大家进行更多的相互学习和探讨。 知乎运营的老师告诉我,前段时间有一篇关于我的媒体采访文章在知乎社区引发了广泛的讨论,最近也陆续有很多网上的朋友通过各种渠道告诉我,说他们开始对智能的原理性的东西感兴趣,有越来越多的年轻学者愿意思考,做一些更深层次的研究,这让我非常受鼓舞,也让我决定多讲一讲我个人对智能本质的看法和思考,所以也就有了今天这个演讲的题目「探索智能的本质」。智能或者人工智能在最近几年引起大家广泛的关注,发展也非常快,大家对智能也有很多不一样的理解,今天也想跟大家讨论一下这方面的问题。 我叫马毅,是香港大学计算与数据科学学院的院长,以前在加州大学伯克利电子工程与计算机系任教,最近也创办了一家公司,探索智能技术的公司,叫做忆生科技。
一旦这件事情明确,第一我们要学什么,第二是通过逐步迭代学习,事情就变得非常清晰了。比如说这个目标函数跟我们优化的编码率是相关的,我们要对得到表示的编码率进行优化。学过优化的同学就知道,逐渐优化的方法,就是做简单梯度下降。 turns out 深度网络的本质就是在实现这个逐步迭代优化的梯度下降算法。每一层就跟我刚才的图像一样,就是一步一步逐步的在进行优化,把数据的分布、数据的结构找到,然后逐渐地朝着我们所需要的方向去变化,所以每一层都是让这个分布变得越来越好。
这是让编码率减少,同时让它学到的表示变得越来越好。如何保证你最后得到的记忆是正确的呢?你不能通过压缩损失了一些信息,你不知道。其中一个方法来检验你学到的记忆,或者学到的数据的结构是正确的,一个简单的解决方式就是用它预测回到外部世界,帮它预测你所记忆下来的规律,是不是能够正确的预测现实世界会发生的事情,也就是所谓的解码,或者叫做生成、预测。 从外部的信号进入大脑,我们进行识别、记忆,然后再通过我们的识别或者记忆,对下一步会发生的事情进行重复、仿真、预测或者重现,这就是一个生成的过程,或者在数学上叫做解码的过程。整个过程从外到里、从里到外,就是一个自编码的过程,能帮助我们通过内部世界的模型,对外部世界进行预测。现在训练一个神经网络系统,从 X 到 Z、Z 到 X,我们提供相关的数据,让整个系统进行全局优化。但是在自然界,我们有时候并没有这个 option,相当于我们在训练一个神经网络的时候,对这个网络来说,我们是上帝,我们在纠正它的错误。在自然界,因为动物没有人去教它,它在一个环境中必须自己学习,这种机制是怎么回事呢?
为什么需要严格的定义,把这些理论开发出来?因为没有理论的智能研究,就如同一群瞎子在玩一个黑盒子,盲人摸象,大家就会说一些非常不靠谱的话,认为自己看到的那一块就是智能的整体、系统的整体。我们只需要深度网络,「Deep network is all you need」,「Reward is all you need」,「Attention is all you need」,「Foundation model is all you need」,一些非常片面的思想就会变得非常流行。当一个东西是黑盒子的话,大家就会感到它很神秘,比如大家说 ChatGPT,有人说大模型智能将超过人类,甚至已经具有人类自主意识了,会像原子弹、病毒一样可怕,会毁灭人类,现在不光是大众有这种概念,甚至有一些头部的研究人员也有这种观点。实际上从我们现在的了解,目前为止所有的人工智能算法,包括深度网络在做什么呢?无非在做数据的压缩而已。
今天的演讲给大家梳理一下人工智能的发展历史以及相关的概念。我们非常兴奋地看到最近这几年的发展,实际上找到一个完整的甚至统一理论的基石是可能的。它也开始慢慢揭示了智能的本质,它的最本质的一些计算机理、原则,非常统一的原则和机理,只有当我们把这些原则和机理真正揭示出来,理解清楚以后,才能彻底地把网络智能、机器学习、机器智能的本质搞清楚,就像理查·费因曼讲到的「What I cannot create,I do not understand」(如不能自己创造,则无法真正理解),一定要通过第一性的原理,通过演绎的方法,把整个学习系统计算机理和机制搞清楚。只有我们搞清楚,真正理解了,才能创造新的东西,甚至才能远远超越目前的人工智能的系统。