于非教授是加拿大工程研究院院士(Fellow of the Engineering Institute of Canada),IEEE Fellow,Institution of Engineering and Technology(IET)Fellow,IEEE杰出讲者,IEEE车载技术学会理事(2016- 今),副主席(2017- 2019)。连续3年入选科睿唯安计算机科学领域“全球高倍引科学家” (2019- 2021)。Google学术20,000+次引用,H- index88。研究领域为互联自主智能,区块链,机器学习,自动驾驶及无线网络。担任多个国际期刊编辑。多个科研成果及论文获奖。2021年,于教授来到深圳,出任人工智能与数字经济广东省实验室(深圳)(光明实验室)执行主任。
他们用两张图的对比表达一个事实,当技术想抛弃你的时候,连声招呼都不打。用这个类比是为了说明将来自动驾驶也会像之前汽车代替马车一样快速的迭代。在前几年的时候,这些人用在融资和技术报告里去说服投资者:自动驾驶很快会实现。虽然理想很丰满,现实却是非常残酷的。大家可能听闻过国内外各种各样的例子,尤其是特斯拉、UBER和一些大厂出现的人为事故,包括引起广泛关注的特斯拉不能识别白色物体的问题,从而导致各类事故。Waymo的CEO也曾给大家泼了一盆水,Waymo是谷歌自动驾驶的子公司,所以Waymo在自动驾驶领域是有发言权的,从2009年开始,Waymo的自动驾驶车辆在真实道路上一共跑了超过2千万英里和在虚拟环境下跑了20亿英里。但是Waymo的CEO说自动驾驶几十年之内都不可能大规模的出现在真实交通中。问题出在哪儿?他最近评论,Technology is really really hard,技术太困难了。
当我们写文章时,性能提升高是特别高兴的事情。但大家不要忘记随之而来的“惨痛代价”。其中一个代价是复杂度大幅提升,从单层设计到跨层设计再到跨系统设计,每次考虑的参数越来越多。大量参数放在一起优化,虽然系统性能有所提高,但维数灾难也会伴随而生,也可以被称为第一个“诅咒”。另一个问题是Curse of Modeling(模型灾难),即「如何建模」。一层建模不复杂,多层建模、跨系统建模、跨不同网络建模却十分麻烦。几乎建模中都会产生问题,有句名言:All Models Are Wrong. 建模和真实环境有不可忽略的差别。所以有两个curses:Curse of Dimensionality和Curse of Modeling。
出现问题却不知原因。一方拥有大规模网络数据时能不能与他人分享?机器之间的share intelligence是需要特定语言、程序进行。我认为,目前的机器学习、人工智能有点像动物学习。2019年《Nature》的一篇文章提到:现在的人工智能也许不及动物。其中一个例子,也是我们中文耳熟能详的俗语“龙生龙,凤生凤,老鼠的孩子会打洞”。描述的正是生物基因里面已经存在的技能。一如文中:Learning is NOT very important. 这篇文章无异于给我泼了盆冷水。我们研究人工智能和机器学习也有一些时间了,如果AI不如动物,更不能和人相提并论。后来我希望能从书中获得答案,了解动物和人之间的根本区别。对此,《人类简史》解答得十分清晰。《人类简史》中有个颠覆性的观点:人和动物的主要区别就是「Gossip」,即"八卦能力"。为什么是"八卦能力"?人类可以传递并不真实存在的信息。像在公司里“传”闲话,WeChat、Keynote,甚至于今天的分享报告,都是一种“八卦能力”。我们只能和同类讲,不能跑到森林里和动物们做报告。“八卦能力”的说法不太正式,所以我找到另一种正式说法— Collective Learning(集体学习),Big history project (大历史项目)中许多历史学家同样疑惑:人为什么比动物更加聪明?回顾从大爆炸到人类进化到现在,得出基本结论就是Collective Learning。Collective Learning的第一步都是从数据学到的,数据驱动也是目前人工智能和机器学习的基本思想。
爱因斯坦说过:You cannot solve a problem on the same level that it was created. You have to rise above it to the next level. 这句话令我感触颇深。"当你遇到问题时千万不要在问题同等水平上思考它,应该提升到另一个层次上考虑",从而产生新灵感。这也是我今天汇报的主题,从"大尺度"考虑网联。许多媒体报道,包括Elon Musk也认为,人类历史上最大的发明创造是车轮。车轮的本质是质量的互联,它可以把有质量的东西快速、高效地在两点间传送。车轮促使交通网络的形成。第二个重要发明是能源的互联,以前的汽油和现在的电能,都属于能源互联。第三个重要发明是人们乐享其中的互联网,它是信息的互联。简而言之,“车”见证了人类历史整个技术的发展路线。从最初的运输质量,随后是使用能源,到现在的信息联网。以发展角度看,Abstraction(抽象)在一层一层的提高。我们心生疑惑,将来会如何进阶发展?疫情期间经过长时间思考,我写下一篇文章。在优化网络时的分层设计、跨层设计和跨系统设计,归根到底我们是在做一件事情,传递信息。这也是我们所说的Internet of information,让信息从A点移到B点。特斯拉发明了交流电,可以理解为是传递能量。当下信息发展过载,铺天盖地的信息无处不在地充斥着我们的生活,获取信息对现代人而言易如反掌。因此我在文中推断,这是一种intelligence(智能)的缺乏—— 拿到信息该如何运用。比如一个自动驾驶车,每天可以获得5T的数据,手握巨量数据,车技却依然不高。
那目前能实现move intelligence(传递智能)吗?暂时不能。但我们可以考虑用Blockchain(区块链)解决相关文通。《哈佛商业评论》曾发文,问历史中是否出现过类似Blockchain的事物?答案是有的,就是TCP/IP(传输控制协议/网际协议)。首先它们都是分布式的,分布式的优势在于集中式促进创新,也可以支持大规模其他应用,这是TCP/IP和Blockchain的相似之处。Blockchain应用繁多,我们的国家级报告里常把Blockchain视为数字经济的重要技术手段。我们近期有出版关于区块链的书籍——《区块链:原理、框架与应用》和《Blockchain Technology and Applications》;以及区块链研究的网站vDLT. io;还有区块链优化问题,我们提起Blockchain多是实现方面,优化方面较少。为什么人比动物更加聪明,答案指向一点—— Collective learning approach(集体学习研究),我们近期所做也是希望通过区块来实现集体学习。