《麻省理工科技评论》2021 年 “十大突破性技术” 发布会在杭州余杭未来科技城圆满举办!

作者:联汇科技     时间:2021.03.01

2 月 24 日,《麻省理工科技评论》2021 年 “十大突破性技术” 发布会在杭州余杭区未来科技城举办。浙江大学滨江研究院人工智能 OM 研究中心主任、联汇科技首席科学家赵天成应邀参加并做了精彩的主题分享。

从 2001 年开始,《麻省理工科技评论》每年都会进行 “十大突破性技术” 的评选。今年恰逢《麻省理工科技评论》“十大突破性技术” 发布 20 周年,“十大突破性技术” 第一次在线下首发。

1-修改尺寸.jpg

图 | 《麻省理工科技评论》2021 年 “十大突破性技术”


在发布会的开始,杭州市委常委、余杭区委书记张振丰、《麻省理工科技评论》中国联合出版人刘炯分别致辞。来自高校和企业的十多位专家学者对本次评选的 “十大突破性技术” 进行了解读。




任奎:数据信托让数据更安全

2-修改尺寸.jpg


3-修改尺寸.jpg

图 | 浙江大学网络空间安全学院院长任奎


浙江大学网络空间安全学院院长任奎介绍,数据信托是对数据进行管理和决策的新概念。个人和团体将其数据委托给数据信托受托人,按照预设的隐私策略或者条款进行管理。


过去十年,新技术的发展攫取了越来越多的数据,为我们提供多元化的数据服务,同时数据安全和隐私问题变得更加严重。在此背景下,数据信托的目标是帮助用户重新获得数据控制权,保护用户数据的所有权、知情权、选择权以及隐私权。


任奎介绍,数据信托有四个角色:受托方,作为可信第三方或联合体保护数据拥有者在共享数据过程中的权益;协调者,平衡数据拥有者与使用者之间的诉求冲突,并对法律法规的制定提供建议和帮助;仲介者,降低数据管理与共享的成本和门槛,引入更多数据共享参与者,发挥数据的更加社会价值;执行者,决定哪些实体在荷重前提下的数据访问内容与方式,并实施监管与追踪。


任奎认为,数据信托实践可以在三个维度上进行。


第一,在政策法律法规维度上,通过研究和实践对法律法规具体的落地和实践提供支撑、反馈,以便制定更符合实际要求的政策法规;第二,在机制和系统设计维度上,数据信托需要提供数据拥有者和使用者之间的交互和信任,进行数据确权。此外,数据价值、流通方式的确认,数据如何使用、认证、溯源、追责,都要进行机制的设立。第三,在技术维度上,研发数据授权、使用、托管、交易等技术为数据信托提供保障。


卢策吾:多技能 AI 让机器像人一样拥有智能

4-修改尺寸.jpg

图 | 上海交通大学研究员、博士生导师、非夕机器人首席 AI 科学家卢策吾


上海交通大学研究员、博士生导师,非夕机器人首席 AI 科学家卢策吾对多技能 AI 进行了解读。他介绍,此前的人工智能研究一般为单一技能,比如计算机视觉语言和机器人等都属于单技能 AI。单技能 AI 一般在某一个数据上做得特别好,但在其它方面存在较大短板。


多技能 AI 是近些年人工智能研究的趋势之一,目标是让机器可以像人一样拥有智能。单独的技能无法使机器获得人的智能。卢策吾举了一个例子:比如说从视觉的角度,机器看到了一个杯子,这样的技能只是模式的识别。如果机器要真正理解 “杯子” 这个概念,要有很多的技能。这样也就解释了深度学习研究遇到的难题:即使机器识别了非常多的图片,学到了视觉概念,但还是不能像人一样稳定地识别图像。


人工智能领域上一轮的深度学习研究更多是模式识别,此后则需要走向对概念的理解。卢策吾说,多技能 AI 慢慢在此研究领域得到了重视,像 OpenAI、Facebook 这样的机构会越来越多地研究这个问题。他认为,多技能的代入带来了方法论的改变,其发展本质是这个领域的研究者在慢慢思考智能的获取和表达。在多技能或者多感官的背景下,研究将人工智能往前推一步。


朱建科:TikTok 推荐算法满足三方需求

5-修改尺寸.jpg

图 | 浙江大学计算机科学与技术学院教授朱建科


20 年前,最具突破性的进展是搜索引擎,其解决的是数据黑洞问题,即如何在庞大的互联网上找到对应的网页。2020 年最火热的词是短视频。浙江大学计算机科学与技术学院教授朱建科说,TikTok 流行的背后是它的推荐算法满足了用户、广告商、平台三方需求。


满足用户需求,让用户找到感兴趣的内容是核心。朱建科说,视频检索和文本检索不同,视频的维度很高,有标题、语音、文字,还有视频本身。视频的模态比文本复杂,文本只要去做好标准的技术,而解决短视频的推荐需要多轮迭代,让用户在检索过程中找感兴趣的内容。


视频的发布和传播需要大量的计算资源。字节跳动的后台有一个知识图谱,通过设计复杂的算力,深刻挖掘用户的需求。短视频映射到数百上千个标签,通过这些标签,短视频推荐回到了传统的文本推荐,广告商通过对视频的标签进行竞价,实现流量变现。这是一个三赢的策略,用户体验了服务,广告商获得了注意力,TikTok 实现了短视频内容的分发,并实现了流量变现。


朱建科介绍,TikTok 推荐算法涉及复杂的计算。视频内容分析包括视频的标题、内容、声音、标签,此外,还包括设备的地理信息、底层的技术及自然语言的理解。通过视频内容分析、音频分析、视频标注,最后每一个视频都对应知识图谱里面的标签。


此外,TikTok 推荐算法还解决了吸引新用户、确定用户画像的问题,朱建科说。


邱锡鹏:GPT-3 是自然语言处理领域的新突破

6-修改尺寸.jpg

图 | 复旦大学计算机科学技术学院教授、博士生导师邱锡鹏


GPT 是 Google 提出来的一种参数非常多的转化器、变压器模型。复旦大学计算机科学技术学院教授、博士生导师邱锡鹏认为,GPT-3 代表自然语言处理领域新的技术突破。


一般来说,GPT 这种模型需要在大数据上进行训练。GPT-3 就用了非常多的数据,并且进行语言模型训练。邱锡鹏介绍,与以前的模型相比,GPT-3 实现了参数量指数级的上升,达到了 1700 多亿的参数量,在语言生成中的能力令人惊叹。


此外,GPT-3 改变了机器学习模型的范式。GPT-3 不使用微调的方式,而直接给模型输入一些例子,通过这些例子改变模型的内部状态,从而生成所需要的答案。这种创新非常接近于所谓人的智能,也就是研究人员一直追求的通用人工智能。GPT-3 在某种程度上可以通过大的算力以及大的数据达到一定的通用人工智能的能力。


不过,GPT-3 到目前为止还是仅限于论文上,想要使用到真正的生产环节仍非常的困难,邱锡鹏说。目前为止,GPT-3 的效果没有得到充分的验证。如何把错误率降低,分析它为什么能够工作,GPT-3 还隐含了哪些知识,是改进视觉知识还是语言知识,都需要进一步的研究。他补充道,GPT-3 本身还是单模态,只是在语言端。如果要达到某种通用人工智能,模型必须是多模态,因此我们还需要进一步去研究跨模态的通用预训练模型。


赵天成:从四个角度解读 GPT-3

7-修改尺寸.jpg

图 | 浙江大学滨江研究院人工智能 OM 研究中心主任赵天成


浙江大学滨江研究院人工智能 OM 研究中心主任赵天成从四个角度对 GPT-3 进一步解读。


GPT-3 是一种语言模型。语言模型提出于 1940 年,就是在一段文字里把一些字隐藏,看这个模型能否把这个空缺填出来,赵天成解释说。更严格来说,GPT 是一个基于 Transformer 和预训练的语言模型。


赵天成说,在 GPT-3 之前,GPT-2 对深层内容来说表现已非常好。与之相比,GPT-3 共有三个特点:更大、更贵、展现出了语言模型可以作为小样本学习的多面手的潜能。首先,GPT-3 比 GPT-2 大了 100 倍,这意味着可以给它配更多数据,潜力更大;因为它很大所以更贵,训练一次该模型耗费约 1200 万美金。投入的增加使得计算的能力加强,损失函数的值不断下降;最后,它变成了一个小样本的多面手,可以在不用再做任何精调的情况下解决其它任务。


赵天成介绍,过去做机器学习可能觉得模型不能太大,而 GPT-3 改变了这个观念。在 GPT 这个场景里,当模型不断增加,它的性能是从质变到量变的过程。他认为,GPT-3 展示了 AI 一种新的范式:它告诉我们,未来可能有一个通用的 AI 底座,或许一个普通的研发人员也可以实现低成本的落地应用场景。


他认为,在目前大数据计算能力不断攀升的过程中,我们远远没有达到算力可以发挥的作用,所以更大的模型会不断地被发掘出来,因此未来的 GPT-4 可能会变得更大。不过,它也可能会变得很小,以便部署到手机或服务器上。最后,GPT-3 本身是一个随机的、概率性的语言模型,未来这类模型将会变得更可控。


王岩:远程技术助力在线教育

8-修改尺寸.jpg
图 | 作业帮首席架构师王岩

作业帮首席架构师王岩以作业帮为例,介绍了疫情期间远程技术在在线教育领域的探索。


疫情给在线教育提出了两大挑战。

了解更多产品详情 点击留言