您好,欢迎访问某某硅胶制品有限公司!

新闻动态
您的位置: 主页 > ayx新闻中心 > 新闻动态

上海AI实验室欧阳万里:科学家为Al for Science提爱游戏体育APP供

发布日期:2024-01-16 06:02浏览次数:

  爱游戏注册Nature今年的统计显示,有78%的科学家还没有将ChatGPT等AI工具纳入日常研究中来。

  从某种意义上来说,Al for Science这一新的研究范式其实早就帮科学家们搭好了利用AI能力的桥梁。

  科学家们观测到的实验数据,相当于已经为Al for Science提供了好的原材料,而怎么加工这些原材料,就是AI学者能够参与的地方。

  为了完整体现欧阳万里对AI以及AI学者助力科学研究(即Al for Science)的思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。希望也能给你带来新的启发。

  关于MEET 智能未来大会:MEET大会是由量子位主办的智能科技领域商业峰会,致力于探讨前沿科技技术的落地与行业应用。今年共有数十家主流媒体及直播平台报道直播了MEET2024大会,吸引了超过300万行业用户线上参会,全网总曝光量累积超过2000万。

  科学家们的优势和重点是高通量实验和计算,薄弱项是人工智能和机器学习,等于有了非常好的原材料但没有好的厨师。

  Al for Science面临的挑战和其他AI领域类似,都有小样本、少标注、数据形式多样等问题。

  谈到AI for Science,我以前做的是计算机视觉,现在为什么又来从事这样一个新的方向呢?

  我们有了大量的数据积累,科研推理给我们的经验,以及计算机仿真给我们带来的利用计算机模拟世界的能力。

  有了这样数据和理论,我们就可以利用人工智能对我们的数据进行分析,从里面找到合适的规律,从而进一步反演我们的世界,让我们能够利用计算机对世界做更好的预测,而且能够突破一些原来利用已有物理或者人们的知识而达不到的边界。

  它另外一个有效的地方在于,中国在自然科学方面相比以前有了很好的进展,但相对于国外的话,我们仍然有很多地方需要改善。

  而有了人工智能加持以后,我们希望跟中国科学家们一起合作,在自然科学研究方面实现弯道超车,在整个世界舞台上有更多的发展机会。

  当一个科学家花了很多时间积累经验、积累高通量实验,在人工智能方面花的时间相对于本身做人工智能学者来说是少的,毕竟人的精力总是有限。

  总结来说,自然科学家们在这方面准备了好的实验数据、理论、和计算方法,相当于为AI for Science方向提供了好的原材料。

  AI for Science领域希望AI学者加入进来和自然科学家一起合作,做出一道美味的佳肴。

  国外企业如大家知道的谷歌DeepMind,正在这方面发力;中国很多相应公司也开始往这方面进行相应的投入。

  再回到开始那个话题:对于我个人而言,我是一个学者,为什么我要从事AI for Science?

  关于问题重要性,在我个人看来,首先是它与其他AI领域具有类似的问题,比如小样本、少标注。这在语音和视觉里面经常被提到的,到了自然科学里面,变得尤为严重。

  举一个例子,大家都知道AI for Science有一个著名的工作是将蛋白质折叠进行预测,来自DeepMind。

  很多学者说未来它能获得诺贝尔奖,它做的事情是什么:当我有了一维的序列,边可以此得到蛋白质在空间结构上的三维结构。

  这样一来,我们得到样本数目的效率远比语言模型、视觉模型的效率低很多,这必然让我们在很多类似的科学问题上面临少标注的问题。

  样本量也会有少的问题,像我们模拟非常底层的分子动力学的时候,有时显微镜都得不到相应的样本,使得问题更加严重。

  自然科学从物理到生物到地球科学,有不同的表现形式,有非常底层的原子的表示、分子的表示,有基因蛋白等等的表示方式,如果来到地球科学又有大气的表示。

  当然,AI for Science本身也有一些独特的挑战,我需要跟科学家进行更多的合作,让他们帮我们建立更多的知识背景。

  同时需要注意,在这个领域,理论、实验以及计算三足鼎立,AI不完全最重要的,它是其中重要的能带来突破的一环。

  我们跟科学家合作的时候需要尊重以及了解到他们在这方面已有的知识,从而在合作过程中建立互信,互相尊重做出更好的工作来。

  在实验室,我们希望能够从微观原子分子层次看到最宏观的宇宙层次,我们这么做背后的原因是我们看到了自然科学本身是有共性的。

  既然在科学上本身有共性,我们以AI眼光看待从微观到宏观的自然科学的时候,实际上它们也有共性的问题。比如我前面所提到的少样本少标注。

  比如我们在RNA转录组方面的探索。RNA是一个AUCG一维的序列,我们有了这样的序列以后,希望从这样的输入信息对RNA本身有什么样的功能和结构进行预测。

  我们做的是结构预测这件事情,但结构样本的数目目前不足六千,如果你能得到重要的RNA结构又是刚才说的故事,一年发一篇Nature文章。这意味着只有顶尖学者才能得到其中的1—2个样本,非常少。

  如果要处理好这个问题——RNA本身有很多序列,不知道功能的序列很多。我们可以利用不知道的标签数据做无监督学习,把数据本身当成标注做个自监督的学习方法,就能够得到预训练的模型。

  这个问题中国早在秦汉时期就开始尝试感知气象了,当时利用的设备叫做相风铜乌。首先感知到气象才能预测到气象。

  中国古代预测气象依靠什么?观天象,钦天监就是干这件事情的,但在那个时候主要依赖的是人的判断,而不是利用科学模型。

  早在100多年以前,来自于欧洲和美国的两位学者确实提了,经过一百年的探索以后大家发现,每经过十年的研究,能够将有效预报的能力提高一天。

  我们的实验室也是,基于多任务学习的印度洋偶极子预测,首次将印度洋核心气候指标的可用预报技巧提前至7个月。

  该模型输入全球当前时刻五个气象要素,温度、湿度、风速等,利用这些要素来预测下一个小时的温度、湿度等。然后把它的结果和数据放到风乌里面再预测下一个时刻,下下时刻。

  并且还可以利用历史上的数据,比如前年的数据去预测去年。这个时候我们数据本身就是要预测的标注了,它的逻辑跟做疾病预测是类似的。

  以往方法只是认为它们是跟图象里的RGB一样,直接把它们全部对接到一起,给到一个模型就行。然而我们利用多模态方法做这件事情,效果很好。

  另一方面,我们认为既然这是多模态问题,那就可以类似地来看输出,让它成为多任务的问题,利用多任务学习方法可以自动调节各个不同要素的重要性。

  最终对比DeepMind在Science上发表的GraphCast模型,我们的方法在80%指标上都获得了更好的性能。

  此外,我们也是首次让有效预报天数超过10天的气象预报模型,利用我们的方法可以只用一张GPU一分钟生成未来14天全球所有的地区的高精度气象预报结果。

  右上角是不同预报模型的结果,包括来自于欧洲、美国等等的,右下角结果是最终他们测定的真实结果。

  另一方面,第三方机构对于前面一年和最近以来在中国登录的所有台风预测也做过统计,结果发现,我们方法相对已有的物理方法以及AI方法都是更好的。

  总结而言,AI for Science是跟其他领域有着类似问题的领域,AI for Science在未来将会对于整个自然科学领域带来更深刻的影响。

  在这方面我们希望能够与自然科学方面顶尖的学者进行合作,来做出来更多的突破工作,也欢迎大家联系我们进行合作,谢谢大家。

  本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。

标签:

Copyright © 2013-2023 ayx爱游戏有限公司 版权所有HTML地图 XML地图txt地图 备案号:赣ICP备2021007274号-1

020-88888888