探索 | 用“AI+算力”为地球生命修“家谱”!“人工智能+”科学技术 ,催生更多创新突破
2025-09-02 20:42  来源:交汇点新闻  作者:张宣,杨易臻,蔡姝雯  
1

国务院近日印发的《关于深入实施“人工智能+”行动的意见》(以下简称《意见》),部署了“人工智能+”6大重点行动,即“人工智能+”科学技术、产业发展、消费提质、民生福祉、治理能力、全球合作,推动人工智能与经济社会各领域各行业广泛深度融合。

《意见》将“人工智能+”科学技术列为六大重点行动之首。这一领域究竟涵盖哪些内容?“人工智能+”科学技术又将如何改变科研本身?《科技周刊》记者采访了江苏四支科研团队,探访人工智能深度融入科学发现的全过程。

视觉中国

【释义】

什么是“人工智能+”科学技术?

“人工智能+”科学技术的核心,指向一个在全球已形成共识的概念——“科学智能”(AI for Science)。它被视为一种加速科学研究的新型范式,对未来科学技术和产业发展带来深远的影响。

中国科学院院士鄂维南曾表示:“人工智能与科学研究的深度融合,正在孕育一场前所未有的科技革命。AI for Science的本质是通过人工智能解决过去无法解决的重大科学难题。”他举例说,蛋白质结构预测这一生命科学领域的“世纪难题”正是通过AI技术取得了突破性进展。

8月在南京举办的第九届未来网络发展大会开幕式上,中国工程院院士李国杰发表对“AI for Science”的观点。他认为,人工智能技术是“认知的发动机”“科学研究的望远镜”,所以对待人工智能更好的办法是利用人工智能去做科学研究,发现新的技术、新的材料、新的方法,而这些新的方法用到产业上,可能得到更大的效益。

根据《意见》,“人工智能+”科学技术主要在三方面发力。首先是加速科学发现进程,这主要是指“从0到1”的重大科学发现进程,加快科学大模型建设应用,推动基础科研平台和重大科技基础设施智能化升级,打造开放共享的高质量科学数据集,提升跨模态复杂科学数据处理水平。

其次,是驱动技术研发模式创新和效能提升,这主要指“从1到N”技术落地和迭代突破,包括支持智能化研发工具和平台推广应用,加强人工智能与生物制造、量子科技、第六代移动通信(6G)等领域技术协同创新,以新的科研成果支撑场景应用落地,以新的应用需求牵引科技创新突破。

此外,《意见》更提出“创新哲学社会科学研究方法”,将AI引入人文社科领域的研究。鼓励深入研究人工智能对人类认知判断、伦理规范等方面的深层次影响和作用机理,探索形成智能向善理论体系,促进人工智能更好造福人类。

【案例解析】

人工智能+地质古生物学

——“三全团队”为地球生命修“家谱”

生命起源与演化是人类永恒的主题。在中国科学院院士、南京大学地球科学与工程学院教授沈树忠带领下,江苏的一支顶尖科研团队正利用人工智能技术,重现几十亿年地球生命的“家谱”。

这支团队是目前全球少数同时掌握古生物大数据、算力和先进算法的“三全团队”。去年6月,他们历时10年的项目“泛大陆关键转折期生物与环境演化”,荣获国家自然科学奖二等奖。

为了精准刻画3亿年前地球生命与环境的演化,团队从2006年起,将全国各地各类文献中搜集的二十多万化石信息全部录入数据库,力图更精准地记录生物多样性的演化过程。

团队自主开发了基于人工智能算法的新一代定量地层自动对比软件,借助“天河二号”超级计算机的强大算力,重建了全球第一条高分辨率的3亿多年海洋生物多样性演化曲线,精细刻画了晚古生代生物多样性的演变过程。

这一成果成功验证了人工智能技术在古生物研究中的潜力,也为团队向更古老、更具挑战的地球早期生命史发起冲击,奠定了坚实的方法论基础。

去年12月,南京大学地球科学与工程学院研究员唐卿研究员和沈树忠院士等联合中外多家科研单位,在顶级学术期刊《Science》上发表了另一项重要研究成果,将研究的视野推向了20亿至5亿年前的地球早期,填补了地球早期生物多样性演化的研究空白。

团队耗时6年,创建了目前全球数据最全、信息量最大的地球早期古生物地层数据库。该数据库录入大概260多个剖面,13000多个数据点以及180多个同位素年龄的数据。通过统计全球范围的数据,利用超算和人工智能等分析方法,首次绘制了地球从20亿年前到5亿年前的高精度生物多样性演化历史。

沈树忠表示:“用大数据重建十几亿年以来零散、片段式的化石数据,远远超出了以往所有分散式研究,对于认识当今地球面临的全球变暖、生物多样性减少等问题非常有帮助。另外,该研究对于我们探索地外生命是否存在等问题,同样具有重要的科学意义。”

人工智能+生命科学

——生物信息获取从“天级”缩短到“分钟级”

蛋白质预测大模型示例图

传统的抗体研发,往往需要科研人员花费数月时间,在实验室里反复进行实验,就像在茫茫大海里捞针,而且很难兼顾多维度参数的优化。但借助先进的人工智能生命科学大模型,科研人员一天之内就能对上万条序列进行预测筛选,快速找到最有潜力的抗体序列。

这款大模型就是全新一代生命科学基础大模型——xTrimoV3,由位于苏州国际科技园的百图生科公司研发。

用人工智能为生命科学领域带来巨变,大大加速了科学发现的进程。“大家熟知的语言大模型能聊天、写文案,而xTrimoV3是生命科学领域专属‘超级大脑’。它的‘思考神经元’参数达2100亿,能帮助人类快速发现所需的生物信息。”百图生科总裁邓永富表示,“xTrimoV3也是全球规模最大的全模态生命科学大模型。”

邓永富解释,通俗来讲,xTrimoV3是装满生命科学知识的“图书馆”和“解题高手”,覆盖蛋白质、DNA、RNA等七大生命科学主流模态。在蛋白质领域里,xTrimoV3的千亿级参数让分析更精准,能快速找到所需蛋白质,帮科研人员避开无效探索;在DNA方面,其序列长度跃升至128K,以前难解读的超长序列生命信息,现在能够快速解码。

具体到产业上,xTrimoV3能够提高新药研发的速度。“过去研发新药像摸石头过河,需海量数据、数年时间与数亿美金,效率低、成本高。”邓永富介绍,xTrimoV3能从海量数据中总结生物规律,预测前沿问题,让新药开发数据量明显下降。特别是在复杂疾病研究上,过去找肿瘤关键基因靶点耗时耗力,现在xTrimoV3能深度挖掘肿瘤细胞基因组数据,快速锁定靶点,为抗肿瘤药物研发指明方向,省去无效工作。

目前,xTrimoV3已助力开发20余种前沿抗体和酶,挖掘10余个创新靶点,成果进入临床前研发;生物制造领域,其支持的AI生成生物酶项目,帮企业提效降本,推动产业高端化,比如百图生科与中国农业科学院合作开发的“智能育种知识助手”,成功将酶相关信息的获取从“天级”缩短到“分钟级”,使得研发效率明显提升。

人工智能+气象学——

强对流预警平均提前量达46.3分钟

前不久,中国气象局发布全民早期预警中国方案“妈祖(MAZU)”,构建包含多灾种预警的全球早期预警服务网络。而早前,气象预测大模型就在江苏实现了应用。

江苏省气象台人工智能+气象预测平台

“近两年气象大模型在天气预报领域应用越来越多,应用覆盖面快速提升。江苏省气象台是国内最早接触、应用并参与 AI 气象预报技术的气象业务部门之一,目前包括大模型在内的 AI 技术已经在天气预报的多个环节中使用。”江苏省气象台高级工程师庄潇然介绍,从数小时内的短临预报,到 3-7天的中短期天气预报,都已用到。

比如,强对流天气具有非线性、尺度小、局地性强等特点,传统数值天气预报存在局限性,早上8:00的数值预报可能要到10:00甚至更晚才能看到结果,存在两三个小时的预报盲区。“强对流天气往往突然就发生了,我们依靠传统数值预报方法没办法实现强对流天气的提前预警。”

基于大量气象数据,江苏省气象台构建了以“AI+气象”为核心的强对流短临预报技术体系。该体系利用雷达、卫星、全省2000多个地面自动站以及闪电定位系统更新的海量数据,采集频率达到5分钟以下,建立了高精度预报模型。“我们的AI模型每分钟可完成全量计算,从数据采集到预警发布仅需10分钟。”

目前,通过该技术体系支撑,江苏强对流预警平均提前量达到46.3分钟。另外,针对10级以上破坏性强对流大风,预警提前量最高可达50分钟。“我们已经将分辨率提升到一公里,甚至在局部重点区域分辨率达300米,技术水平达到国内领先。这得益于海量数据的支持,AI的工作就是从中提取演变规律。”

庄潇然举例说明,在2024年7月4日的强对流天气过程中,系统提前1小时锁定泰州至盐城南部区域,准确预警11级雷暴大风天气,为防灾争取到黄金时间。在该事件中,最大风力达32米/秒,AI预警较传统手段争取到更多提前量。

人工智能+生物医学工程——

医学模型从“专才”到“通才”

想象一下,在基层医院,AI辅助诊断能够媲美资深医生的水平,帮助医生尽早筛查出恶性病变;过去医生需要花费几十分钟的复杂影像诊断,如今AI模型在几分钟内即可精准处理。这些正是中国科学院苏州生物医学工程技术研究所(以下简称“苏州医工所”)生医工人工智能研究室的团队正在探索的方向。

生医工人工智能研究室于去年9月组建,包含多个人工智能方向团队,旨在系统性地推动“人工智能+生物医学工程”领域的研究突破,面向智能医学成像、生医材料智能设计、脑机接口调控等方向的人工智能关键核心技术与系统研发。

该研究室主任戴亚康团队专攻主导研发的肿瘤专病诊疗大模型,今年已经与省内多家医院在合作试验中应用,在前列腺肿瘤、肝肿瘤、肾肿瘤的良恶性与恶性程度鉴别诊断等多个场景中发挥作用。

“过去的人工智能模型像‘专才’,一个模型只能诊断肺结节或肝肿瘤等单一病种。现在我们的目标是训练一个‘通才’大模型,就像是一位经验丰富的全科医生,能够处理来自不同器官的肿瘤诊断任务。”戴亚康说。

“康成睿数”系统

团队依托苏州医工所自主研发的“康成睿数”系统建立了肿瘤专病数据库基座,并通过“康成睿影”AI诊疗模型训练推理一体机系统,实现肿瘤专病数据到诊疗大模型的转化。团队在2023年完成了基础模型的构建并持续迭代,创新成果“基于医学影像与文本的肿瘤智能诊断基础大模型关键技术研发”获得2025年江苏省前沿技术研发计划项目的支持。

此外,作为人工智能和生物医学工程的交叉领域,脑机接口技术同样是团队关注的方向。团队长期进行脑疾病的智能辅助诊疗设备研发,可通过脑机接口系统实时评估患者脑活动信号,有效提高患者的康复训练参与度。

戴亚康举例,“例如,一位听觉功能障碍的患者,我们可以在治疗前通过AI模型分析预判某种治疗方案对他是否有效。这就像考试‘估分’,以前医生凭经验判断,带有不确定性,现在通过大数据和AI模型,预测能力达到90%以上。”

去年,团队就与江苏省人民医院进行合作,在脑卒中患者的运动想象训练方面取得了良好进展。近期,团队将适应症拓展到儿童脑瘫康复、视觉功能评估等新方向。

【展望】

江苏构筑“人工智能+”科创高地

具有良好人工智能科创基础的苏州、无锡、南京等城市纷纷“抢滩”,构筑人工智能科创高地。

《中国城市人工智能发展指数报告(2023—2024)》曾对全国近300座城市人工智能发展情况进行了系统分析和评估,在此排名中,苏州位列全国第五位。

在医疗、金融、制造等领域,苏州企业中已涌现一批典型AI大模型应用案例,如思必驰东风语言大模型、清睿智能Aryn GPT、智慧芽芽仔大模型等都已经通过国家网信部门《生成式人工智能服务管理暂行办法》备案。

《苏州市加快推动“人工智能+”应用 高水平建设“人工智能+”创新发展试验区行动方案》也已发布实施,明确夯实智算基础设施、支持行业大模型开发应用等8项重点任务,提出到2027年苏州人工智能相关产业规模要突破3000亿元。

今年,无锡定下建设“人工智能+”标杆城市新目标,推出《市政府关于建设“人工智能+”标杆城市的政策意见》等文件。在推动创新链、资金链、人才链“三链融合”方面,推动企业、创新联合体、国家级及省级实验室等创新主体开展技术攻关、创新研发等相关工作,并给予最高2亿元的资助。

作为国家人工智能创新应用先导区,南京今年5月发布人工智能行动计划、政策措施“1+1”文件,即:《南京市进一步促进人工智能创新发展行动计划(2024-2026年)》;《南京市促进人工智能创新发展若干政策措施》。南京提出到2026年力争引培国内外先进水平的基础大模型1个、打造行业大模型20个以上,每年打造30个标杆应用场景,实现人工智能核心产业规模600亿元。

从科研支持到生态构筑,江苏正以多点开花之势,全力抢占“人工智能+”发展新高地。

新华日报·交汇点记者 张宣 杨易臻 蔡姝雯

标签:
责编:李睿哲