在传统环境健康风险评价中,分析框架多依赖单一污染物、单一暴露情景或特定结局模型,难以应对气候变化、复合污染、社会经济差异与人群健康之间高度耦合、跨尺度、非线性的真实世界问题。尽管全球范围内已积累了大量环境监测、流行病学和社会经济数据,但现有评估体系多依赖高度定制化、任务驱动的模型结构,难以在不同区域、不同情景和不同健康结局之间实现统一分析与泛化预测。近年来,人工智能(AI)基础模型(foundation models)的兴起,为环境健康风险评估提供了一种全新的范式转变。与任务导向的机器学习模型不同,AI基础模型通过在大规模、多模态数据上进行预训练,能够学习具有普适性的“环境—暴露—健康”表征,并在不同区域、情景和研究目标下高效迁移与微调。这种研究框架,旨在突破当前环境健康风险评价中“模型割裂、尺度不一致、可重复性不足”的核心瓶颈。
北京大学生育健康研究所王斌研究员和张凯博士后、中国疾病预防控制中心国家环境健康研究所李湉湉研究员、中国农科院农业资源与农业区划研究所副研究员闵祥宇等合作团队,系统阐述了这一转变的理论基础与实践路径。围绕环境领域跟人类生存较为密切,且相关时空监测数据较为充分的大气和土壤环境,提出两类亟待开发的基础模型:(1)面向“气候变化—空气污染—社会经济—人群健康”的综合基础模型,强调以Transformer和图神经网络为核心架构,打通环境暴露预测、疾病负担评估与政策情景模拟之间的壁垒,推动风险评估从“事后归因”向“前瞻预警与策略优化”转变;(2)面向农业系统提出的环境可持续性基础模型,通过整合遥感、气候、土壤、污染排放及健康相关数据,实现从生产系统到生态与健康风险的统一预测与决策支持,为暴露源头控制与健康导向管理提供了系统级工具。总体而言,AI基础模型有望重塑环境健康风险评价策略,使其从碎片化、静态和经验驱动,迈向多尺度、动态和以健康结局为导向的系统性框架,为精准防控和政策制定提供可解释、可迁移、可持续的科学支撑。
(一)构建“气候变化—空气污染—社会经济—人群健康”的综合基础模型
当前,全球约99%的人口暴露于超过WHO空气质量指南的环境中,空气污染每年导致约700万例过早死亡;与此同时,气候变暖及极端高温事件预计将在本世纪内对相当比例人群的健康负担产生超过传统空气污染的影响。此外,社会经济因素(如收入、教育和生育水平)通过影响暴露结构、疾病易感性和医疗资源分配,深刻塑造了健康风险的空间不平等格局。GBD 等大型评估框架虽然在宏观层面提供了重要参考,但其多阶段、强假设的建模体系在透明性、可复现性和快速情景推演方面仍存在明显局限。传统机器学习模型(如随机森林、回归或单一深度学习网络)通常针对单一问题设计,难以同时整合空气污染、气象变化、人口结构和健康结局等多源异构数据,也难以自然延伸至下游健康风险评估或政策模拟。相比之下,AI 基础模型通过在大规模、多模态环境数据上进行预训练,能够学习具有通用性的地球系统和健康风险表征,并通过微调快速适配不同应用场景,从而显著提升跨尺度、跨任务的预测能力。
基于以上理念,作者提出了 CASH-FM(Climate–Air pollution–Socioeconomics–Health Foundation Model)这一概念框架(图1)。该模型采用“双架构”设计:一方面,利用 Transformer 与 U-Net 结构处理高分辨率网格化数据,实现空气污染、气候变量及其时序变化的精细化预测;另一方面,引入多尺度图神经网络(GNN)对国家或区域节点进行编码,刻画空间关联、社会经济联系及健康负担在不同区域之间的传播与异质性。两种架构相互补充,使模型既具备高分辨率时空预测能力,又能够服务于区域尺度的决策支持。论文进一步明确了 CASH-FM 的三大核心功能目标:第一,多模态数据融合,通过整合遥感、地面监测、排放清单、气象资料和健康统计数据,系统识别污染热点并量化健康负担;第二,多尺度预测能力,从街区暴露评估到国家层面的政策情景分析,支持不同减排或气候适应策略下的健康风险预测;第三,公共健康决策支持,在预测基础上量化健康收益与经济成本,为空气质量预警、资源配置和清洁能源转型提供科学依据。

图 1. 双架构 CASH-FM 基础模型的示意图。上层路径采用 Transformer 与 U-Net 结构,对网格化的多源数据进行处理,实现高分辨率的时空预测;下层路径利用多尺度图神经网络(GNN)对地理区域进行编码,刻画复杂的空间相互作用。这两种互补的架构共同支撑模型在环境健康应用中的可泛化、具备地理感知能力的决策支持功能。
(全文链接:https://pubs.acs.org/10.1021/acs.est.5c16891)
(二)构建“农业—环境—健康”可持续发展风险评估基础模型
全球农业系统的可持续发展长期以来都是农业科学、环境科学、公共政策领域的核心议题。农业处于“粮食安全—环境退化—气候变化”多重挑战的交汇点:一方面,它支撑着近 80 亿人口的粮食供给,是人类社会稳定运行的基础;另一方面,却消耗了全球约 70% 的淡水和土地资源,并成为土壤养分流失、温室气体排放以及化学污染的重要来源。大量研究表明,通过优化耕作制度、施肥与用药策略以及土地管理方式,作物产量、资源利用效率与环境可持续性在一定条件下可以实现协同提升。然而,这类证据多来源于局地调查、田间试验或单一过程模型,研究尺度有限、情景假设固定,难以在区域乃至全球尺度上实现系统整合与长期预测,从而制约了其在宏观决策与政策制定中的应用价值。随着农业集约化程度不断提高,化肥、农药投入以及土壤污染问题日益突出。过量施肥不仅导致氮磷流失和水体富营养化,还加剧了农业源温室气体排放;农药及工业污染物则可能与重金属和新兴污染物发生协同或叠加效应,显著放大生态系统与人群健康风险。以中国为例,研究显示自 2000 年以来,土壤砷污染水平持续上升,并预计在未来数十年内进一步加剧,对水稻生产安全和公共健康构成长期威胁。这类复杂问题暴露出当前农业干预和评估体系在系统整合能力、跨尺度预测能力以及情景分析方面的明显不足,亟需新的技术路径加以突破。
尽管将多模态、大规模数据直接用于农业、环境和健康的生物物理模拟仍面临诸多挑战,但基础模型的发展为构建系统性、可扩展的分析框架提供了新的机遇。通过在大规模、多模态数据上的自监督预训练,能够学习具有普适性的系统表征,并在下游任务中展现出更强的泛化能力与迁移效率。基于GraphCast、Aurora 等模型在气候与环境预测中的突破性表现,表明类似方法有潜力将气候变化、遥感观测、土壤属性、作物管理、污染排放以及社会经济数据统一纳入一个高效、可扩展的建模框架,从而支撑“农业—环境—健康”一体化评估。研究团队提出构建农业可持续性基础模型(Agricultural Sustainability Foundation Model,ASFM)的核心愿景,旨在通过多源数据融合与领域知识嵌入,支持从田块尺度到国家乃至全球尺度的预测、情景模拟与决策支持,实现粮食安全、生态保护与公共健康目标的协同推进。如图 2所示,ASFM 采用两阶段构建策略。阶段 I 聚焦于全球时空数据的整合与预训练,基于 Transformer、图神经网络(GNN)或 U 形卷积神经网络(UNet)学习农业系统的通用表征;阶段 II 引入本地观测或情景数据,采用低秩自适应(LoRA)、量化低秩自适应(QLoRA)和自适应低秩自适应(AdaLoRA)等高效微调技术,实现模型在特定区域或应用场景下的快速适配。通过多种调优策略的组合,ASFM 可在保持泛化能力的同时满足多样化应用需求,进而支持跨尺度预测、情景化模拟和多系统交互建模,并作为决策支持系统嵌入可持续性目标,生成优化策略并提供地方化建议。

图2. 农业可持续性发展基础模型(ASFM)两阶段概念框架
(全文链接:https://doi.org/10.1021/acs.estlett.5c01105)
挑战与展望:
在迈向环境与健康一体化的 AI 基础模型过程中,面临一系列共性且结构性的挑战。首先,全球环境与健康数据长期呈现出高度碎片化与显著异质性,不同来源的数据在空间分辨率、时间尺度、质量控制和可获取性方面差异巨大,且现有数据体系在很大程度上仍由高收入国家主导,可能放大区域不平等并引入系统性偏倚,限制模型在低收入和数据匮乏地区的泛化能力。其次,无论是面向环境健康的 CASH-FM,还是聚焦农业系统的 ASFM,均面临跨尺度建模与泛化能力不足的问题:农田或局地过程难以与区域乃至全球气候和社会经济动态自然衔接,单纯依赖数据驱动模型容易在情景外推中失效,亟需引入多尺度架构与机理—AI 融合策略以增强物理一致性与可解释性。第三,模型治理、透明度与可持续性目标嵌入仍显不足,当前多数模型侧重预测精度,缺乏对粮食安全、环境保护、经济成本与社会公平等多目标的系统权衡。未来,有必要通过联邦学习与隐私保护训练降低数据壁垒,加强跨学科协作与开放共建,将 AI 基础模型逐步建设为服务全球公共健康与农业可持续发展的“公共基础设施”,推动风险评估从分散、事后、静态的分析模式,迈向统一、前瞻、可情景推演的系统性决策框架,为政策制定与实践干预提供长期而稳健的科学支撑。总之,AI基础模型不仅仅在环境领域,在不同学科领域,包括文本、图像、医药、知识网络等,逐渐成为底层的基础支撑以提高工作效率。目前,在环境领域尚属于起步阶段。研究团队认为,在未来5-10年,AI基础模型具有改变“游戏规则”的能力,必然和必将重塑环境健康研究范式。
参考文献:
Tham, et al. Building the world’s first truly global medical foundation model. Nat. Med. 2025, 31 (11), 3580−3585.
Xie, et al. Crop switching can enhance environmental sustainability and farmer incomes in China. Nature 2023, 616 (7956), 300−305.
Lam, et al. Learning skillful medium-range global weather forecasting. Science 2023, 382 (6677), 1416−1421.
Bodnar, et al. A foundation model for the Earth system. Nature 2025, 641 (8065):1180-1187.
Bommasani, et al. On the opportunities and risks of foundation models. arXiv 2021, DOI: 10.48550/arxiv.2108.07258.
Brown, et al. Language models are few-shot learners. arXiv 2020, DOI: 10.48550/arXiv.2005.14165.
Wang, et al. ExposomeX: Development of an Integrative Exposomic Platform to Expedite Discovery of the “Exposure−Biology−Disease” Nexus. Environ. Sci. Technol. 2025, 59 (26), 13251−13263.
致谢:
感谢中国队列共享平台(https://chinacohort.bjmu.edu.cn/)和重大疾病流行病学教育部重点实验室(北京大学)(https://klemd.pku.edu.cn/index.htm)提供合作协助。感谢国家自然科学基金委和国家科技部重点研发项目支持。
作者简介
第一作者:

张凯,博士毕业于上海交通大学。现在北京大学公共卫生学院生育健康研究所从事博士后工作。主要研究方向为气候变化及其健康效应,利用传统流行病学、人工智能相结合的手段揭示环境污染物及气候变化对心肺疾病的影响及其机制。迄今以第一作者身份在 Environment Science& Technology、Environmental Pollution、Journal of infection等期刊发表论文10余篇。获国家资助博士后C档资助,参加国家自然科学基金青年和面上项目等3项。

闵祥宇,中国农科院农业资源与农业区划研究所副研究员。研究方向为绿色农业发展及其健康效应。擅长基于多模态农业环境数据与机器学习模型,探究农业系统可持续性、土壤生态功能恢复及“土壤-健康”关联机制。迄今以第一作者/通讯作者在Soil & Tillage Research、Habitat International、 Environment Science& Technology Letters等期刊发表学术论文22篇,主持国家自然科学基金面上项目、国家自然科学基金青年、国家重点研发计划子课题等共5项。
通讯作者:

李湉湉,博士,研究员、博士生导师,国家杰出青年科学基金获得者,现任中国疾病预防控制中心国家环境健康研究所副所长。其研究方向聚焦于气候变化、空气污染与健康、健康大数据以及风险预测。李博士已主持11项国家级科研项目,包括国家杰出青年基金项目、国家自然科学基金重点项目、国家科技重大专项课题以及国家重点研发计划项目。其荣誉包括首届 Cell Press 中国女性科学家奖、华夏医学奖青年科技奖,以及2024年中国气象服务协会科学技术奖一等奖(15位获奖者中排名第一)。李博士同时担任世界心脏联盟气候变化、空气污染与健康委员会委员,国家环境与健康专家咨询委员会委员,国家气候变化与健康专家委员会委员

王斌,北京大学公共卫生学院生育健康研究所,长聘副教授/研究员,北京大学城市与环境学院的兼职教授。主要研究方向为环境健康,暴露组学大数据与人工智能。主导构建暴露组学平台 ExposomeX(www.exposomex.cn),促进“暴露–生物学–疾病”关联的因果推断研究。迄今主持国家自然科学面上和青年基金4项,骨干参与国家重点研发项目3项。以第一或通讯作者在Environ Health Persp、Environ Sci Tech、The Innovation等国际权威期刊发表论文共70篇(H指数=54,他引6500余次)。担任环境健康领域TOP期刊Environ Sci Tech副主编(AI、大数据、环境健康领域)。开设本科生、研究生北大教改课程“暴露组学”,获得“北京大学十佳本科生优秀教学案例”。担任中国队列共享平台“环境与人群健康”组长,环境诱变剂学会环境与生育健康专委会副秘书长。获得北京预防医学会科技二等奖和“全国科技系统抗击新冠疫情优秀个人”称号。