北京大学第三十二届“挑战杯”系列赛事结果已于近日揭晓。在本届赛事中,来自公共卫生学院的杨硕、王令樟同学和来自城市与环境学院的易小龍同学充分发挥双方学科优势,在王斌老师(公共卫生学院)和卢晓霞老师(城市与环境学院)的指导下,完成作品“构建环境健康大数据库与机器学习模型预测化学品的流行病学健康风险效应值”,在跨学科竞赛中取得了三等奖的成绩
作品简介
随着化学品种类迅速增加,这些物质的人群健康风险评估面临着巨大挑战。由于其数目庞大且缺乏毒理学数据,尤其是获取其人群健康风险效应值【如相对危险度(Relative risk, RR)和比值比(Odds ratio, OR)】的难度和成本均较大,导致大量化学品的人群健康风险评价严重滞后。
本研究首先根据大数据检索和文献总结选取了一系列典型的环境化学品和疾病,整合已发表的荟萃分析(Meta)类型研究,构建流行病学健康风险效应值数据库。然后,使用RDkit获取化学品分子结构相似性,并整合CTD(比较毒理学数据库)、T3DB(暴露组数据库)、ToxCast(毒性预测技术数据库)等公开毒理学数据库获取其生物作用相似性信息。进而,通过特征筛选,保留了11个贡献度较高的变量进行建模分析。最后,利用不同的机器学习算法构建了定量与分类两种模型分别预测化学品的健康风险效应值与风险类别。
图1 研究整体设计
获奖感悟
环境暴露组是环境科学近年来的研究热点,公共卫生则注重从群体的角度探索与人类疾病和健康相关问题。本研究结合环境健康这一具有重要科学意义的话题,充分发挥环境科学与公共卫生交叉学科的融合优势,探讨利用化学品的相似性预测其人群健康风险效应值的可能性。
在课题开展期间,来自城环学院的同学负责环境暴露和多组学信息相关数据库整合,在高维度暴露组数据的处理上提出独到见解;来自公卫学院的同学则充分利用流行病学和卫生统计学知识,进行多组学网络和风险预测模型的构建。三位成员精诚合作,有效分工,共同探索从人群角度考虑环境暴露影响健康的科学问题。两位老师在研究过程中给予我们很大帮助,王斌老师在研究理论、方案设计和技术指导等方面提供了大力支持,卢晓霞老师悉心指导研究思路,监督、检查研究进程并提供撰稿建议。团队所有成员在这次课题研究中收获颇多,从整理数据库到数据分析,从绘图到文本撰写,习得了很多新技能。“路漫漫其修远兮,吾将上下而求索”,希望未来科研道路上的我们能始终坚守初心。
团队成员
学生简介
公共卫生学院
杨 硕
2020级预防医学专业本科生
公共卫生学院
王令樟
2021级预防医学专业本科生
城市与环境学院
易小龍
2021级环境健康专业本科生
教师简介
公共卫生学院
王斌 研究员
研究方向:环境健康、暴露组学、生物信息与人工智能
城市与环境学院
卢晓霞 副教授
研究方向:新型污染物的环境行为与健康效应、污染环境修复
供稿 | 王斌教授团队(北京大学)
校核 | 王斌