Description
密歇根探究项目
基于人群大数据的环境与健康关系研究
课题简介
本课题旨在挖掘和发现NHANES中环境污染与人群健康相关关系。National Health and Nutrition Examination Survey (NHANES),即美国健康与营养调查研究,是一项美国针对成人和儿童健康和营养情况的研究项目。该项目结合了问卷调查和身体检测,包括生化指标监测等数据,是美国健康统计中心(隶属于美国疾控中心,负责产生美国健康情况数据)的一个主要项目。该项目大部分数据向公众公开,任何个人和组织可以免费使用,用于科研、政策制定等。
该项目自1960年代初就开始,针对不同人群不同主题的研究已多次开展。从1999年开始,该项目变成一项持续性项目。该项目每年招募5000名受试者,覆盖全美国各州。该项目调查内容包括人口统计学、社会经济学、饮食习惯和健康相关问题 ;检测内容包括医学、牙科、生理学检测,以及一些实验室检测项目(包括各类污染物指标)。该项目主要通过评估营养情况以及身体健康,研究主要疾病的流行情况和风险因素。所获得的数据已经并且继续被用于流行病学和健康学研究,大量科学家从该项目数据中发现许多环境健康、营养学现象,为美国制定公共卫生政策、指导和设计健康服务项目提供了很大帮助,也扩大了对美国全国的健康情况的了解,是美国对人民身高、体重和血压等数据标准制定的基础。
本课题将使用该项目中2009年以后的数据,研究目标污染物在人群中的内外暴露情况和人群健康状态的关系,包括VOC(挥发性有机污染物)、农药、重金属等。通过化学、生物学和毒理学等基础科学的知识指导可能发现相关关系的方向并提出假设,应用流行病学和统计学分析方法(相关分析,线性回归分析和逻辑回归分析方法等)检测假设的成立与否,以此发现可能的疾病风险,并提出可行的预防措施。
科研方法
AI+X数据驱动型科研
AI+X数据驱动型科研是指使用人工智能(AI)算法,收集、处理、分析具体学科(X)的海量数据,并基于此进行预测,从而获得科学发现的研究方法。与传统的、基于实验或逻辑推理的研究方式相比,AI+X数据驱动型科研可以借助AI算法强大的运算能力,高效地进行大数据分析,具有投入产出比高、适用范围广的优点。
AI+X数据驱动型科研已被广泛地应用于各个领域,利用AI算法研究基因数据,从而进行早期的癌症筛查便是其中一例。基因组与癌症病患的数据千千万万,使用传统的科研方式对其进行分析,工程量大、过程繁琐,在客观上难以实现。但借助AI算法这一便捷的工具,生命科学家便能够以海量的患者的遗传信息为基础,建立数据库,与过往的研究成果进行对照,快速、准确地在两者中发现规律、建立联系,从而使癌症诊断的“标准化”成为可能。
授课导师
密歇根大学 博士后
研究方向:环境健康学、环境化学、环境流行病学和统计学
多次以第一作者身份在国内外期刊发表学术论文
课题要求
本课题适合: 9-12 年级学生,有较强的逻辑思维和抽象思维能力
英文:
1、具备基本的学术英语阅读能力;
2、接触过英文写作,有论文写作经验者更佳;
数学:
1、概率统计基础知识
2、统计分析方法(相关分析、线性回归分析、逻辑回归等)
计算机:
1、Excel使用,包括数据管理、画图
2、SPSS使用和各方法实现
3、R语言