Description
哈佛科研课题
基于公共卫生数据的生存分析
课题简介
随着人们生活水平的提高及数据科学的进步,研究群体性健康行为的公共卫生领域正在得到越来越多学界和业界的关注,也让基于大数据的群体性生存分析成为研究癌症患者生存率、药物疗效、术后存活时间等问题的重要手段。
本课题旨在运用生存分析方法,对公共卫生学中常见的生存问题进行分析,基于实际患者数据,探究年龄、性别、治疗手段等关键因素对患者患病后、术后、药物治疗后的存活时间的影响,并应用生存分析中的不同模型,如Cox模型,AFT加速模型等,对数据做进一步分析处理,力求获得对实践有指导意义的结论。
通过本课题研究,研究者将掌握使用R进行数据分析的技能,常用的生存分析模型,以及公共卫生学中实际生存问题的了解。
科研方法
AI+X数据驱动型科研
AI+X数据驱动型科研是指使用人工智能(AI)算法,收集、处理、分析具体学科(X)的海量数据,并基于此进行预测,从而获得科学发现的研究方法。与传统的、基于实验或逻辑推理的研究方式相比,AI+X数据驱动型科研可以借助AI算法强大的运算能力,高效地进行大数据分析,具有投入产出比高、适用范围广的优点。
AI+X数据驱动型科研已被广泛地应用于各个领域,利用AI算法研究基因数据,从而进行早期的癌症筛查便是其中一例。基因组与癌症病患的数据千千万万,使用传统的科研方式对其进行分析,工程量大、过程繁琐,在客观上难以实现。但借助AI算法这一便捷的工具,生命科学家便能够以海量的患者的遗传信息为基础,建立数据库,与过往的研究成果进行对照,快速、准确地在两者中发现规律、建立联系,从而使癌症诊断的“标准化”成为可能。
授课导师
1. 哈佛大学 博士
2. 硕士毕业于哈佛大学环境卫生专业;
3. 本科毕业于清华大学环境工程专业;
4. 研究方向:公共卫生,并在该领域有丰富的研究经验和工作经验
课题要求
本课题适合: 9-12 年级学生,有较强的逻辑思维和抽象思维能力
1. 英文:
(1)具备基本的学术英语阅读能力;
(2)接触过英文写作,有论文写作经验者更佳;
2. 数学:
(1)统计基础知识;
(2)微积分(偏微分);
(3)线性代数;
3. 计算机:
最好有一定的数据处理基础。如果没有,以下软件选择一种或多种,在课题开始后的1-2周进行强化学习并能进行初步的应用
(1)R Studio;
(2)Stata;
(3)Python(Jupyter Notebook, Anaconda)