Description
耶鲁科研课题
基于网络的学术合作分析
课题简介
随着学术平台的发展,学术合作本身作为科学家发表研究、升职评职称和获得终身教授的重要零度之一,受到了许多关注。围绕科学家之间的学术合作与论文合著问题,很多问题被探讨与解决。例如,劳动经济学所关注的性别歧视问题,男性科学家是否更倾向与男性科学家合作论文?这样的同质合作又是否在某种程度上影响了最终学术成果的质量?另一方面,科学家之间的合作可以被看成一个网络。
随着近些年网络分析的方法论的发展,一些新的网络分析算法,比如社区簇结构(community structure detection) 也逐渐被运用在研究重要的经济学问题中。由一个科学家团队提供的DBLP网络数据(计算机学者合作网络)为研究此类问题提供了极大的便利。
本课题旨在运用大数据与网络分析方法对计算机学者合作网络数据进行分析,探究合作的基本测度、合作的模式、合作成果与科学家特征的关系,并应用计量经济学中的时间序列分析、面板回归、预测等方法对数据做进一步分析处理,力求获得对实践有指导意义的结论。
本课题是统计学和经济学的综合研究,是先进网络分析方法的实际应用。研究者将获得使用Python和R进行大数据分析的技能和对网络的深入了解。
科研方法
AI+X数据驱动型科研
AI+X数据驱动型科研是指使用人工智能(AI)算法,收集、处理、分析具体学科(X)的海量数据,并基于此进行预测,从而获得科学发现的研究方法。与传统的、基于实验或逻辑推理的研究方式相比,AI+X数据驱动型科研可以借助AI算法强大的运算能力,高效地进行大数据分析,具有投入产出比高、适用范围广的优点。
AI+X数据驱动型科研已被广泛地应用于各个领域,利用AI算法研究基因数据,从而进行早期的癌症筛查便是其中一例。基因组与癌症病患的数据千千万万,使用传统的科研方式对其进行分析,工程量大、过程繁琐,在客观上难以实现。但借助AI算法这一便捷的工具,生命科学家便能够以海量的患者的遗传信息为基础,建立数据库,与过往的研究成果进行对照,快速、准确地在两者中发现规律、建立联系,从而使癌症诊断的“标准化”成为可能。
授课导师
1. 耶鲁大学博士
2. 丰富的数据挖掘、大数据处理研究经验,并在学术期刊上发表学术论文
3. 精通Python、JAVA、C、C++等多种编程语言及SAS、Stata、SPSS等多种统计软件
课题要求
本课题适合: 9-12 年级学生,有较强的逻辑思维和抽象思维能力
1. 英文:
(1)具备基本的学术英语阅读能力;
(2)接触过英文写作,有论文写作经验者更佳;
2. 数学:
(1)概率统计基础知识
(2)线性代数基础(行列式、矩阵运算等)
(3)线性与非线性回归
3. 计算机:
(1)Python编程基础
(2)igraph包编程方法