随着科技的发展,每天每时每刻都有大量数据被产生和存储下来。如何才能把这些数据变成有用的信息价值被人类所利用,就会通过一系列的收集、统计、整理、分析、挖掘等方法和技术来实现整个过程。数据科学是一门交叉的学科,涉及到很多的领域包括统计学、数学、计算机、人工智能、机器学习、数据库、模式识别、可视化技术等多学科的知识。大数据时代的到来,为各个科学领域带来了新的改革。
全球最顶尖管理咨询公司麦肯锡(McKinsey)出具了一份详细的分析报告,预计到2018年,大数据或者数据工作者的岗位需求将激增,其中大数据科学家的缺口在140000到190000之间,对于懂得如何利用大数据做决策的分析师和经理的岗位缺口则将达到1500000!
其中对大数据处理需求最旺盛的行业包括:制药业、计算机软件、互联网、科研、IT技术服务、生物技术。事实上,大数据工作者可以施展拳脚的领域非常广泛,从国防部、互联网创业公司到金融机构,到处需要大数据项目来做创新驱动。数据分析或数据处理的岗位报酬也非常丰厚,在硅谷,入门级的数据科学家的收入已经是6位数了(美元)。
(1)机器学习工程师 Machine Learning Engineer
代表了技术含量较高的方向,工作内容主要是开发机器学习系统和用这些系统解决实际问题。一般需要ship production code,做出来的是数据产品。
(2)数据分析员 Data Analyst
工作内容俗称analytics (product analytics or business analytics),从数据中提取insight,估计投资回报比,为产品方向提建议,所用工具一般较基础,比如写SQL query取数据、用R/Python做简单的分析、用Tableau/Excel作图比较常见,能自己开发Dashboard算是analyst里面技术强的;工作需要产生各种形式的报告;在统计层次上,懂基本t-test和线性回归即可。
(3)数据科学家 Data Scientist
很多人说,我想做数据科学家,我想做机器学习,而这类职位就是大家想象中的那种。此类职位工作内容以高级建模为主,会针对复杂的问题来设计技术方案,比如Uber叫车的ETA、各种定价系统、Airbnb和金融行业的Fraud Detection、Amazon物流管理,FB/Linkedin的社交网络或者ebay/Airbnb/Uber这样供需双方Marketplace市场规模的实验。这些例子,听上去就不是写SQL能解决的,也不是会写代码就能做出来的,都需要比较深的领域知识。
美国数据科学硕士申请背景及定位申请MS Data Science 需要什么样的背景?
不论是陆本还是美本,在本科阶段就开设Data Science这个专业的学校并不多,所以大家不要一看自己专业名字和数据科学不搭边就觉得是转专业申请。
首先,本科是计算机科学CS的同学,是最符合申请条件的,因为大多数数据工作都是通过编程和数据库的相关手段进行的,同时学过统计、微积分、高级语言;
例如哈佛大学对于MSDS的本科背景要求是:希望有微积分、线性代数,熟悉概率和统计干涉、能使用至少1种编程语言,例如Python或R,了解计算机科学概念。
Prerequisites we expect from applicants include knowledge of calculus and linear algebra, familiarity with probability and statistical inference, fluency in at least one programming language such as python or R, and an understanding of basic computer science concepts.
其次,本科背景是统计、数学或应用数学,且有一定编程基础的同学也可以申请,这都是很好的专业匹配。
最后,商科背景出身,但量化背景较强的商科专业,比如金工,但又希望能选择一个STEM专业的同学,那DS显然也是个非常好的选择。
所以说,如果你有比较强的编程背景,又有比较好的数理基础,那你就很有竞争力;而纯商科背景的同学,如果没有强的量化背景,或者不懂编程,那建议还是数据科学DS和商业分析BA混合申请,因为商业分析更加偏商科,开在商学院,对商科背景接纳程度大很多。
如何加强背景?
建议可以从科研方面加强,在大学期间最好找和量化相关的科研,如果实在没有,可以把相关的课程大作业拿来用。再退而求其次,也可以是计算机软件、数据库相关。如果没有科研经历,那将是极大地硬伤。
此外,可以参加一些学术活动。学术活动的平台有很多,比如最近很火的Kaggle,再如阿里的天池、SODA、WID、数据嗨客等。
最后就是实习。实习最优选择应该是数据公司的数据岗,然而现实是这样的岗位由于太过重要,基本不会招实习生。所以建议找一些统计量化相关的或者计算机相关的实习。
MSDS 怎么定位?
热门的MSDS数据科学专业基本上分布在大城市和名校,但因为专业较新,并没有一套可信的排名。这里罗列一些最热门、也是大家最常申的学校:
美国TOP30院校中开设Data Science项目情况
■ 2 Harvard University 哈佛大学
Graduate School of Arts and Sciences
Master of Science in Data Science
■ 3 University of Chicago 芝加哥大学
Graham School of Continuing Liberal& Professional Studies
Master of Science in Analytics
■ 5 Columbia University 哥伦比亚大学
① Institute for Data Scienceand Engineering
M.S. in Data Science
② School of Professional Studies
M.S. in Applied Analytics
■ 5 Stanford University 斯坦福大学
School: Department of Statistics
Master of Science in Statistics: Data Science
■ 11 Johns Hopkins University 约翰霍普金斯大学
Whiting School of Engineering
Master of Science in Data Science
■ 11 Northwestern University 西北大学
McCormick School of Engineering andApplied Science
M.S. in Analytics
■ 14 Cornell University 康奈尔大学
① School of Operations Research &Information Engineering
Master of Engineering-Data Analytics
② School: Department of StatisticalScience
MPS in Applied Statistics (Option II: DataScience)
■ 20 Georgetown University 乔治城大学
Graduate School of Arts and Sciences
M.S. in Analytics
■ 21 University of Southern California 南加州大学
Viterbi School of Engineering
MS in Computer Science – Data Science
■ 25 Carnegie Mellon University 卡耐基梅隆大学
School of Computer Science
Master of Computational Data Science (MCDS)
■ 25 University of Virginia 弗吉尼亚大学
Data Science Institute
M.S. in Data Science
■ 30 New York University 纽约大学
Center for Data Science
Master of Science in Data Science
哥伦比亚大学
哥伦比亚大学的MS in Data Science 项目处于美国数据科学硕士申请难度的第一梯队。该项目为期1年,学生共需修读30个学分,无需撰写毕业论文。该项目开设获得专业成就认证必需的四门基础课程,学生可以在此课程基础上将数据科学技术运用于各自的兴趣领域。
该项目要求申请者拥有一定的数学及编程基础,最好学过微积分、线性代数、计算机编程等课程,没有强制性的工作经验要求,有的话也会为申请者加分。
项目的学生将有机会从事包括毕业项目在内的独创研究,并与行业合作伙伴以及教学人员沟通互动。毕业生可以选择金融等服务领域工作,也可以选择偏向技术的IT企业。
杜克大学
杜克大学的Master in Interdisciplinary Data Science (MIDS)项目为期2年,该项目致力于培养一批能够使用计算策略来激发创新能力和洞察力,并且善于定量思考的新型领导者。旨在培养学生成为能给任何领域做出贡献的数据科学家,通过跨学科训练与团队合作科学实验的经验促进学生更好地利用数据的力量。项目规模不大,每年招收25-35名学生。
申请要求方面,不强制要求申请者有数学、计算机等专业背景,但是最好要学过微积分、线性代数、统计等数学方面的课程。毕业生去向良好,实习就业机会较多,从事的领域以计算机科学,金融,生物科学等领域居多。
宾夕法尼亚大学
1.项目介绍:宾大的数据科学科学项目MSE in Data Science设置在School of Engineering& Applied Science,Department of Computer and Information Science (CIS) 下。项目属于STEM。
该项目允许申请人使用同一申请账号申请多于一个硕士项目,但需单独提交并单独交申请费,同时选择“希望被其他项目考虑”。宾大修课自由度很大,学生可根据自己的兴趣在CIS系修读双学位或转学。
2.课程设置:项目修课时长通常为1.5/2年,学生需要完成10门课,包括3个部分:
基础课程 Foundations (two course units)
必修核心课 Core Requirements (three course units)
专业选修课 Technical and Depth Area Electives (five course units)学生需要完成Thesis/Practicum其中一项目方可毕业
宾大的DS课程覆盖面非常广,包括生物医学信息、通信和公共政策、机器人、机器学习和人工智能以及数据隐私等多方面,同时Penn Data Science Group还会举办各种讲座、workshop和data project供学生参加实践。
西北大学
西北大学分析学理学硕士项目(MSiA program)由西北大学工业工程与管理科学学院开设,为期15个月。该项目的核心课程由统计学、机器学习、优化、数据库、数据处理组成,每一门课都已之前的课程为基础,强调在商业实际中的学术研究。
申请要求方面。适合本科工程、商学、计算机科学、数学、信息科学技术专业背景的人士。该项目面向商业,加上课程时间较短,有很多的实习机会,大部分学生毕业后选择直接工作,毕业生多进入金融领域。
康奈尔大学
康奈尔大学运筹学与信息工程硕士项目(数据分析方向)为期1年,共计30个学分,要求申请者拥有数学、工程、物理、化学、数学经济学等本科背景,且已经修读过微积分、概率论、统计、计算机编程、数据结构等课程。
每年招收50人左右,其中中国人大约30个。该项目选课自由度很大,并且有选CS系课程的优先级,无论你是想学CS,IS还是商科,金融,统计,统统都可以选。这种选课的自由度放眼全美也是十分罕见的。
毕业生2015年平均起薪达到83925美元,大部分学生进入苹果,微软,甲骨文,Facebook等互联网公司。
南加州大学
南加州大学计算机(数据科学)理学硕士项目需要修满28个学分,要求课程读完GPA不低于3.0,班级规模较小,每年招收20-30人,偏向于理论研究方向。该项目的毕业生可进入微软、百度等世界500强的企业机构。
卡耐基梅隆大学
卡耐基梅隆大学Heinz学院下设两个数据科学硕士项目:MSPPM Data Analytics track和MISM Business Intelligence & Data Analytics。一个偏技术导向,一个偏商科导向。这里只介绍技术型的MSPPM Data Analytics track项目。该项目分标准(Standard)、延伸(Extended)、快捷(Accelerated)三种修读模式,学制分别为16个月、20个月和12个月,总学分均为144个学分,每年招收学生较少。
项目的综合性课程体系有助于学生习得专业技能与知识,以开发用于下一代大规模信息系统部署相关的技术层,以及分析这些系统生成的数据。毕业生就业形势良好,能够成为前沿信息技术、软件服务与社会传媒企业中备受青睐的软件工程师、数据科学家与项目经理人。
佐治亚理工学院
佐治亚理工学院的MS in Data Analytics项目是2015 Fall新开设的项目,有三个Track:Analytical Tools Track、Business Analytics Track、Computational Data Analytics Track。是跨学科硕士项目,根据以往的经验,这个学校的所有研究生项目都不太好申请,跟UC-Berkeley类似,申请难度较大。
学生有机会直接向顶级的国际商业智能权威机构、统计学与运筹学尖端分析技术的开发者,以及大数据与高性能计算领域的世界级领导者学习。毕业去向主要面向商业智能与决策支持。
纽约大学
1.学校介绍
纽约大学由18个学院和研究所组成,已经成为全美国境内规模最大的私立非营利高等教育机构之一,同时也是美国唯一一座位于纽约心脏地带的私立名校。
2.申请要求
(1)专业背景
该项目学生背景多元化,包括统计学、计算机科学、数学、工程学、经济学、商贸、生物学、物理学和心理学等;由于要求学生有一定的数理和计算机基础,所以比较青睐在machine learning、computational statistics、data mining、large-scale scientific computing、operations research等领域有学术积累的申请者。2017年入学学生的平均GPA是3.69。
(2)先修课要求
微积分I:极限,导数,级数,积分等。
线性代数
计算机科学概论(或等效的“CS-101”编程课程):至于具体的语言我们没有要求,但我们都希望至少具备严肃的Python和R学术和/或专业经验。
微积分II、概率论、统计学或高级物理、工程或计量经济学课程中的一门课程。
北卡罗莱纳州立大学
北卡罗莱纳州立大学分析学理学硕士项目是由高等分析研究所(Institute for Advanced Analytics)开设的全美第一个分析学硕士项目。NCSU analytics是分析学项目里的顶级老牌项目,但是学校综合排名不高。
每年招收20-30人,其中国际生50%。
布朗大学
1.项目介绍:布朗大学的数据科学硕士项目将计算机,数学和统计领域知识有效结合,为学生将来在新兴领域的就业夯实坚定的基础,2018年第一届招生。该项目依托于四个非常强大的学术部门(应用数学、生物统计学、计算机科学和数学),学生可以享用4个部门的资源。目标是为学生建立一个强大的数理分析能力,包括机器学习、数据挖掘、安全与隐私、可视化和数据管理等,为将来的就业做好准备。
该项目为STEM项目,有机会获得最长36个月的实习时间。
2.申请条件
专业无限制,但是建议有数理背景,越强越好。可以通过活动、科研、实习等体现;
可以提交writing simple来增加录取概率;
如果有工作经历,也会增加录取概率;
学生在校期间获得的奖项,荣誉和奖品,参加的相关科研经历等都有助于录取。
3.先修课要求
至少一年的微积分课程;
一个学期的线性代数;
一个学期的基于概率统计的微积分;
编程入门。
如果学生不符合线性代数、概率统计和计算机科学的最低要求,也是有可能录取的。被录取的学生可以在开学前的夏季在受认可的机构修读完毕即可
4.课程设置
该项目时长3学期,一般包括两个学期的课程和一个为期5-10周的顶点项目
对特定领域的数据分析:
该项目需要9个学分:每学期4个,夏季1个(顶点研讨):
数学和统计基础3学分;
数据和计算科学3学分;
社会信贷的影响和机会1学分;
自由选修1学分;
研讨课程1学分。
学期1(4学分课程):
概率论、统计和机器学习;
数据和计算科学入门。
学期2(4学分课程):
概率、统计学和机器学习(与上内容不同);
数据与计算科学(与上内容不同);
数据和社会。
选修(1学分)-——自由选修,可从4个部门选
弗吉尼亚大学
1.项目介绍
弗吉尼亚大学数据科学硕士每年会招收45-50名学生,属于STEM项目。该项目是严格的为期11个月的专业硕士课程,通过跨学科的方法,结合一流的工作机会,将技术和软技能应用在与工业界,学术界和政府合作的顶点项目上,培养学生领导数据科学的尖端领域。在顶点项目期间,教师、工业和政府代表指导学生团队处理实际问题。
2.申请要求及材料
学历要求:具有认可机构三年或四年制学士学位的申请人有资格申请,不限专业背景。数据科学的学生来自不同的专业背景,包括经济学、统计学、工程学、计算机科学、数学、酒店管理、历史,等等;
先修课程要求:单变量微积分、线性代数和矩阵代数、统计学入门、编程入门;
个人陈述:应该解释数据科学硕士项目如何适合你的短期和长期的教育和职业目标。
成绩单
两封推荐信
罗彻斯特大学
1.项目介绍
数据科学硕士由罗切斯特大学Goergen数据科学研究所提供,是STEM项目。项目时长一年或者一年半,毕业将获得该大学文理学院授予的学位。
该项目可以通过两个学期(秋季/春季)或三学期(秋季/春季/秋季)的全日制完成,两学期的时长适合进入计算机科学和数学背景很强的学生,并可以承担相对繁重的课程压力(每学期四门课程),以便迅速毕业。
在三学期时长中,学生每学期上三门课,学生可以在暑期进行实习。学校会安排很多企业宣讲会,并提供实习申请的建议,但学校不保证实习的安排。学校同时提供暑期桥梁课程,供没有较强计算机科学背景的学生选修。
2.专业分支
数据科学硕士项目开设有三个专业方向:
计算与统计理论
健康科学与生物医学科学
商学与社会科学
3.课程设置
该课程是为具有科学、工程、数学或商业背景的学生设计的,共需修读至少30个课程学分,属STEM。研究生学位均通过艺术与科学学院授予。四门核心课程共16学分。学生可以从多个必修课程中挑自己喜欢的,最终完成30个学分即可。
学生需要完成4个学分的实习课程,结束后每个学生需要做个人展示,通过后即可拿到硕士学位(该课程是硕士毕业考试性质的)。学生需要至少修读3门选修课达到10个学分以上。
(1)核心课程
统计计算入门(每年秋季提供)
中级统计和计算方法(春季提供,需先修初级)
数据挖掘(秋季和春季提供)
数据库系统(秋季和春季提供)
(2)实习训练
数据科学实习 (暑假期间提供)
(3)选修课
可以从计算与统计理论、健康科学与生物医学科学、商学与社会科学方向课程中选择
东北大学
1.项目介绍
东北大学的数据科学MS in Data Science 开设于NEU波士顿校区CCIS院下,为2016年新增项目。该项目主要培养学生建立起处理、建模、分析和推理数据的综合架构。毕业生一般就业岗位为数据科学家和数据工程师,或者继续就读博士学位。
2.先修课要求
所有录取学生,无论背景如何,都需要在开学前1周参加两个入学考试。
分别是:计算机科学和编程基础和统计、概率论和线性代数基础。
如果在考试中成绩低于B,那么学生需要额外修对应的基础课程。
3.课程设置
项目要求5门核心课程,主要为介绍数据科学的基础技术。
算法和数据处理两门核心课程主要研究基本概念和语言,注重数据表示、存储、操作和查询,以及大规模的计算和优化。
机器学习和数据挖掘的两门核心课程介绍了关于数据建模、可视化、揭示关联和预测的概念。Capstone课程(相当于毕业项目)主要展示学生数据科学的整体观点。该项目主要面对有数据和计算机基础的学生。
5门核心课程
算法和数据处理两门核心课程;
机器学习和数据挖掘两门核心课程;
信息可视化一门核心课程。
学生可以在学校选择3门选修课。
4.申请条件
成绩单;
PS,包括相关工作经验的描述;
简历;
三封推荐信。
© 2024. All Rights Reserved. 沪ICP备2023009024号-1