随着科技的发展,每天每时每刻都有大量数据被产生和存储下来。如何才能把这些数据变成有用的信息价值被人类所利用,就会通过一系列的收集、统计、整理、分析、挖掘等方法和技术来实现整个过程。数据科学是一门交叉的学科,涉及到很多的领域包括统计学、数学、计算机、人工智能、机器学习、数据库、模式识别、可视化技术等多学科的知识。大数据时代的到来,为各个科学领域带来了新的改革。
全球最顶尖管理咨询公司麦肯锡(McKinsey)出具了一份详细的分析报告,大数据或者数据工作者的岗位需求将激增,其中大数据科学家的缺口在140000到190000之间,对于懂得如何利用大数据做决策的分析师和经理的岗位缺口则将达到1500000!
其中对大数据处理需求最旺盛的行业包括:制药业、计算机软件、互联网、科研、IT技术服务、生物技术。事实上,大数据工作者可以施展拳脚的领域非常广泛,从国防部、互联网创业公司到金融机构,到处需要大数据项目来做创新驱动。数据分析或数据处理的岗位报酬也非常丰厚,在硅谷,入门级的数据科学家的收入已经是6位数了(美元)。
数据科学的三类职业方向机器学习、数据分析和数据科学家
(1)机器学习工程师 Machine Learning Engineer
代表了技术含量较高的方向,工作内容主要是开发机器学习系统和用这些系统解决实际问题。一般需要ship production code,做出来的是数据产品。
(2)数据分析员 Data Analyst
工作内容俗称analytics (product analytics or business analytics),从数据中提取insight,估计投资回报比,为产品方向提建议,所用工具一般较基础,比如写SQL query取数据、用R/Python做简单的分析、用Tableau/Excel作图比较常见,能自己开发Dashboard算是analyst里面技术强的;工作需要产生各种形式的报告;在统计层次上,懂基本t-test和线性回归即可。
(3)数据科学家 Data Scientist
很多人说,我想做数据科学家,我想做机器学习,而这类职位就是大家想象中的那种。此类职位工作内容以高级建模为主,会针对复杂的问题来设计技术方案,比如Uber叫车的ETA、各种定价系统、Airbnb和金融行业的Fraud Detection、Amazon物流管理,FB/Linkedin的社交网络或者ebay/Airbnb/Uber这样供需双方Marketplace市场规模的实验。这些例子,听上去就不是写SQL能解决的,也不是会写代码就能做出来的,都需要比较深的领域知识。
申请MS Data Science 需要什么样的背景?
不论是陆本还是美本,在本科阶段就开设Data Science这个专业的学校并不多,所以大家不要一看自己专业名字和数据科学不搭边就觉得是转专业申请。
首先,本科是计算机科学CS的同学,是最符合申请条件的,因为大多数数据工作都是通过编程和数据库的相关手段进行的,同时学过统计、微积分、高级语言;
例如哈佛大学对于MSDS的本科背景要求是:希望有微积分、线性代数,熟悉概率和统计干涉、能使用至少1种编程语言,例如Python或R,了解计算机科学概念。
Prerequisites we expect from applicants include knowledge of calculus and linear algebra, familiarity with probability and statistical inference, fluency in at least one programming language such as python or R, and an understanding of basic computer science concepts.
其次,本科背景是统计、数学或应用数学,且有一定编程基础的同学也可以申请,这都是很好的专业匹配。
最后,商科背景出身,但量化背景较强的商科专业,比如金工,但又希望能选择一个STEM专业的同学,那DS显然也是个非常好的选择。
所以说,如果你有比较强的编程背景,又有比较好的数理基础,那你就很有竞争力;而纯商科背景的同学,如果没有强的量化背景,或者不懂编程,那建议还是数据科学DS和商业分析BA混合申请,因为商业分析更加偏商科,开在商学院,对商科背景接纳程度大很多。
如何加强背景?
建议可以从科研方面加强,在大学期间最好找和量化相关的科研,如果实在没有,可以把相关的课程大作业拿来用。再退而求其次,也可以是计算机软件、数据库相关。如果没有科研经历,那将是极大地硬伤。
此外,可以参加一些学术活动。学术活动的平台有很多,比如最近很火的Kaggle,再如阿里的天池、SODA、WID、数据嗨客等。
最后就是实习。实习最优选择应该是数据公司的数据岗,然而现实是这样的岗位由于太过重要,基本不会招实习生。所以建议找一些统计量化相关的或者计算机相关的实习。
© 2024. All Rights Reserved. 沪ICP备2023009024号-1