过去四十年,决定经济发展的是摩尔定律
而在未来二十年,真正改变经济发展的是大数据
因为数据分析,就是传说中预知未来的超能力
所有的公司未来都会是数据公司
显而易见
无论哪一个领域都会用到data science
在未来是极度供不应求的工作
根据麦肯锡近期一项关于Big Data的报告
2018年,美国将面临近200,000+数据人才的空缺
Data Engineer的必备技能
Data Hacking
要有独立把数据化为己用的能力
可能会用到:
SQL
Python
Programming
Hadoop / parallel processing
这其中,SQL和Python是最基本的,你必须会用sql查询数据、用Python快速写程序分析数据。当然,你的编程技术也不需要达到软件工程师的水平,因为你写的code大多数只是一次性的、不会被复用,而且也只会被你或者个同事使用,并非放在网上让无数人点击,因此对程序质量要求不高。
要想更深入的分析问题
你可能还会用到:
Exploratory analysis skills
Optimization、Simulation
Machine Learning、Data Mining
Modeling
Problem Solving
你不光要理解what users say they want,你还需要真正的理解what they actually mean,转化定义出一个可以用数据解决的问题,然后选择正确的分析工具,量化分析解决问题。
Communication
数据科学家会跟公司的很多不同部门的人打交道,会比码农跟更有机会见到高层或者是 business领域的人。那你需要有较强的交流能力。你需要知道区分什么是问题本质、什么是技术细节,要有能力给上层领导讲high level的分析和推荐,有能力给同事讲解和defend你的技术细节,也就是”见什么人说什么话”。
在成为data工作者的路上匍匐前进
你与他们其实只差一个项目实战!
基于项目实战(project based实操)的零基础机器学习,通过演练与讲解如何利用机器学习与深度学习进行体育比赛预测,房价预测、B站弹幕情感分析以及游戏AI等相关热点话题。学员们能够基本掌握数据科学思维,独立完成一定的数据分析任务,助其获得宝贵的实际操作能力,从而打开数据科学的大门!
Python从入门到精通
数据工程师的5种数据结构
6个必备算法
大数据标配NumPy/SciPy Stack
构建机器学习模型项目实战
Deep Leanring
TensorFlow
明 星 导 师
M导师,高级软件工程师,美国常春藤大学计算机硕士。拥有多年一线软件工程师工作经验,曾就职于Google等top-tier高科技公司,现任核心金融公司Desk Quant。精通数据结构和算法,熟悉Python在高科技界和金融业的运用,擅长构建基于Python的数据挖掘/机器学习/量化交易平台。有丰富的面试经验,总结出“要点模式化”技术面试方法,使学生精准抓住面试考查要点,在较短时间内提高面试命中率,辅导学生多人拿到一流公司offer。
开 课 时 间
第一节课
2018/2/10(周六) 美西时间7:00pm - 9:00pm
第二节课
2018/2/17(周六) 美西时间7:00pm - 9:00pm
第三节课
2018/2/18(周日) 美西时间7:00pm - 9:00pm
第四节课
2018/2/24(周六) 美西时间7:00pm - 9:00pm
错过直播不要怕,直播结束后会发出直播视频回放。
课后会有项目和微信群刷题,帮你巩固知识。
课 程 大 纲
第一节课
Python特性及应用介绍
对Python进行整体介绍和要点学习
掌握软件开发核心过程
介绍最新业界动向和热门领域发展方向
1. Python语言的特性和优缺点分析
2. Python在高科技公司的应用 (Uber, Pinterest, Facebook/Instagram etc)
3. Python在金融Quant业的应用(大投行对冲基金FinTech etc)
4. 基于Python的大数据和机器学习介绍
5. Python Demo 演示基本用法和重要的built-in functions/data structures
6. 程序调试debug和测试unit test
7. Python技巧和高级用法:迭代器(Iterators), 生成器(Generator), Decorators, Closure,
Regular Expressions, functional Programming
第二节课
数据结构和算法学习
深入学习基于Python的核心数据结构和算法
1. 基本数据结构 array, dictionary/hash table, tuples, sets, strings.
2. 栈(Stack),队列(Queue), 链表(Linked Lists),二叉查找树(Binary Search Tree),堆(Heap),图(Graphs)
3. Customize data structures
4. 基本算法递归vs迭代, 分而治之, 搜索排序
5. 深度优先搜索广度优先搜索贪婪算法动态规划
穿插面试真题实战分析
第三节课
项目实战
基于Pandas 和 scikit-learn 对真实的体育比赛历史,房价,B站弹幕情感等数据进行分析,挖掘有趣的关系,构建机器学习模型对未来比赛,房价进行预测。我们还会cover 数据分析中的图像可视化方法和技巧。学员们能够基本掌握数据科学思维,独立完成一定的数据分析任务,助其获得宝贵的实际操作能力,从而打开数据科学的大门!
技术简介:
numPy+Pandas tech stack : 最热门,最powerful的python 数据分析library, 通过本次project,学生将熟练掌握用pandas处理数据的各个步骤,对data pipeline有较为深刻的理解。
scikit-learn: 久经考验并广泛运用于工业界的机器学习库。
matplotlib:经典的python based图像可视化library
第四节课
大数据和机器学习基础案例分析
最火的大数据究竟指的是哪些技术?
1. 大数据和机器学习简介
2. 科学计算标配package: NumPy/SciPy Stack
3. 机器学习最热门方向Deep Learning (AlphaGo运用的算法)
4. 机器学习最热门平台TensorFlow (Google Brain)
5. 带领学生完成一个project智能识别系统
基于Python machine learning framework
尝试多种机器学习算法(Logistic Regression, K-Nearest Neighbors, Support Vector Machines)用于智能图像识别
掌握机器学习各个步骤:Data Loading, Data Visualization, training, evaluate models, make prediction, etc.
课 程 形 式
课程形式为线上视频直播,每次课程可与导师互动交流,每次课程只限20人报名,保证学习质量。中国美国可同时观看直播。每次课程结束将会给所有学员发送视频链接,可反复观看复习课上内容。
学 员 战 绩
往期精品小班学员入职公司汇总
求 职 宝 典
报名后即可获得价值$1200的全部工程专业的求职宝典!《独家面经和题库》《美国就业手册》《硅谷求职攻略》《工程求职宝典》等的求职材料和求职资源。
往 期 学 员 反 馈
更多精品小班课程预告
机械工程FEA强化训练营
开课时间:2018年3月 (具体时间请关注微信通知)
课程信息和预订课程:进入官网wendao.us,点击“精英小班”
数据工程师SQL零基础训练营
开课时间:2018年4月 (具体时间请关注微信通知)
课程信息和预订课程:进入官网wendao.us,点击“精英小班”
CAE产品设计工业实例训练营
开课时间:2018年4月 (具体时间请关注微信通知)课程信息和预订课程:进入官网wendao.us,点击“精英小班”
翰林课程体验,退费流程快速投诉邮箱: yuxi@linstitute.net 沪ICP备2023009024号-1