某名企高管曾说
写上参加过Kaggle比赛,我会看简历
得过一次10%,我会給电话面试
得过2次以上10%,我会给on site面试
得过一次前10,我们会谈笑风生
Kaggle为何备受青睐
Kaggle是一个全球知名的数据科学在线平台,由Anthony Goldbloom和Ben Hamner于2010年在墨尔本创立,后由google收购。
Kaggle一开始以Date Mining起家,为了是可以快速高效地解决棘手的问题。大部分的学术活动均由企业或研究者发布,将数据,问题和期望指标同步更新,以学术活动奖励的方式向全球征集解决方案。
对问题发布者来说,他可以方便的筛选出最有成效的方案,而对参与者来说,不仅是考验自己能力,更是一场实战经验。
Kaggle学术活动平台类似于一对多的项目众包平台,直接的在公司和人才供需之间搭建了一座桥梁,避免了传统入职测试中的以学历和工作经历做初步筛选的弊端。
也就是说,只要你有才,只要你能解决问题,奖章奖金甚至入职加薪均有可能。
并且,个人的Kaggle Profile会显示所有参与过的项目、活跃度、实时排位、历史最佳排位等,基本就等同于一张实力证书。如果你的未来是Date Science的方向,想要提升自己实力背景的话,以Kaggle在领域内的知名度,是你绝对不能错过的机会。
Kaggle史上最年轻Grandmaster
Kaggle成立9年,注册用户超过100万,现仅有122名Grandmaster。在Kaggle,要成为Grandmaster非常困难,该头衔是根据Kaggle Progression System来判定的。
KaggleProgression System的等级从低到高分别为:Novice、Contributor、Expert、Master和Grandmaster。这是一套用户的等级排名系统,类似于在游戏中做任务,一路打怪、攒经验,换取累计积分,达到一定要求之后就可以升级。
18岁的英国高中生MikelBober-Irizar成为Kaggle史上最年轻Grandmaster,Mikel在122位Grandmaster中,排名第31,他用的时间是3年。
让我们一起来看看这位大佬的炼成日记:
MikelKaggle挑战赛上战绩辉煌
🏆谷歌地标检索挑战赛
2018年5月,参赛队共209支,获第1名
🏆Avito重复广告检测挑战赛
2016年7月,548队参赛,获第2名(Top 1%)
🏆博世生产线故障预测挑战赛
2016年11月,627队参赛,获第5名(Top 1%)
Mikel采访录:
Mikel最初只是抱着试试的态度来参加Kaggle挑战赛的。从实际应用的角度讲,对算法的工作原理的理解要比其数学原理更重要。
他所在的高中皇家文理学校并未设置AI和机器学习的系统课程,Mikel在机器学习和人工智能方面的编程技能几乎完全是自学成才。
我不知道算法背后的所有数学原理,但就实际使用而言,我认为对算法的工作方式有一个合理的理解更为重要。即使我不能从头开始写算法,我仍然知道它具体做了什么,这有助于我理解算法可能有用的地方。
——Mikel
除了Mikel“骨骼惊奇”这样的天才少年
12岁小女孩儿也在编写元胞自动机程序
现在Python都已经进入小学课程了!!!
你还在等什么!?
Kaggle的入门:PYTHON
Kaggle最基础的入门学者也要先学会初步使用一门编程语言,而Python作为一种强大的“胶水”语言,可以迅速入门,对于Kaggle大数据学术活动平台来说是一个非常不错的选择。
Python是一种计算机程序设计语言,由吉多·范罗苏姆创造,第一版发布于1991年,可以视之为一种改良的LISP。Python的设计哲学强调代码的可读性和简洁的语法。相比于C++或Java,Python让开发者能够用更少的代码表达想法。
翰林PYTHON数据挖掘培训班
¥19900.00
线上40小时,共20次课
3-5人小班,满3人开班
报名须知
1.适合人群:对大数据人工智能感兴趣,有初步的算法基础;
2.2019年9月7日开课,每周六上课;
3.人工智能基础班3-5人小班,满3人开班;
4.课程目标:快速熟悉常用AI工具,具备参加kaggle、kdd等专业数据挖掘学术活动基本能力。
课程大纲
机器学习基础 四课时
机器学习中的数学基础知识 四课时
模型评估与选择 四课时
线性回归与逻辑回归模型 四课时
决策树 四课时
SVM支持向量机 四课时
贝叶斯网络 四课时
聚类 四课时
神经网络 四课时
特征选择 四课时
授课导师 杨老师
北京邮电大学人工智能、信息安全专业方向博士,丰富的计算机学科知识和项目背景。
课堂教学过程中注重将数学、计算机学科的相关知识和实际生活中的问题相结合,激发学生的学习热情。
授课体系及科目:NOIP计算机学术活动/USACO、Google Code Jam、Kaggle、APIO等国际计算机、信息学、机器人学术活动。
导师推荐书目
1.《机器学习》
作者:周志华
适合人群:初级学者
推荐指数:★★★★★
主要内容:本书介绍了机器学习的基础知识,讨论一些经典而常用的机器学习方法,包括:决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习等。进阶内容涉及特征选择与稀疏学习、计算学习理论、半监督学习、概率图模型、规则学习以及强化学习等。适合大学三年级以上的理工科本科生和研究生,以及具有类似背景对机器学习感兴趣的人士。
推荐理由:《机器学习》(又称“西瓜书”)是机器学习领域的经典入门教材之一,是一本面向机器学习爱好者的启蒙教材,非常适合没有任何背景的初学者看。这本书中每一个概念,甚至每一个概念的来龙去脉都讲得非常清楚,对机器学习中各种算法和理论都是尽量从其原生态的角度进行讲解。
2.《Deep Learning》
作者:Ian Goodfellow/Yoshua Bengio/
Aaron Courville
适合人群:中级到高级学者
推荐指数:★★★★★
主要内容:这本书不但讨论了机器学习的基础知识,而且从学术角度讲解了有效研究深度学习所需的应用数学(线性代数、概率和信息论等)知识,在此基础上,本书进一步讲解了深度学习算法和技术的相关知识。此外,这本书还讲解了深度学习领域当前的研究趋势以及正在发生的变化。
推荐理由:《Deep Learning》出自Goodfellow、Bengio和Courville三位大牛之手(又称“花书”),堪称深度学习的圣经。这本书适合有一定基础的学习者,建议先看周志华老师的“西瓜书”,再看“花书”会更流畅和舒服。
3.《Pattern Recognition and Machine Learning》
作者:Christoper M. Bishop
适合人群:初级到中级学者
推荐指数:★★★★★
主要内容:这是第一本提出贝叶斯方法的模式识别教科书。本书提出了近似推理算法和用于描述概率分布的图模型等多种最新分类方法。这本书介绍模型的行文思路是:基本模型建模—最大似然估计—贝叶斯参数估计—贝叶斯预测。虽然这本书作为入门会比较难,但如果按这个思路去看,就非常清楚了。
推荐理由:这本书给人的最大印象可能就是Everything can be bayesianized(一切都可以贝叶斯化)。这本书结构清晰,内容齐全,是机器学习初学者不可多得的好书。本书要求读者拥有多元微积分学和基础线性代数知识,同时若熟悉一些概率知识的话,对于学习书中包含那些独立的关于基础概率理论的介绍将会很有帮助。
本期福利一
翰林导师推荐书目电子版
《Pattern Recognition and Machine Learning》
免费赠送给您!
(部分资源样图)