Description
南加州大学探究项目
谷歌商店消费者花费预测 - Kaggle学术活动
课题简介
电子商务平台近几年来发展迅猛,出现在生活的方方面面,如淘宝、京东。电子商务平台并不仅包括海量商品数据,更有海量的消费者行为数据(如消费者的浏览时间、次数)。消费者在电子商务平台上产生的大量行为数据,使得分析消费者的购买意图和消费习惯成为可能。营销团队如果可以预测客户的消费水平,便可以调整促销策略从而更好地服务客户,提高运营效率以及企业收入。
Rstudio, Google Cloud 与Kaggle 联手打造本次学术活动:Google Analytics Customer Revenue Prediction。在本次学术活动中,参赛者要挑战分析 Google Merchandise Store(也称为GStore,销售 Google 周边的电子商城)客户数据集,以预测每位客户的花费,以为公司提供必要的远见。学术活动于2018年9月15日开启,结束时间为2018年11月15日,目前全球已有990支队伍参与。
科研方法
AI+X数据驱动型科研
AI+X数据驱动型科研是指使用人工智能(AI)算法,收集、处理、分析具体学科(X)的海量数据,并基于此进行预测,从而获得科学发现的研究方法。与传统的、基于实验或逻辑推理的研究方式相比,AI+X数据驱动型科研可以借助AI算法强大的运算能力,高效地进行大数据分析,具有投入产出比高、适用范围广的优点。
AI+X数据驱动型科研已被广泛地应用于各个领域,利用AI算法研究基因数据,从而进行早期的癌症筛查便是其中一例。基因组与癌症病患的数据千千万万,使用传统的科研方式对其进行分析,工程量大、过程繁琐,在客观上难以实现。但借助AI算法这一便捷的工具,生命科学家便能够以海量的患者的遗传信息为基础,建立数据库,与过往的研究成果进行对照,快速、准确地在两者中发现规律、建立联系,从而使癌症诊断的“标准化”成为可能。
整个科研教学流程中,每一位学员都将有学术督导协助保障研究阶段性作业和论文的进度,确保取得研究成果。
授课导师
1. 丰富的数据科学领域项目研究经验;
2. 研究方向:计算机科学。
课题要求
本课题适合: 9-12 年级学生,有较强的逻辑思维和抽象思维能力
1. 英文:
(1)具备基本的学术英语阅读能力;
(2)接触过英文写作,能初步撰写英文文章;
2. 数学:
(1)统计基础;
(2)微积分和线性代数基础;
3. 计算机:
(1)Python 基础 (基础数据结构、条件、循环、方法);
(2)Numpy, Pandas, Seaborn, Scikit-Learn (了解这些工具的用途、如何利用技术文档即