本课题目的是培养对大数据的理解和运用,研究如何使其服务与解决商务问题。了解、学习对于大数据的整理,预处理,可视化,分析等数据挖掘(data mining)的各项步骤。最后通过以市场营销学,宏观经济学理论为驱动,最前沿的机器学习为方法来搭建一个可以分类客户群体、预测客户购买意向的模型,从而根据结果提出商务建议。
近几年来互联网商务的迅速发展使产品销售的渠道不仅仅局限与传统实体市场中,但销售方式的转换并没有以同样的速度来适应这种不断拓宽的销售渠道,在为在线购物者提供定制的促销活动需要更加精确客观的解决方案和计划。在当前竞争如此激烈的商务环境下,如何把合适的商品推荐给潜在的消费者或如和维护现有消费者群体是每一个互联网商家的核心研究问题。获得,分析,运用在线消费者数据是每个线上产品商家和平台解决上面问题的必备能力。
目前各大线上商家和平台已经不断在学习和开始使用互联网商务数据。例如,作为北美电商销售的巨头亚马逊会根据消费者商品浏览历史,购买记录向消费者提供类似相关商品的推荐和折扣信息来鼓励刺激消费者的购买。
AI+X数据驱动型科研
AI+X数据驱动型科研是指使用人工智能(AI)算法,收集、处理、分析具体学科(X)的海量数据,并基于此进行预测,从而获得科学发现的研究方法。与传统的、基于实验或逻辑推理的研究方式相比,AI+X数据驱动型科研可以借助AI算法强大的运算能力,高效地进行大数据分析,具有投入产出比高、适用范围广的优点。
AI+X数据驱动型科研已被广泛地应用于各个领域,利用AI算法研究基因数据,从而进行早期的癌症筛查便是其中一例。基因组与癌症病患的数据千千万万,使用传统的科研方式对其进行分析,工程量大、过程繁琐,在客观上难以实现。但借助AI算法这一便捷的工具,生命科学家便能够以海量的患者的遗传信息为基础,建立数据库,与过往的研究成果进行对照,快速、准确地在两者中发现规律、建立联系,从而使癌症诊断的“标准化”成为可能。
本课题适合: 9-12 年级学生,有较强的逻辑思维和抽象思维能力
1. 英文: (1)具备基本的学术英语阅读能力; (2)接触过英文写作,有论文写作经验者更佳;
2. 数学: (1)概率统计; (2)线性回归; (3)逻辑回归
3. 计算机: (1)Pandas; (2)Scikit-Learn; (3)Seaborn (基于matplotlib的数据可视化库)
© 2024. All Rights Reserved. 沪ICP备2023009024号-1