背景提升之USC探究项目

Category: STEM国际竞赛 Date: 2020年3月25日下午6:25

南加利福尼亚大学简称南加大（USC），是美国西海岸最古老的顶尖私立研究型大学，是美国大学协会和环太平洋大学联盟成员。南加大常年被U.S.News评为全美本科最难被录取的大学之一。并且南加大在硅谷校友人数位居全美高校第四，被美国国土安全部选为第一所国土安全卓越中心。今天小编想要为大家介绍俩个南加大的科研探究项目。

USC探究项目：电影评论中的情感和舆情分析

课题简介

自然语言处理（Natural Language Processing）是计算机科学领域与人工智能领域中的一个重要研究方向。以实现人与计算机之间通过自然语言进行有效通信为研究目的，通过统计学的方法，利用计算机处理大规模自然语言数据。自然语言处理是一门融合计算语言学、计算机科学、数学于一体的科学，其研究有广泛的应用，包括语音识别、自然语言理解、自然语言生成、机器翻译、对话系统等。

情感分析通常使用自然语言处理技术，识别客户评论的语义情感，语句表达的情绪正负面，或者通过分析语音及文字判断其表达的情感等来完成广义上的主观分析。经过初步的学习了解机器学习之后，学生可以独立利用开源数据库对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程，如从电影评论中分析用户对电影的评价。

本次课题结合机器学习和自然语言处理两门学科，在帮助学生加深对数学线性代数和机器学习重要算法应用了解的同时，还可以让学生利用所学知识对机器学习中向量机算法构建数学模型对词语情感进行分析探究。最后对比其他主流算法，帮助学生进行结果预测和对结果预测的原因分析。

科研方法

AI＋X数据驱动型科研

使用人工智能（AI）算法，收集、处理、分析具体学科（X）的海量数据，并基于此进行预测，从而获得科学发现的研究方法。与传统的、基于实验或逻辑推理的研究方式相比，AI＋X数据驱动型科研可以借助AI算法强大的运算能力，高效地进行大数据分析，具有投入产出比高、适用范围广的优点。

AI＋X数据驱动型科研已被广泛地应用于各个领域，利用AI算法研究基因数据，从而进行早期的癌症筛查便是其中一例。基因组与癌症病患的数据千千万万，使用传统的科研方式对其进行分析，工程量大、过程繁琐，在客观上难以实现。

但借助AI算法这一便捷的工具，生命科学家便能够以海量的患者的遗传信息为基础，建立数据库，与过往的研究成果进行对照，快速、准确地在两者中发现规律、建立联系，从而使癌症诊断的“标准化”成为可能。

授课导师

南加州大学计算机专业硕士

南加大计算机专业硕士在读；

本科计算机与应用数学双专业毕业于伦斯勒理工学院；

曾研究韩语识别算法研究，英语字词变换研究；

本科期间获得院长优秀学生嘉许名单

课题要求

本课题适合： 9-12 年级学生，有较强的逻辑思维和抽象思维能力：

英文：

具备基本的学术英语阅读能力；

接触过英文写作，能初步撰写英文文章；

数学：

概率统计基础知识；

线性回归；

微积分基础；

线性代数；

计算机：

Python NLTK；

Python编程基础；

Numpy库基础；

Scikit-learn；

USC科研课题：基于ImageNet数据集的深度学习算法优化研究

课题简介

深度学习（Deep Learning）是人工智能（Artificial Intelligence）近几年最热门的研究领域。这个领域内接连诞生了AlphaGo、人脸识别、无人驾驶汽车等重量级应用，掀起了一场席卷全世界的科技革命浪潮。深度学习，顾名思义，就是利用多层卷积神经网络（Convolutional Neural Network）对海量数据进行运算分析的技术。深度学习在很多领域展现了强大的应用能力，在某些试听识别中的表现甚至超越了人类专家。

图像分类（Image Classification）是深度学习中应用最早也是应用最为广泛的部分，由于现实世界中图像分类问题的数据量往往很小，所以常常通过迁移学习（Transfer Learning）来完成。近几年来，深度学习已经成为很多图像研究者们的首选方法，很多讨论深度学习技术的文章被收录在顶级学术杂志期刊如Nature、Science、Cell中。

作为深度学习中应用最广泛的部分，图像分类的意义可以说举足轻重。事实上，深度卷积神经网络模型在2012年横空出世将图像分类的最高级别的比赛ImageNet的准确率提高了不止一个档次。自此，每年的冠军模型都是基于深度卷积神经网络开发出来的，并且在2015年，图像分类的准确率已经高于了人类。

本课题旨在介绍深度卷积神经网络结构，并且就从ImageNet数据集当中挑选一小部分作为突破口，来探究深度学习的来龙去脉。除此之外，本课题还紧跟学术前沿，介绍当下流行的几种准确率最高的模型，并且比较它们之间的区别。

本课题还介绍迁移学习的目的及必要性、应用成熟的模型对数据集进行调试的方法，并且比较图像分类方法的准确率，旨在让学生从理论到实践全面了解深度学习。

科研方法

AI＋X数据驱动型科研

授课导师

南加州大学生物医学工程专业博士

南加州大学生物医学工程专业博士在读；

研究方向为使用机器学习算法分类生物医学影像；

现担任USC生物医学工程专业助教。

课题要求

本课题适合： 9-12 年级学生，有较强的逻辑思维和抽象思维能力：