Description
CMU探究项目
利用卷积神经网络进行图像分类
课题简介
图像分类是根据图像的语义信息将不同类别图像区分开来,是计算机视觉中重要的基本问题,也是图像检测、图像分割、物体跟踪、行为分析等其他高层视觉任务的基础。图像分类在很多领域有广泛应用,包括安防领域的人脸识别和智能视频分析等,交通领域的交通场景识别,互联网领域基于内容的图像检索和相册自动归类,医学领域的图像识别等。
卷积神经网络是神经网络方法中专门用于计算机视觉的一类神经网络。它是目前解决许多计算机视觉任务的最优方法,其中最典型的是图像分类问题。图像分类问题的简单描述如下:给定一张图片和备选的几个类别,计算机能够自动判断该图片属于备选类别中的哪一类。这个任务最直接简单而有效的应用场景之一,就是手写字识别:给定一张手写图片,计算机能够自动识别该图片是什么字符,从而达到手写输入的效果。
MNIST和CIFAR10数据集是两个非常经典的图像分类数据集。前者包含0~9共十个数字手写体的图片。后者包含10种物体(比如飞机、汽车、鸟类)的图片。卷积神经网络能在这两个数据集上达到非常好的分类效果。
本课题旨在通过在这些数据集上完成基本的分类任务,让学生学习到卷积神经网络的原理,包括反向传播,随机梯度下降等,且让学生基本掌握深度学习,并能够认识到深度学习实战中的各种困难,比如数据过拟合。
科研方法
AI+X数据驱动型科研
使用人工智能(AI)算法,收集、处理、分析具体学科(X)的海量数据,并基于此进行预测,从而获得科学发现的研究方法。与传统的、基于实验或逻辑推理的研究方式相比,AI+X数据驱动型科研可以借助AI算法强大的运算能力,高效地进行大数据分析,具有投入产出比高、适用范围广的优点。
AI+X数据驱动型科研已被广泛地应用于各个领域,利用AI算法研究基因数据,从而进行早期的癌症筛查便是其中一例。基因组与癌症病患的数据千千万万,使用传统的科研方式对其进行分析,工程量大、过程繁琐,在客观上难以实现。
但借助AI算法这一便捷的工具,生命科学家便能够以海量的患者的遗传信息为基础,建立数据库,与过往的研究成果进行对照,快速、准确地在两者中发现规律、建立联系,从而使癌症诊断的“标准化”成为可能。
高中生/本科生 科研项目
资讯 · 课程 · 全程指导
咨询请添加顾问老师
授课导师
1. 卡内基梅隆大学硕士;
2. 担任多家国内外公司的软件工程师,如Airdoc, Deepglint;
3. 研究方向:机器学习及计算机视觉
课题要求
本课题适合: 9-12 年级学生,有较强的逻辑思维和抽象思维能力:
英文:
1、具备基本的学术英语阅读能力;
2、接触过英文写作,有论文写作经验者更佳;
数学:
微积分与函数求导;
计算机:
1、最好有一定的计算机基础和编程能力;
2、Python(Numpy)