Description
康奈尔大学探究项目
基于深度残差网络的大型图像搜索引擎
课题简介
图像搜索,是通过搜索图像文本或者视觉特征,为用户提供互联网上相关图形图像资料检索服务的专业搜索引擎系统,是搜索引擎的一种细分。通过输入与图片名称或内容相似的关键字来进行检索,比如输入 “A man is walking his dog”, 那么引擎会返回一些有男人、狗在走路的图片,另一种通过上传与搜索结果相似的图片进行搜索,比如给出一张牛油果的照片,那么引擎会返回一些其他有关牛油果的照片。图像搜素在如Google,Facebook,Pinterest等公司一直都是及其重要的课题。
深度学习一直是图像分析的重要工具。而深度残差网络(ResNet)在2015年可以说是洗刷了图像方面的各大比赛,以绝对优势取得了多个比赛的冠军。
本课程将带学生初步理解机器学习方法。并利用传统机器学习方法, 分析课程数据库中的所提供的10000张图片及其文本描述,结合ResNet建立一个大型图像搜索引擎。 引擎将实现以文字搜索图片,以及以图片搜索类似图片的功能。
科研方法
AI+X数据驱动型科研
AI+X数据驱动型科研是指使用人工智能(AI)算法,收集、处理、分析具体学科(X)的海量数据,并基于此进行预测,从而获得科学发现的研究方法。与传统的、基于实验或逻辑推理的研究方式相比,AI+X数据驱动型科研可以借助AI算法强大的运算能力,高效地进行大数据分析,具有投入产出比高、适用范围广的优点。
AI+X数据驱动型科研已被广泛地应用于各个领域,利用AI算法研究基因数据,从而进行早期的癌症筛查便是其中一例。基因组与癌症病患的数据千千万万,使用传统的科研方式对其进行分析,工程量大、过程繁琐,在客观上难以实现。但借助AI算法这一便捷的工具,生命科学家便能够以海量的患者的遗传信息为基础,建立数据库,与过往的研究成果进行对照,快速、准确地在两者中发现规律、建立联系,从而使癌症诊断的“标准化”成为可能。
授课导师
康奈尔大学 博士
研究领域:机器学习应用、物理计算、网络与分布式计算等;
多年机器学习相关项目研究经历。
课题要求
本课题适合: 9-12 年级学生,有较强的逻辑思维和抽象思维能力
英文:
具备基本的学术英语阅读能力;
接触过英文写作,有论文写作经验者更佳;
数学:
统计基础知识;
线性代数;
计算机:
有一定的python功底;
Jupyter notebook;
Numpy, pandas, sk-learn。