过去一个月里, 测评了多达 250 个开源项目并比较了这些项目的最新和主力版本,根据多种指标进行排名,给大家找出最干货的项目Top10。
● 入榜项目Github平均得星:1,041 ⭐️
● 涵盖话题:DensePose,图像分类,多尺度训练,移动AI计算引擎,卫星图像,NLP,Python包,字检测,NCRF,DALI
希望以下开源项目能助你兴趣发扬、灵感激荡。
DensePose: Facebook带你突破次元壁!
Github得星:2901 ⭐️
Facebook AI Research(FAIR)于今年6月18号开源了将2D RGB图像的所有人类像素映射到身体的3D表面模型的实时方法DensePose,这意味着二次元的人类图片可以被转化成三次元模型!有什么用呢?比如网购的时候传一张自己的照片就可以直接试衣服而且效果感人,比如在手机上有如在练功房一样学跳舞……DensePose在单个GPU上以每秒多帧的速度运行,可以同时处理数十甚至数百个人。
项目地址:https://github.com/facebookresearch/DensePose
Darts: 指数级加速架构搜索
Github得星:1128 ⭐️
卡耐基梅隆大学(CMU)在读博士刘寒骁、DeepMind 研究员 Karen Simonyan 以及 CMU 教授杨一鸣提出的「可微架构搜索」DARTS(Differentiable Architecture Search)方法基于连续搜索空间的梯度下降,可让计算机更高效地搜索神经网络架构。据论文所述,DARTS在发现高性能的图像分类卷积架构和语言建模循环架构中皆表现优异,而且速度比之前最优的不可微方法快了几个数量级,所用 GPU 算力有时甚至仅为此前搜索方法的 700 分之 1,这意味着单块 GPU 也可以完成任务。
论文链接:https://arxiv.org/abs/1806.09055
SNIPER:高效的多尺度物体检测算法
Github得星:1352 ⭐️
SNIPER是一种有效的多尺度训练方法,用于实例级识别任务,如对象检测和实例级分割。 SNIPER不是处理图像金字塔中的所有像素,而是选择性地处理地面实况对象周围的上下文区域(a.k.a芯片)。由于它在低分辨率芯片上运行,因此显著加速了多尺度训练。由于其内存高效设计,SNIPER可以在训练期间受益于批量标准化,并且可以在单个GPU上实现更大批量大小的实例级识别任务。
项目地址:https://github.com/mahyarnajibi/SNIPER
Mace: 米家移动端深度学习前向预测框架
Github得星:2118 ⭐️
Mobile AI Compute Engine (MACE) 是一个专为移动端异构计算设备优化的深度学习前向预测框架。 MACE覆盖了常见的移动端计算设备(CPU,GPU和DSP),并且提供了完整的工具链和文档,用户借助MACE能够 很方便地在移动端部署深度学习模型。MACE已经在小米内部广泛使用并且被充分验证具有业界领先的性能和稳定性。
项目地址:https://github.com/XiaoMi/mace
Robosat: 航空和卫星图像的语义分割
Github得星: 776⭐️
RoboSat是一个用Python 3编写的端到端管道,用于从航空和卫星图像中提取特征。 特征可以是图像中视觉上可区分的任何内容,例如:建筑物,停车场,道路或汽车。
项目地址:https://github.com/mapbox/robosat
decaNLP :自然语言处理十项全能
Github得星:886 ⭐️
这是一个能同时处理回答问题、机器翻译、文本综述、自然语言推理、语义分析、语义标注、零样本关系提取、面向目标的对话、语义解析和常识名词解析十项自然语言任务的通用模型,由Salesforce发布,号称是NLP领域的瑞士军刀。
项目地址:https://github.com/salesforce/decaNLP
Magnitude: 快速简单的向量嵌入实体库
Github得星: 427 ⭐️
功能丰富的Python包和矢量存储文件格式,用于在Plasticity开发的快速、高效、简单的方式中将矢量嵌入用于机器学习模型。 它主要是为Gensim提供更简单/更快速的替代方案,但可以用作NLP之外的域的通用密钥向量存储。
项目地址:https://github.com/plasticityai/magnitude
Porcupine :基于设备的语言唤醒检测引擎
Github得星:373 ⭐️
Porcupine是一款自助式,高精度,轻量级的唤醒字检测引擎。 它使开发人员搭建具有语言功能、始终处于聆听状态的应用或平台。 开发人员有权在几秒钟内选择任何唤醒词并构建其模型。使用在真实情况下训练的深度神经网络(即噪声和混响)。紧凑且计算效率高,使其适用于物联网应用。跨平台。 它以纯定点ANSI C实现。目前支持Raspberry Pi,Android,iOS,watchOS,Linux,Mac和Windows。具备可扩展性。它可以同时检测数十个唤醒字,几乎没有额外的内存占用。
项目地址:https://github.com/Picovoice/Porcupine
NCRF: 百度利用神经条件随机场检测癌症转移
Github得星: 290⭐️
百度研究人员提出一种神经条件随机场(neural conditional random field,NCRF)深度学习框架,来检测 WSI 中的癌细胞转移,在提升肿瘤图像准确率的同时也减少了假阳性的出现几率。NCRF 通过一个直接位于 CNN 特征提取器上方的全连接 CRF,来考虑相邻图像块之间的空间关联。整个深度网络可以使用标准反向传播算法,以最小算力进行端到端的训练。CNN 特征提取器也可以从利用 CRF 考虑空间关联中受益。与不考虑空间关联的基线方法相比,NCRF 框架可获取更高视觉质量的图像块预测概率图。
项目地址:https://github.com/baidu-research/NCRF
DALI:NVIDIA快速图像增强的简便大法
Github得星: 420⭐️
NVIDIA DALI是一个GPU加速的数据增强和图像加载库,为优化深度学习框架数据pipeline而设计,DALI 提供加速不同数据管道的性能和灵活性,作为一个单独的库,可以轻松集成到不同的深度学习训练和推理应用程序中。
DALI 的主要亮点包括:
● 从磁盘读取到准备训练/推断的完整的数据流水线;
● 具有可配置图形和自定义operator的自定义数据pipeline;
● 支持图像分类和分割工作量;
● 通过框架插件和开源绑定轻松实现集成(MxNet、TensorFlow、PyTorch等);
● 具有多种输入格式的可移植训练工作流 - JPEG,LMDB,RecordIO,TFRecord;
项目地址:https://github.com/NVIDIA/DALI
© 2024. All Rights Reserved. 沪ICP备2023009024号-1