来源 | Analytics Vidhya
整理 | 磐石
【磐创AI导读】:Github是全球最大的开源代码社区。接下来磐创AI将为大家介绍几个六月Github热点项目库。欢迎大家关注我们的公众号:磐创AI。
目录
对于数据科学和机器学习而言,GitHub无疑是最受欢迎的平台之一。它是在代码和项目之间共享和协作的绝佳工具,它降低了进入开源世界的壁垒,并在传播知识和扩展机器学习社区方面发挥了巨大的作用。
在六月份,有一些惊艳的python项目开放了源代码。从可以定位5000个关键点的姿态估计模型(DensePose)到用一种模型实现多个NLP任务的Salesforce's decaNLP再到包含由详细注释的强化学习算法集合的git库Reinforcement Learning Notebooks。下面将一一进行简单介绍。
接下来,让我们一起看看六月份的热点Git仓库。
今年,人体姿态估计在深度学习界引发了广泛关注。这一趋势在Facebook开放他们的姿态估计框架'DensePose'的源代码后更是被推到了一个新的高度。该技术可识别人体中超过5000个关节点(对于上下文来说,其他方法以10或20个关节进行操作)。从上图中可以看出该技术的实现结果。
DensePose已经在目标检测平台Detectron中创建好并由Caffe2提供支持。除了代码之外,此存储库还包含用于可视化DensePose-COCO数据集的notebook。
尽管自然语言处理(NLP)有吸引力,但它无疑是一个很难步入一个领域。你需要去处理大量非结构化文本,这并不容易。而这个NLP Progress存储库就是专门用于跟进NLP领域最新进展的仓库。它列举了一些非常有用的数据集和当前依存句法分析(depency parsing)、part-of-speech tagging(词性标注)和阅读理解(reading comprehension)的最优方法(state-of-the-art)。
如果你对NLP领域感兴趣或者茫然的话,可以star这个存储仓库并持续关注它的动态。同时,将来还会有一些技术补充到列表里,如信息提取技术,关系抽取技术,语法错误纠正技术(grammatical error correction)等。
模型的大规模应用是数据科学家进入该领域时面临的挑战之一,设计和构建模型又是数据科学家们进行机器学习的原因。但如果你不能将这个模型应用到实际应用中去,它本质上就变成了一块无用的代码。
因此,Databricks(由Spark创建者创建)决定为这些机器学习(ML)模型应用难题构建开源解决方案--名为MLflow,它是一个管理整个机器学习生命周期(从开始到生产)的平台,并且被设计可以使用任何库。自从它发布以来,它获得了极大的关注(GitHub上star数1,355)。
本文另一个NLP存储库推荐。当涉及到情感分析或机器翻译等自然语言处理任务时,一般来说是需要建立专门针对该任务的模型。那么,你有没有建立一个同时可以进行情感分析、语义分析和问答的模型呢?这就是Salesforce研究人员企图用此存储库去实现的效果。
他们发表了一篇研究性论文,概述了一个可以同时完成10个不同NLP任务的模型。在论文中,他们还向社区发起了一个挑战(decaNLP)--你能建立一个这样的模型并改进“我们”提供的方法吗?Salesforce建造的模型被称为“自然语言处理领域的瑞士军刀”。
强化学习日益流行,在开源社区中同样是如此。该存储库是来自Richard Sutton和Andrew Barto的书和其他研究论文中的强化学习算法的集合。这些算法以notebook的格式提供给大家。
存储库的创建者建议大家边看书边实践这些算法,以达到更好的学习目的。这些notebook有着很详细的注释都,很适合有意向进入强化学习的领域的人去学习。
总结:
以上是对六月份github上几个热点的项目仓库的整理总结,涵盖计算机视觉、自然语言处理、强化学习多个领域。希望对你有所帮助,同时欢迎在评论中留言讨论和推荐一些其他不错的git存储库。
翰林课程体验,退费流程快速投诉邮箱: yuxi@linstitute.net 沪ICP备2023009024号-1