机器学习开源项目精选top30

botoo botoo     2022-10-14     739

关键词:

本文共图文结合,建议阅读5分钟。
本文为大家带来了30个广受好评的机器学习开源项目。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

最近,Mybridge发布了一篇文章,对比了过去一年中机器学习领域大约8800个开源项目后,选出30个2017年度优秀的开源项目,包含机器学习开源库、数据库以及其他应用程序,这些项目差不多都是在2017年1-12月发布。Mybridge AI通过受欢迎度、参与度以及其他方面对开源项目进行评定。

对于机器学习者来说,阅读开源代码并基于代码构建自己的项目,是一个非常有效的学习方法。看看以下这些Github上平均star为3558的开源项目,你错了哪些?

在开始之前,先推荐阅读

A. 神经网络:深度学习 A-ZTM : 亲手搭建人工神经网络(推荐次数68,745 , 4.5/5 stars)

链接:http://bit.ly/2CH1WcQ

0?wx_fmt=jpeg

B. 用Python进行深度学习的TensorFlow的完整指南(推荐次数17,834, 4.6/5 stars)

链接:http://bit.ly/2EatVy7

0?wx_fmt=jpeg

接下来是Mybridge精选的Top 30的项目:

  1. FastText:快速文本表示和文本分类库(Github上有11786颗星,贡献者Facebook Research

源码链接:https://github.com/facebookresearch/MUSE

0?wx_fmt=jpeg

  1. Deep-photo-styletransfer:“Deep Photo Style Transfer” 这篇论文的源码和数据。(GitHub 9747颗星,论文来自于康奈尔大学的Fujun Luan)

源码链接:https://github.com/luanfujun/deep-photo-styletransfer

0?wx_fmt=jpeg

  1. 用Python和命令行来实现的最简单的面部识别API(GitHub 8672颗星,贡献者Adam Geitgey)

源码链接:https://github.com/ageitgey/face_recognition

0?wx_fmt=jpeg

  1. Magenta:利用机器智能生成音乐和美术艺术品(GitHub 8113颗星)

源码链接:https://github.com/tensorflow/magenta

0?wx_fmt=jpeg

  1. Sonnet:基于TensorFlow的神经网络库(GitHub 573颗星,贡献者是DeepMind的Malcolm Reynolds )

源码链接:https://github.com/deepmind/sonnet

0?wx_fmt=jpeg

  1. deeplearn.js: 一个用于Web的硬件加速机器学习库(GitHub 5462颗星,贡献者是Google Brain的Nikhil Thorat)

源码链接:https://github.com/PAIR-code/deeplearnjs

0?wx_fmt=jpeg

  1. 基于TensorFlow的快速风格迁移库(GitHub 4843颗星,贡献者是MIT的Logan Engstrom)

源码链接:https://github.com/lengstrom/fast-style-transfer

0?wx_fmt=jpeg

  1. Pysc2: 星际争霸2学习环境(GitHub 3684颗星,贡献者是DeepMind的Timo Ewalds)

源码链接:https://github.com/deepmind/pysc2

0?wx_fmt=jpeg

  1. AirSim: Microsoft AI & Research开源的基于虚幻引擎的开源模拟器,用于自动驾驶(GitHub 3861颗星,贡献者是Microsoft的Shital Shah)

源码链接:https://github.com/Microsoft/AirSim

0?wx_fmt=jpeg

  1. acets: 机器学习数据集的可视化工具(GitHub 3371颗星,由Google Brain贡献)

源码链接:https://github.com/PAIR-code/facets

0?wx_fmt=jpeg

  1. Style2Paints:用AI技术为线稿快速上色的工具(GitHub 3310颗星)

源码链接:https://github.com/lllyasviel/style2paints

0?wx_fmt=jpeg

  1. Tensor2Tensor:一个用于广义序列-序列模型的库 - Google Research(GitHub 3087颗星,贡献者是Google Brain的Ryan Sepassi)

源码链接:https://github.com/tensorflow/tensor2tensor

0?wx_fmt=jpeg

  1. 基于Pytorch实现的图片-图片转换(GitHub 2847颗星,贡献者Berkeley的Jun-Yan Zhu, Ph.D)

源码地址:https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix

0?wx_fmt=jpeg

  1. Faiss:用于密集向量的高效相似性搜索库和聚类的库(GitHub 2629颗星,贡献者Facebook Research)

源码地址:https://github.com/facebookresearch/faiss

0?wx_fmt=jpeg

  1. Fashion-minist:类似于MNIST的时尚产品数据集(GitHub 2780颗星,贡献者是Zalando Tech的Han Xiao)

源码链接:https://github.com/zalandoresearch/fashion-mnist

0?wx_fmt=jpeg

  1. ParlAI: 一个可用在各种公开可用的对话数据集上训练和评估AI模型的框架(GitHub 2578颗星,贡献者是Facebook 的Alexander Miller)

源码链接:https://github.com/facebookresearch/ParlAI

0?wx_fmt=jpeg

  1. Fairseq:Facebook AI Research的序列-序列工具包(GitHub 2571颗星)

源码链接:https://github.com/facebookresearch/fairseq

0?wx_fmt=jpeg

  1. Pyro:基于Python和PyTorch的深度通用概率编程(GitHub 2387颗星,贡献者Uber Engineering)

源码链接:https://github.com/uber/pyro

0?wx_fmt=jpeg

  1. iGAN:基于GAN的交互式图像生成(GitHub 2369颗星)

源码地址:https://github.com/junyanz/iGAN

0?wx_fmt=jpeg

  1. Deep-image-prior:用神经网络恢复图像(GitHub 2188颗星,贡献者是Skoltech的Dmitry Ulyanov, Ph.D)

源码地址:https://github.com/DmitryUlyanov/deep-image-prior

0?wx_fmt=jpeg

  1. 人脸分类:基于 Keras CNN 模型与 OpenCV ,使用fer2013/imdb 数据集进行实时面部检测和表情/性别分类(GitHub 1967颗星)

源码地址:https://github.com/oarriaga/face_classification

0?wx_fmt=jpeg

  1. Speech-to-Text-WaveNet:使用DeepMind的WaveNet和TensorFlow进行端到端句级英语语音识别(GitHub 1961颗星,贡献者是Kakao Brain的Namju Kim)

源码地址:https://github.com/buriburisuri/speech-to-text-wavenet

0?wx_fmt=jpeg

  1. StarGAN: 用于多域图像-图像转化的统一生成对抗网络(GitHub 1954颗星,贡献者Korea University的Yunjey Choi)

源码地址:https://github.com/yunjey/StarGAN

0?wx_fmt=jpeg

  1. MI-agents:Unity机器学习代理(GitHub 1658颗星,贡献者Unity3D的Arthur Juliani)

源码地址:https://github.com/Unity-Technologies/ml-agents

0?wx_fmt=jpeg

  1. DeepVideoAnalytics:一个分布式可视化搜索和数据分析平台(GitHub 1494颗星,贡献者是Cornell University 的Akshay Bhat)

源码地址:https://github.com/AKSHAYUBHAT/DeepVideoAnalytics

0?wx_fmt=jpeg

  1. OpenNMT:Torch上的开源神经机器翻译工具包(GitHub 1490颗星)

源码地址:https://github.com/OpenNMT/OpenNMT

0?wx_fmt=jpeg

  1. Pix2pixHD: 用条件GAN合成和处理2048×1024的图像(GitHub 1283颗星,贡献者是英伟达科学家 Ming-Yu Liu)

源码地址:https://github.com/NVIDIA/pix2pixHD

0?wx_fmt=jpeg

  1. Horovod:TensorFlow 布式 训练框架(GitHub 1188 颗星,贡献者来自Uber )

源码地址:https://github.com/uber/horovod

0?wx_fmt=jpeg

  1. AI-Blocks: 一个强大而直观的所见即所得界面,可让任何人创建机器学习模型(GitHub 899颗星)

源码地址:https://github.com/MrNothing/AI-Blocks

0?wx_fmt=jpeg

  1. Tensorflow实现的用于语音风格转换的深度神经网络(GitHub 845颗星,贡献者是Kakao Brain AI团队的Dabi Ahn)

源码地址:https://github.com/andabi/deep-voice-conversion

0?wx_fmt=jpeg

原文链接:

https://medium.mybridge.co/30-amazing-machine-learning-projects-for-the-past-year-v-2018-b853b8621ac

从15000个python开源项目中精选的top30,github平均star为3707,赶紧收藏

继推出2017年机器学习开源项目Top30榜单后,MybridgeAI又推出了一个Python开源项目Top30榜单,包括开源Python库、工具等。该榜单基于项目质量、用户参与度以及其他几个方面进行了评估,从大约15000个开源项目中挑选了Top3... 查看详情

ruby我们对比了github的上8800个开源机器学习项目,并选出了其中的top30(代码片段)

查看详情

nlp讯飞英文学术论文分类挑战赛top10开源多方案–4机器学习lgb方案(代码片段)

...案【NLP】讯飞英文学术论文分类挑战赛Top10开源多方案–4机器学习LGB方案【NLP】讯飞英文学术论文分类挑战赛Top10开源多方案–5Bert方案【N 查看详情

nlp讯飞英文学术论文分类挑战赛top10开源多方案–4机器学习lgb方案(代码片段)

...案【NLP】讯飞英文学术论文分类挑战赛Top10开源多方案–4机器学习LGB方案【NLP】讯飞英文学术论文分类挑战赛Top10开源多方案–5Bert方案【N 查看详情

常用面试/笔试开源小项目21~30

深度学习/机器视觉/数字IC/FPGA/算法手撕代码目录总汇目录1.将一个正整数分解质因数2.求高次方数的尾数3.计算厄密多项式 查看详情

《mlpapersexplained》开源项目!

 Datawhale干货 方向:机器学习,编辑:AI科技评论机器学习领域的研究进展迅速,研究者既要及时跟进最新研究,也要不时地回顾经典。寒假开始,各位机器学习er在度假之余,想必也不会忘了自己卷... 查看详情

dmlc:最大开源分布式机器学习项目

  为了实现分布式机器学习领域中代码的共享与共同开发,分布式机器学习社区(DMLC)近日正式发布。作为一个开源项目,DMLC的相关代码直接托管在GitHub中,并采用Apache2.0协议进行维护。DMLC项目的发起者陈天奇怪(网名... 查看详情

开源大数据热力榜单top30

本报告从102个入围项目中,评选出了TOP30热力榜单。Kibana以989.40的热力值高居榜首。ClickHouse(数据查询与分析)、Airflow(数据调度与编排)、Flink(流处理)、Airbyte(数据集成)分别摘得各自... 查看详情

开源大数据热力榜单top30

...。Pulsar、Doris、StarRocks、DolphinScheduler、SeaTunnel等一众中国开源项目也表现出高热力趋势。把解决用户痛点作为核心竞争力,是这些优秀开源项目的共同特征,这一特征保证它们与时俱进,成为热力趋势中的“常青树”... 查看详情

开源大数据热力榜单top30

...。Pulsar、Doris、StarRocks、DolphinScheduler、SeaTunnel等一众中国开源项目也表现出高热力趋势。把解决用户痛点作为核心竞争力,是这些优秀开源项目的共同特征,这一特征保证它们与时俱进,成为热力趋势中的“常青树”... 查看详情

2022年infoworld精选最佳开源软件

...最重要和最具创新性的应用程序开发、devops、数据分析和机器学习工具。接下来具体看看每一个项目(点击项目名可跳转进入项目主页)。AlmaLinuxAlmaLinux是开放源码的、社区驱动的项目,一开始是作为CentOS的替代品&#x... 查看详情

kkswarm|基于强化学习的开源机器人集群项目,支持理论快速落地

开源机器人创业公司眼中的凯文凯利​开源机器人集群项目KKSwarm,由易科机器人实验室和阿木实验室联合匠心打造。一、KKSwarm开源项目的目标:旨在为研究人员搭建一个高效、易用的集群研究平台,同时虚拟仿真层... 查看详情

kkswarm|基于强化学习的开源机器人集群项目,支持理论快速落地

开源机器人创业公司眼中的凯文凯利​开源机器人集群项目KKSwarm,由易科机器人实验室和阿木实验室联合匠心打造。一、KKSwarm开源项目的目标:旨在为研究人员搭建一个高效、易用的集群研究平台,同时虚拟仿真层... 查看详情

国内最火的htmlcssjavascript开源项目top榜,你知多少?

...握好这些知识?通过了解当下火热的开源项目不乏为最佳学习姿势。本文盘点国内评分最高且收藏量超过100的前端技术开源项目,希望可以帮助更多的开发者扩展学习。 1.极简模块化前端UI框架Layui 评分:9.3;收藏量:873... 查看详情

人工智能第二课机器学习orange开源项目

...nge有个大概的了解,目前我的看法是Orange是做数据挖掘和机器学习开发的框架平台,它本身应该已经包含了好多数据挖掘和分析的算法。本文暂时用来保存学习资料,源代码已经下载到本地,明天开始安装学习。Orange是一个基于... 查看详情

程序员10个入门级的机器学习开源项目

要开始为开源项目做贡献,有一些先决条件:1.学习一门编程语言:由于在开源贡献中你需要编写代码才能参与开发,你需要学习任意一门编程语言。根据项目的需要,在后期学习另一种语言很容易。2.熟悉版... 查看详情

c精选开源代码学习2webbench(代码片段)

C精选开源代码学习2Web-Bench一、简介二、下载源码三、编译使用四、源码分析1.make文件分析2.socket.c文件(1)入口函数(2)全局变量(3)bench函数(4)请求核心函数`benchcore`(5)build_request一、简介Web-Bench是一款优秀的C语言开发的性能压... 查看详情

常用面试/笔试开源小项目13~20

深度学习/机器视觉/数字IC/FPGA/算法手撕代码目录总汇目录1.“抢30”游戏2.24点问题3.爱因斯坦的数学题4.搬山游戏 查看详情