国外程序员整理的机器学习财富大全

By admin in 天文学 on 2019年3月13日

推荐!海外程序员整理的机器学习能源大全

正文汇编了一些机械学习世界的框架、库以及软件(按编制程序语言排序)。

伯乐在线已在 GitHub
上发起「机器学习能源大全粤语版」的整理。欢迎扩散、欢迎参预。

https://github.com/jobbole/awesome-machine-learning-cn

C++

处理器视觉

  • CCV —基于C语言/提供缓存/大旨的机械视觉库,新颖的机器视觉库
  • OpenCV—它提供C++, C, Python, Java 以及
    MATLAB接口,并协助Windows, Linux, Android and Mac OS操作系统。

通用机械学习

Closure

通用机械学习

Go

自然语言处理

  • go-porterstemmer—二个波特词干提取算法的原生Go语言净室达成
  • paicehusk—Paice/Husk词干提取算法的Go语言完毕
  • snowball—Go语言版的Snowball词干提取器

通用机械学习

  • Go Learn— Go语言机器学习库
  • go-pr —Go语言机器学习包.
  • bayesian—Go语言朴素贝叶斯分类库。
  • go-galib—Go语言遗传算法库。

数据解析/数据可视化

  • go-graph—Go语言图形库。
  • SVGo—Go语言的SVG生成库。

Java

自然语言处理

  • CoreNLP—洛桑联邦理管理高校的CoreNLP提供一名目繁多的自然语言处理工具,输入原始德语文本,能够交到单词的主导格局(上边Stanford伊始的多少个工具都含有在那之中)。
  • Stanford
    Parser
    —多个自然语言解析器。
  • Stanford POS
    Tagger
     —1个词性分类器。
  • Stanford Name Entity
    Recognizer
    —Java完结的称谓识别器
  • Stanford Word
    Segmenter
    —分词器,很多NLP工作中都要用到的专业预处理步骤。
  • Tregex, Tsurgeon and
    Semgrex
     —用来在树状数据结构中展开格局匹配,基于树关系以及节点匹配的正则表明式(名字是“tree
    regular expressions”的缩写)。
  • Stanford
    Phrasal:
    流行的根据总结短语的机械翻译系统,java编写
  • Stanford Tokens
    Regex
    —用以定义文本形式的框架。
  • Stanford Temporal
    Tagger
    —SUTime是2个鉴定识别并规范时间表明式的库。
  • Stanford
    SPIED
    —在种子集上行使方式,以迭代形式从无标签文本中学习字符实体
  • Stanford Topic Modeling
    Toolbox
     —为社科家及其余希望分析数据集的人手提供的大旨建立模型工具。
  • Twitter Text
    Java
    —Java完成的推文(Tweet)文本处理库
  • MALLET -—基于Java的计算自然语言处理、文书档案分类、聚类、主题建模、音信提取以及任何机器学习文件应用包。
  • OpenNLP—处理自然语言文本的机器学习工具包。
  • LingPipe —使用微机语言学处理公事的工具包。

通用机械学习

  • MLlib in Apache
    Spark
    —斯Parker中的分布式机器学习程序库
  • Mahout —分布式的机器学习库
  • Stanford
    Classifier
     —早稻田大学的分类器
  • Weka—Weka是数据挖掘地方的机器学习算法集。
  • ORYX—提供一个大概的普遍实时机器学习/预测分析基础架构。

数据解析/数据可视化

  • Hadoop—大数目解析平台
  • Spark—火速通用的广泛数据处理引擎。
  • Impala —为Hadoop完成实时查询

 

Javascript

自然语言处理

  • Twitter-text-js —JavaScript达成的Twitter文本处理库
  • NLP.js —javascript及coffeescript编写的NLP工具
  • natural—Node下的通用NLP工具
  • Knwl.js—JS编写的自然语言处理器

 

数码解析/数据可视化

通用机械学习

  • Convnet.js—陶冶深度学习模型的JavaScript库。
  • Clustering.js—用JavaScript完成的聚类算法,供Node.js及浏览器选取。
  • Decision
    Trees
    —Node.js达成的决策树,使用ID3算法。
  • Node-fann —Node.js下的敏捷人工神经互联网库。
  • Kmeans.js—k-means算法的简要Javascript达成,供Node.js及浏览器选择。
  • LDA.js —供Node.js用的LDA核心建立模型工具。
  • Learning.js—逻辑回归/c4.5决策树的JavaScript实现
  • Machine
    Learning
    —Node.js的机械学习库。
  • Node-SVM—Node.js的支撑向量机
  • Brain —JavaScript兑现的神经互连网
  • Bayesian-Bandit —贝叶斯强盗算法的落实,供Node.js及浏览器选择。

Julia

通用机械学习

  • PGM—Julia达成的可能率图模型框架。
  • DA—朱莉娅完毕的正则化判别分析包。
  • Regression—回归分析算法包(如线性回归和逻辑回归)。
  • Local
    Regression
     —局地回归,非凡平整!
  • Naive
    Bayes
     —朴素贝叶斯的简单Julia实现
  • Mixed
    Models
     —(总结)混合效应模型的朱莉娅包
  • Simple
    MCMC
     —Julia达成的基本mcmc采集样品器
  • Distance—Julia完结的离开评估模块
  • Decision
    Tree
     —决策树分类器及回归分析器
  • Neural —Julia达成的神经网络
  • MCMC —Julia下的MCMC工具
  • GLM —Julia写的广义线性模型包
  • Online Learning
  • GLMNet —卡那霉素LNet的朱莉娅包装版,适合套索/弹性网模型。
  • Clustering—数据聚类的为主函数:k-means,
    dp-means等。
  • SVM—Julia下的帮忙向量机。
  • Kernal
    Density
    —Julia下的核密度测度器
  • Dimensionality
    Reduction
    —降维算法
  • NMF —Julia下的非负矩阵分解包
  • ANN—朱莉娅完毕的神经网络

自然语言处理

数据解析/数据可视化

  • Graph
    Layout
     —纯Julia完结的图布局算法。
  • Data Frames
    Meta
     —DataFrames的元编制程序工具。
  • Julia
    Data
    —处理表格数据的Julia库
  • Data
    Read
    —从Stata、SAS、SPSS读取文件
  • Hypothesis
    Tests
    —Julia中的假诺检验包
  • Gladfly —Julia编写的利落的总结绘图系统。
  • Stats—Julia编写的总计测试函数包
  • RDataSets —读取奥迪Q3语言中众多可用的数据集的Julia函数包。
  • DataFrames —处理表格数据的Julia库。
  • Distributions—可能率分布及连锁函数的Julia包。
  • Data
    Arrays
    天文学, —成分值能够为空的数据结构。
  • Time
    Series
    —Julia的时光类别数据工具包。
  • Sampling—朱莉娅的中坚采样算法包

杂项/演示文稿

Lua

通用机械学习

  • Torch7
    • cephes —Cephes数学函数库,包装成Torch可用格局。提供并打包了跨越177个尤其的数学函数,由斯蒂芬 L.
      Moshier开发,是SciPy的主干,应用于广大场馆。
    • graph —供Torch使用的图形包。
    • randomkit—从Numpy提取的即兴数生成包,包装成Torch可用格局。
    • signal —Torch-7可用的信号处理工科具包,可开始展览FFT,
      DCT, Hilbert, cepstrums, stft等转移。
    • nn —Torch可用的神经网络包。
    • nngraph —为nn库提供图片总结能力。
    • nnx—一个不安宁实验性的包,扩充Torch内置的nn库。
    • optim—Torch可用的优化算法库,包蕴SGD, Adagrad, 共轭梯度算法, LBFGS, 福睿斯Prop等算法。
    • unsup—Torch下的非监督学习包。提供的模块与nn(LinearPsd,
      ConvPsd, AutoEncoder, …)及独立算法 (k-means, PCA)等合营。
    • manifold—操作流形的包。
    • svm—Torch的扶助向量机库。
    • lbfgs—将liblbfgs包装为FFI接口。
    • vowpalwabbit —老版的vowpalwabbit对torch的接口。
    • OpenGM—OpenGM是C++编写的图纸建立模型及测度库,该binding能够用Lua以简要的点子讲述图形,然后用Open丙胺搏来霉素优化。
    • sphagetti —迈克尔Mathieu为torch7编写的稀疏线性模块。
    • LuaSHKit —将某些敏感哈希库SHKit包装成lua可用方式。
    • kernel
      smoothing
       —KNN、核权平均以及部分线性回归平滑器
    • cutorch—torch的CUDA后端完毕
    • cunn —torch的CUDA神经网络达成。
    • imgraph—torch的图像/图形库,提供从图像创造图形、分割、建立树、又转车回图像的例程
    • videograph—torch的摄像/图形库,提供从摄像创设图形、分割、建立树、又转车回录像的例程
    • saliency —积分图像的代码和工具,用来从高效积分直方图中搜索兴趣点。
    • stitch —使用hugin拼合图像并将其转移录制类别。
    • sfm—运动场景束调整/结构包
    • fex —torch的特征提取包,提供SIFT和dSIFT模块。
    • OverFeat—当前最高档次的通用密度特征提取器。
  • Numeric Lua
  • Lunatic Python
  • SciLua
  • Lua – Numerical Algorithms
  • Lunum

演示及脚本

  • Core torch7 demos
    repository
    .宗旨torch7演示程序库

    • 线性回归、逻辑回归
    • 人脸检查和测试(陶冶和检查和测试是单身的演示)
    • 依照mst的断词器
    • train-a-digit-classifier
    • train-autoencoder
    • optical flow demo
    • train-on-housenumbers
    • train-on-cifar
    • tracking with deep nets
    • kinect demo
    • 滤波可视化
    • saliency-networks
  • Training a Convnet for the Galaxy-Zoo Kaggle challenge(CUDA
    demo)
  • Music
    Tagging
    —torch7下的音乐标签脚本
  • torch-datasets 读取多少个流行的数据集的脚本,包含:
    • BSR 500
    • CIFAR-10
    • COIL
    • Street View House Numbers
    • MNIST
    • NORB
  • Atari2600 —在Arcade Learning
    Environment模拟器中用静态帧生成数据集的台本。

Matlab

处理器视觉

  • Contourlets —完结轮廓波变换及其应用函数的MATLAB源代码
  • Shearlets—剪切波变换的MATLAB源码
  • Curvelets—Curvelet变换的MATLAB源码(Curvelet变换是对小波变换向更高维的推广,用来在差异条件角度表示图像。)
  • Bandlets—Bandlets变换的MATLAB源码

自然语言处理

  • NLP —一个Matlab的NLP库

通用机械学习

多少解析/数据可视化

  • matlab_gbl—处理图像的Matlab包
  • gamic—图像算法纯Matlab高效落实,对MatlabBGL的mex函数是个补充。

.NET

计算机视觉

  • OpenCVDotNet —包装器,使.NET程序能应用OpenCV代码
  • Emgu
    CV
    —跨平台的包装器,能在Windows,
    Linus, Mac OS X, iOS, 和Android上编写翻译。

自然语言处理

  • Stanford.NLP for
    .NET
     —火奴鲁鲁希伯来大学NLP包在.NET上的一点一滴移植,还可看作NuGet包举办预编写翻译。

通用机械学习

  • Accord.MachineLearning —帮忙向量机、决策树、朴素贝叶斯模型、K-means、高斯混合模型和机器学习应用的通用算法,例如:随机取样一致性算法、交叉验证、网格搜索。那个包是阅朗.NET框架的一有个别。
  • Vulpes—F#言语达成的Deep
    belief和深度学习包,它在Alea.cuBase下使用CUDA GPU来推行。
  • Encog —先进的神经网络和机器学习框架,包含用来创制三种网络的类,也支撑神经网络须求的数目规则化及处理的类。它的陶冶采取多线程弹性传播。它也能利用GPU加速处理时间。提供了图形化界面来帮助建立模型和锻炼神经互联网。
  • Neural Network
    Designer
     —那是贰个数据库管理体系和神经互联网设计器。设计器用WPF开发,也是二个UI,你能够设计你的神经互连网、查询网络、创造并配备聊天机器人,它能问问题,并从您的反馈中上学。那么些机器人甚至足以从互连网收集音信用来输出,或是用来读书。

数据解析/数据可视化

  • numl —numl那么些机器学习库,指标就是简化预测和聚类的科班建立模型技术。
  • Math.NET
    Numerics
    —Math.NET项指标数值计算基础,着眼提供正确、工程以及普通数值总括的法子和算法。匡助Windows, Linux 和 Mac上的 .Net 4.0, .Net 3.5 和 Mono ,Silverlight
    5, WindowsPhone/SL 8, WindowsPhone 8.1 以及拥有 PCL Portable
    Profiles 47 及 344的Windows 8, 装有 Xamarin的Android/iOS 。
  • Sho —Sho是数码解析和科学计算的交互式环境,能够让你将脚本(IronPython语言)和编写翻译的代码(.NET)无缝连接,以快捷灵活的确立原型。这几个环境包涵强大高效的库,如线性代数、数据可视化,可供任何.NET语言应用,还为急忙支付提供了效率丰硕的交互式shell。

Python

电脑视觉

  • SimpleCV—开源的电脑视觉框架,能够访问如OpenCV等高质量计算机视觉库。使用Python编写,能够在Mac、Windows以及Ubuntu上运维。

自然语言处理

  • NLTK —多少个遥遥当先的平台,用来编排处理人类语言数据的Python程序
  • Pattern—Python可用的web挖掘模块,包含自然语言处理、机器学习等工具。
  • TextBlob—为一般自然语言处理职务提供平等的API,以NLTK和Pattern为底蕴,并和两岸都能很好般配。
  • jieba—普通话断词工具。
  • SnowNLP —中文文本处理库。
  • loso—另三个华语断词库。
  • genius —基于条件随机域的中文断词库。
  • nut —自然语言驾驭工具包。

通用机械学习

  • Bayesian Methods for
    Hackers
     —Python语言可能率规划的电子书
  • MLlib in Apache
    Spark
    —Spark下的分布式机器学习库。
  • scikit-learn—基于SciPy的机械学习模块
  • graphlab-create —包括四种机器学习模块的库(回归,聚类,推荐系统,图分析等),基于可以磁盘存款和储蓄的DataFrame。
  • BigML—连接外部服务器的库。
  • pattern—Python的web挖掘模块
  • NuPIC—Numenta公司的智能计算平台。
  • Pylearn2—基于Theano的机器学习库。
  • hebel —Python编写的使用GPU加快的深度学习库。
  • gensim—主旨建立模型工具。
  • PyBrain—另二个机器学习库。
  • Crab —可扩张的、快捷推荐引擎。
  • python-recsys —Python达成的推荐系统。
  • thinking
    bayes
    —关于贝叶斯分析的书籍
  • Restricted Boltzmann
    Machines
     —Python完毕的受限波尔兹曼机。[纵深学习]。
  • Bolt —在线学习工具箱。
  • CoverTree —cover
    tree的Python完成,scipy.spatial.kdtree便捷的替代。
  • nilearn—Python实现的神经影象学机器学习库。
  • Shogun—机器学习工具箱。
  • Pyevolve —遗传算法框架。
  • Caffe —考虑了代码清洁、可读性及进度的吃水学习框架
  • breze—深度及递归神经互连网的程序库,基于Theano。

数码解析/数据可视化

  • SciPy —基于Python的数学、科学、工程开源软件生态系统。
  • NumPy—Python科学总括基础包。
  • Numba —Python的低级虚拟机JIT编写翻译器,Cython
    and NumPy的开发者编写,供科学总计使用
  • NetworkX —为复杂性互连网选择的非常快软件。
  • Pandas—那几个库提供了高质量、易用的数据结构及数量解析工具。
  • Open
    Mining
    —Python中的商业智能工具(Pandas
    web接口)。
  • PyMC —MCMC采集样品工具包。
  • zipline—Python的算法交易库。
  • PyDy—全名Python Dynamics,支持基于NumPy, SciPy,
    IPython以及 matplotlib的动态建立模型工作流。
  • SymPy —符号数学Python库。
  • statsmodels—Python的总计建立模型及计量管农学库。
  • astropy —Python天文学程序库,社区搭档编写
  • matplotlib —Python的2D绘图库。
  • bokeh—Python的交互式Web绘图库。
  • plotly —Python and
    matplotlib的协作web绘图库。
  • vincent—将Python数据结构转换为Vega可视化语法。
  • d3py—Python的绘图库,基于D3.js。
  • ggplot —和奥迪Q7语言里的ggplot2提供相同的API。
  • Kartograph.py—Python中渲染SVG图的库,效果卓绝。
  • pygal—Python下的SVG图表生成器。
  • pycascading

杂项脚本/iPython笔记/代码库

Kaggle比赛源代码

Ruby

自然语言处理

  • Treat—文本检索与注释工具包,Ruby上小编见过的最健全的工具包。
  • Ruby
    Linguistics
    —那么些框架可以用任何语言为Ruby对象创设语言学工具。包含三个言语毫不相关的通用前端,3个将语言代码映射到语言名的模块,和三个富含很有英文语言工具的模块。
  • Stemmer—使得Ruby可用
    libstemmer_c中的接口。
  • Ruby
    Wordnet
     —WordNet的Ruby接口库。
  • Raspel —aspell绑定到Ruby的接口
  • UEA Stemmer—UEALite
    Stemmer的Ruby移植版,供搜索和寻找用的封建的词干分析器
  • Twitter-text-rb—该程序库能够将推特(Twitter)中的用户名、列表和话题标签自动一连并提取出来。

通用机械学习

数据解析/数据可视化

Misc 杂项

R

通用机械学习

数据解析/数据可视化

Scala

自然语言处理

  • ScalaNLP—机器学习和数值总计库的套装
  • Breeze —Scala用的数值处理库
  • Chalk—自然语言处理库。
  • FACTORIE—可布置的可能率建立模型工具包,用Scala达成的软件库。为用户提供简单的言语来创建关系因素图,评估参数并开始展览推理。

数量解析/数据可视化

  • MLlib in Apache
    Spark
    —斯Parker下的分布式机器学习库
  • Scalding —CAscading的Scala接口
  • Summing Bird—用Scalding 和
    Storm进行Streaming MapReduce
  • Algebird —Scala的肤浅代数工具
  • xerial —Scala的多少管理工科具
  • simmer —化简你的数据,进行代数聚合的unix过滤器
  • PredictionIO —供软件开发者和数量工程师用的机械学习服务器。
  • BIDMat—匡助周边探索性数据解析的CPU和GPU加速矩阵库。

通用机械学习

  • Conjecture—Scalding下可扩张的机器学习框架
  • brushfire—scalding下的决策树工具。
  • ganitha —基于scalding的机器学习程序库
  • adam—使用Apache Avro,
    Apache Spark 和 Parquet的基因组处理引擎,有专用的文件格式,Apache
    2软件许可。
  • bioscala —Scala语言可用的海洋生物消息学程序库
  • BIDMach—机器学习CPU和GPU加快库。

伯乐在线已在 GitHub
上提倡「机器学习财富大全中文版」的整治。欢迎扩散、欢迎到场。

https://github.com/jobbole/awesome-machine-learning-cn

发表评论

电子邮件地址不会被公开。 必填项已用*标注

网站地图xml地图
Copyright @ 2010-2019 亚洲必赢手机官网 版权所有