引进!国外程序员整理的机上资源全

By admin in 天文学 on 2018年11月13日

推荐!国外程序员整理的机上资源全

正文汇编了有机器上园地的框架、库与软件(按编程语言排序)。

伯乐在线已于 GitHub
上提倡「机器上资源全中文版」的重整。欢迎扩散、欢迎加入。

https://github.com/jobbole/awesome-machine-learning-cn

C++

计算机视觉

  • CCV —基为C语言/提供缓存/核心的机械视觉库,新颖的机械视觉库
  • OpenCV—它提供C++, C, Python, Java 以及
    MATLAB接口,并支持Windows, Linux, Android and Mac OS操作系统。

通用机械上

  • MLPack
  • DLib
  • ecogg
  • shark

Closure

通用机械上

  • Closure
    Toolbox—Clojure语言库与工具的分类目录

Go

自然语言处理

  • go-porterstemmer—一个Porter词干提取算法的原生Go语言净室实现
  • paicehusk—Paice/Husk词干提取算法的Go语言实现
  • snowball—Go语言版的Snowball词干提取器

通用机械上

  • Go Learn— Go语言机器上库
  • go-pr —Go语言机器上包.
  • bayesian—Go语言朴素贝叶斯分类库。
  • go-galib—Go语言遗传算法库。

数据解析/数据可视化

  • go-graph—Go语言图形库。
  • SVGo—Go语言的SVG生成库。

Java

自然语言处理

  • CoreNLP—斯坦福大学之CoreNLP提供平等系列的自然语言处理工具,输入原始英语文本,可以为起就词的主导形式(下面Stanford开头的几个器还蕴涵其中)。
  • Stanford
    Parser—一个自然语言解析器。
  • Stanford POS
    Tagger —一个词性分类器。
  • Stanford Name Entity
    Recognizer—Java实现的称谓识别器
  • Stanford Word
    Segmenter—分词器,很多NLP工作被还如因此到之科班先行处理步骤。
  • Tregex, Tsurgeon and
    Semgrex —用来当树状数据结构中开展模式匹配,基于树关系和节点匹配的正则表达式(名字是“tree
    regular expressions”的缩写)。
  • Stanford
    Phrasal:风行的冲统计短语的机器翻译系统,java编写
  • Stanford Tokens
    Regex—用以定义文本模式的框架。
  • Stanford Temporal
    Tagger—SUTime是一个鉴别并规范时间表达式的仓库。
  • Stanford
    SPIED—在种子集上运模式,以迭代艺术于管标签文本中学习字符实体
  • Stanford Topic Modeling
    Toolbox —为社会科学家及任何想分析数据集的食指提供的主题建模工具。
  • Twitter Text
    Java—Java实现之推特文本处理库
  • MALLET -—基于Java的统计自然语言处理、文档分类、聚类、主题建模、信息提取以及其他机器上文件应用包。
  • OpenNLP—处理自然语言文本的机械上工具包。
  • LingPipe —使用计算机语言学处理公事的工具包。

通用机械上

  • MLlib in Apache
    Spark—Spark中之分布式机器上程序库
  • Mahout —分布式的机上库
  • Stanford
    Classifier —斯坦福大学之分类器
  • Weka—Weka是数量挖掘地方的机上到底法集。
  • ORYX—提供一个简易的广大实时机器上/预测分析基础架构。

数据解析/数据可视化

  • Hadoop—大数额解析平台
  • Spark—快速通用的泛数据处理引擎。
  • Impala —为Hadoop实现实时查询

 

Javascript

自然语言处理

  • Twitter-text-js —JavaScript贯彻的推特文本处理库
  • NLP.js —javascript及coffeescript编写的NLP工具
  • natural—Node下的通用NLP工具
  • Knwl.js—JS编写的自然语言处理器

 

数解析/数据可视化

  • D3.js
  • High Charts
  • NVD3.js
  • dc.js
  • chartjs
  • dimple
  • amCharts

通用机械上

  • Convnet.js—训练深度上型的JavaScript库。
  • Clustering.js—用JavaScript实现的聚类算法,供Node.js及浏览器采用。
  • Decision
    Trees—Node.js实现的决策树,使用ID3算法。
  • Node-fann —Node.js下之高速人工神经网络库。
  • Kmeans.js—k-means算法的简练Javascript实现,供Node.js及浏览器采用。
  • LDA.js —供Node.js用底LDA主题建模工具。
  • Learning.js—逻辑回归/c4.5决策树的JavaScript实现
  • Machine
    Learning—Node.js的机械学习库。
  • Node-SVM—Node.js的支撑于量机
  • Brain —JavaScript落实之神经网络
  • Bayesian-Bandit —贝叶斯强盗算法的兑现,供Node.js及浏览器采用。

Julia

通用机械上

  • PGM—Julia实现之几率图模型框架。
  • DA—Julia实现的正则化判别分析包。
  • Regression—回归分析算法包(如线性回归和逻辑回归)。
  • Local
    Regression —局部回归,非常平整!
  • Naive
    Bayes —朴素贝叶斯的简单Julia实现
  • Mixed
    Models —(统计)混合效应模型的Julia包
  • Simple
    MCMC —Julia实现的基本mcmc采样器
  • Distance—Julia实现之偏离评估模块
  • Decision
    Tree —决策树分类器及回归分析器
  • Neural —Julia实现之神经网络
  • MCMC —Julia下的MCMC工具
  • GLM —Julia写的广义线性模型包
  • Online Learning
  • GLMNet —GMLNet的Julia包装版,适合套索/弹性网模型。
  • Clustering—数据聚类的骨干函数:k-means,
    dp-means等。
  • SVM—Julia下的支撑于量机。
  • Kernal
    Density—Julia下的核密度估计器
  • Dimensionality
    Reduction—降维算法
  • NMF —Julia下之非负矩阵分解包
  • ANN—Julia实现的神经网络

自然语言处理

  • Topic
    Models —Julia下之主题建模
  • Text
    Analysis—Julia下的文本分析包

数据解析/数据可视化

  • Graph
    Layout —纯Julia实现的图布局算法。
  • Data Frames
    Meta —DataFrames的首位编程工具。
  • Julia
    Data—处理表格数据的Julia库
  • Data
    Read—从Stata、SAS、SPSS读取文件
  • Hypothesis
    Tests—Julia中之假设检验包
  • Gladfly —Julia编写的灵活的统计绘图系统。
  • Stats—Julia编写的统计测试函数担保
  • RDataSets —读取R语言中有的是可用的数据集的Julia函数包。
  • DataFrames —处理表格数据的Julia库。
  • Distributions—概率分布及连锁函数的Julia包。
  • Data
    Arrays —元素值可以为空的数据结构。
  • Time
    Series—Julia的光阴序列数据工具包。
  • Sampling—Julia的核心采样算法包

杂项/演示文稿

  • DSP —数字信号处理
  • JuliaCon
    Presentations—Julia大会上的演示文稿
  • SignalProcessing—Julia的信号处理工具
  • Images—Julia的图片库

Lua

通用机械上

  • Torch7
    • cephes —Cephes数学函数库,包装成Torch可用形式。提供并打包了跨180单特殊之数学函数,由Stephen L.
      Moshier开发,是SciPy的中坚,应用叫博场合。
    • graph —供Torch使用的图形包。
    • randomkit—从Numpy提取的自由数生成包,包装成Torch可用形式。
    • signal —Torch-7可用之信号处理工具确保,可开展FFT,
      DCT, Hilbert, cepstrums, stft等转移。
    • nn —Torch可用的神经网络包。
    • nngraph —为nn库提供图片计算能力。
    • nnx—一个请勿平稳实验性的保管,扩展Torch内置的nn库。
    • optim—Torch可用的优化算法库,包括
      SGD, Adagrad, 共轭梯度算法, LBFGS, RProp等算法。
    • unsup—Torch下的免监督学习包。提供的模块和nn(LinearPsd,
      ConvPsd, AutoEncoder, …)及独立算法 (k-means, PCA)等配合。
    • manifold—操作流形的担保。
    • svm—Torch的支撑向量机库。
    • lbfgs—将liblbfgs包装为FFI接口。
    • vowpalwabbit —老版的vowpalwabbit对torch的接口。
    • OpenGM—OpenGM凡C++编写的图片建模及推断库,该binding可以就此Lua以简单的法门讲述图形,然后据此OpenGM优化。
    • sphagetti —MichaelMathieu为torch7编写的稀疏线性模块。
    • LuaSHKit —将有些敏感哈希库SHKit包装成lua可用形式。
    • kernel
      smoothing —KNN、核权平均与部分线性回归平滑器
    • cutorch—torch的CUDA后端平实现
    • cunn —torch的CUDA神经网络实现。
    • imgraph—torch的图像/图形库,提供自图像创建图形、分割、建立培养、又转车回图像的例程
    • videograph—torch的视频/图形库,提供自视频创建图形、分割、建立培训、又转向回视频的例程
    • saliency —积分图像的代码和工具,用来打便捷积分直方图中找兴趣点。
    • stitch —使用hugin拼合图像并以那转移视频序列。
    • sfm—运动场景束调整/结构确保
    • fex —torch的特征提取包,提供SIFT和dSIFT模块。
    • OverFeat—当前危水准的通用密度特征提取器。
  • Numeric Lua
  • Lunatic Python
  • SciLua
  • Lua – Numerical Algorithms
  • Lunum

演示与脚本

  • Core torch7 demos
    repository.核心torch7演示程序库

    • 线性回归、逻辑回归
    • 口脸检测(训练及检测是单身的演示)
    • 依据mst的断词器
    • train-a-digit-classifier
    • train-autoencoder
    • optical flow demo
    • train-on-housenumbers
    • train-on-cifar
    • tracking with deep nets
    • kinect demo
    • 滤波可视化
    • saliency-networks
  • Training a Convnet for the Galaxy-Zoo Kaggle challenge(CUDA
    demo)
  • Music
    Tagging—torch7下之乐标签脚本
  • torch-datasets 读博几独流行的数据集的本子,包括:
    • BSR 500
    • CIFAR-10
    • COIL
    • Street View House Numbers
    • MNIST
    • NORB
  • Atari2600 —在Arcade Learning
    Environment模拟器中因故静态帧生成数据集的脚本。

Matlab

微机视觉

  • Contourlets —实现轮廓波变换及其使用函数的MATLAB源代码
  • Shearlets—剪切波变换的MATLAB源码
  • Curvelets—Curvelet变换的MATLAB源码(Curvelet变换是对准小波变换为更高维的加大,用来在不同规格角度表示图像。)
  • Bandlets—Bandlets变换的MATLAB源码

自然语言处理

  • NLP —一个Matlab的NLP库

通用机械上

  • Training a deep autoencoder or a classifier on MNIST
    digits—在MNIST字符数据集上训练一个深的autoencoder或分类器[深上]。
  • t-Distributed Stochastic Neighbor
    Embedding —获奖的降维技术,特别契合为高维数据集的可视化
  • Spider—Matlab机器学习之圆面向对象环境。
  • LibSVM —支持向量机程序库
  • LibLinear —大型线性分类程序库
  • Machine Learning
    Module —M.
    A .Girolami教授的机械上课程,包括PDF,讲义及代码。
  • Caffe—考虑了代码清洁、可读性和进度之纵深上框架
  • Pattern Recognition
    Toolbox —Matlab中之模式识别工具确保,完全面向对象

数解析/数据可视化

  • matlab_gbl—处理图像的Matlab包
  • gamic—图像算法纯Matlab高效落实,对MatlabBGL的mex函数是独上。

.NET

微机视觉

  • OpenCVDotNet —包装器,使.NET程序会用OpenCV代码
  • Emgu
    CV—跨平台的包装器,能当Windows,
    Linus, Mac OS X, iOS, 和Android上编译。

自然语言处理

  • Stanford.NLP for
    .NET —斯坦福大学NLP包在.NET上的意移植,还可看成NuGet包进行事先编译。

通用机械上

  • Accord.MachineLearning —支持于量机、决策树、朴素贝叶斯模型、K-means、高斯混合模型和机械上应用之通用算法,例如:随机取样一致性算法、交叉验证、网格搜索。这个包是Accord.NET框架的一致有的。
  • Vulpes—F#言语实现的Deep
    belief和深度上包,它于Alea.cuBase下行使CUDA GPU来实行。
  • Encog —先进的神经网络和机具上框架,包括用来创造多种网的近乎,也支撑神经网络需要之数额规则化及处理的接近。它的训练使多线程弹性传播。它为会采取GPU加快处理时。提供了图形化界面来拉建模和训练神经网络。
  • Neural Network
    Designer —这是一个数据库管理体系以及神经网络设计器。设计器用WPF开发,也是一个UI,你可以计划而的神经网络、查询网络、创建并配置聊天机器人,它能够问问题,并打你的汇报中上。这些机器人还好起网络采访信息之所以来输出,或是用来学。

数码解析/数据可视化

  • numl —numl这个机器上库,目标就是简化预测和聚类的专业建模技术。
  • Math.NET
    Numerics—Math.NET项目之数值计算基础,着眼提供正确、工程和普通数值计算的章程与算法。支持
    Windows, Linux 和 Mac上之 .Net 4.0, .Net 3.5 和 Mono ,Silverlight
    5, WindowsPhone/SL 8, WindowsPhone 8.1 以及有 PCL Portable
    Profiles 47 及 344的Windows 8, 装有 Xamarin的Android/iOS 。
  • Sho —Sho是多少解析与科学计算的交互式环境,可以叫你拿脚本(IronPython语言)和编译的代码(.NET)无缝连接,以便捷灵的建立原型。这个条件包括精高效的库房,如线性代数、数据可视化,可供应任何.NET语言应用,还也快速支付提供了功能丰富的交互式shell。

Python

电脑视觉

  • SimpleCV—开源之处理器视觉框架,可以拜使OpenCV等高性能计算机视觉库。使用Python编写,可以于Mac、Windows以及Ubuntu上运行。

自然语言处理

  • NLTK —一个领先的阳台,用来编排处理人类语言数据的Python程序
  • Pattern—Python可用之web挖掘模块,包括自然语言处理、机器上等工具。
  • TextBlob—为平常自然语言处理任务提供平等的API,以NLTK和Pattern为根基,并和彼此都能够杀好般配。
  • jieba—中文断词工具。
  • SnowNLP —中文文本处理库。
  • loso—另一个中文断词库。
  • genius —基于条件仍机域的华语断词库。
  • nut —自然语言理解工具包。

通用机械上

  • Bayesian Methods for
    Hackers —Python语言概率规划的电子书
  • MLlib in Apache
    Spark—Spark下之分布式机器学习库。
  • scikit-learn—基于SciPy的机械上模块
  • graphlab-create —包含多机上模块的库(回归,聚类,推荐系统,图分析等),基于可以磁盘存储的DataFrame。
  • BigML—连接外部服务器的仓库。
  • pattern—Python的web挖掘模块
  • NuPIC—Numenta公司的智能计算平台。
  • Pylearn2—基于Theano的机械学习库。
  • hebel —Python编写的以GPU加速的深浅学习库。
  • gensim—主题建模工具。
  • PyBrain—另一个机器学习库。
  • Crab —可扩大的、快速推荐引擎。
  • python-recsys —Python实现的引进系统。
  • thinking
    bayes—关于贝叶斯分析的图书
  • Restricted Boltzmann
    Machines —Python实现的受限波尔兹曼机。[深度上]。
  • Bolt —在线学习工具箱。
  • CoverTree —cover
    tree的Python实现,scipy.spatial.kdtree便捷的代。
  • nilearn—Python实现的神经影像模拟机器学习库。
  • Shogun—机器上工具箱。
  • Pyevolve —遗传算法框架。
  • Caffe —考虑了代码清洁、可读性和进度的纵深上框架
  • breze—深度和递归神经网络的程序库,基于Theano。

数解析/数据可视化

  • SciPy —基于Python的数学、科学、工程起源软件生态系统。
  • NumPy—Python科学计算基础包。
  • Numba —Python的低档虚拟机JIT编译器,Cython
    and NumPy的开发者编写,供科学计算使用
  • NetworkX —为复杂性网络以的高效软件。
  • Pandas—这个库房提供了赛性能、易用的数据结构及数解析工具。
  • Open
    Mining—Python中的商业智能工具(Pandas
    web接口)。
  • PyMC —MCMC采样工具包。
  • zipline—Python的算法交易库。
  • PyDy—全名Python Dynamics,协助基于NumPy, SciPy,
    IPython以及 matplotlib的动态建模工作流。
  • SymPy —符号数学Python库。
  • statsmodels—Python的统计建模及计量经济学库。
  • astropy —Python天文学程序库,社区合作编写
  • matplotlib —Python的2D绘图库。
  • bokeh—Python的交互式Web绘图库。
  • plotly —Python and
    matplotlib的协作web绘图库。
  • vincent—将Python数据结构转换为Vega可视化语法。
  • d3py—Python的绘图库,基于D3.js。
  • ggplot —和R语言里的ggplot2供平等的API。
  • Kartograph.py—Python中渲染SVG图的仓库,效果出色。
  • pygal—Python下的SVG图表生成器。
  • pycascading

杂项脚本/iPython笔记/代码库

  • pattern_classification
  • thinking stats 2
  • hyperopt
  • numpic
  • 2012-paper-diginorm
  • ipython-notebooks
  • decision-weights
  • Sarah Palin
    LDA —Sarah
    Palin关于主题建模的电邮。
  • Diffusion
    Segmentation —基于扩散方式的图像分割算法集合。
  • Scipy
    Tutorials —SciPy教程,已过时,请查看scipy-lecture-notes
  • Crab—Python的推介引擎库。
  • BayesPy—Python中的贝叶斯推断工具。
  • scikit-learn
    tutorials—scikit-learn学习笔记系列
  • sentiment-analyzer —推特情绪分析器
  • group-lasso—坐标下降算法实验,应用叫(稀疏)群套索模型。
  • mne-python-notebooks—使用
    mne-python进行EEG/MEG数据处理的IPython笔记
  • pandas
    cookbook—使用Python
    pandas库的措施修。
  • climin—机器上的优化程序库,用Python实现了梯度下降、LBFGS、rmsprop、adadelta
    等算法。

Kaggle竞赛源代码

  • wiki
    challange —Kaggle上一个维基预测挑战赛
    Dell Zhang解法的实现。
  • kaggle
    insults—Kaggle上”从社交媒体评论被检测辱骂“竞赛提交的代码
  • kaggle_acquire-valued-shoppers-challenge—Kaggle预测回头客挑战赛的代码
  • kaggle-cifar —Kaggle上CIFAR-10
    竞赛的代码,使用cuda-convnet
  • kaggle-blackbox —Kaggle上blackbox赛代码,关于深度上。
  • kaggle-accelerometer —Kaggle上加快度计数据识别用户比的代码
  • kaggle-advertised-salaries —Kaggle上就此广告预测工资比的代码
  • kaggle
    amazon —Kaggle上吃定员工角色预测其访问需求竞赛的代码
  • kaggle-bestbuy_big—Kaggle上因bestbuy用户查询预测点击商品比的代码(大数据版)
  • kaggle-bestbuy_small—Kaggle上根据bestbuy用户查询预测点击商品比的代码(小数据版)
  • Kaggle Dogs vs.
    Cats —Kaggle上从图被识别猫和狗竞赛的代码
  • Kaggle Galaxy
    Challenge —Kaggle上长期星系形态分类竞赛的优厚代码
  • Kaggle
    Gender —Kaggle竞赛:从笔迹区分性
  • Kaggle
    Merck—Kaggle上预计药物分子活性竞赛的代码(默克制药赞助)
  • Kaggle
    Stackoverflow—Kaggle上
    预测Stack Overflow网站问题是不是会吃关竞赛的代码
  • wine-quality —预测红酒质量。

Ruby

自然语言处理

  • Treat—文本检索与注释工具确保,Ruby上我表现了的最全面的工具包。
  • Ruby
    Linguistics—这个框架可以就此别样语言为Ruby对象构建语言学工具。包括一个言语无关之通用前端,一个拿语言代码映射到语言名之模块,和一个饱含非常有英文语言工具的模块。
  • Stemmer—使得Ruby可用
    libstemmer_c中之接口。
  • Ruby
    Wordnet —WordNet的Ruby接口库。
  • Raspel —aspell绑定到Ruby的接口
  • UEA Stemmer—UEALite
    Stemmer的Ruby移植版,供搜索以及查找用底迂的词干分析器
  • Twitter-text-rb—该程序库可以用推特中之用户称、列表和话题标签自动连接并领出来。

通用机械上

  • Ruby Machine
    Learning —Ruby实现的组成部分机械上算法。
  • Machine Learning
    Ruby
  • jRuby
    Mahout —精华!在JRuby世界被自由了Apache
    Mahout的威力。
  • CardMagic-Classifier—可用贝叶斯及另分类法的通用分类器模块。
  • Neural Networks and Deep
    Learning—《神经网络和深上》一书写之演示代码。

数解析/数据可视化

  • rsruby – Ruby – R bridge
  • data-visualization-ruby—关于数据可视化的Ruby
    Manor演示的源代码和支持内容
  • ruby-plot —将gnuplot包装为Ruby形式,特别符合用ROC曲线转化为svg文件。
  • plot-rb—基于Vega和D3的ruby绘图库
  • scruffy —Ruby下可以之图样工具确保
  • SciRuby
  • Glean—数据管理工具
  • Bioruby
  • Arel

Misc 杂项

  • Big Data For
    Chimps—大数据处理严肃而有趣的指南书

R

通用机械上

  • Clever Algorithms For Machine
    Learning
  • Machine Learning For Hackers
  • Machine Learning Task View on
    CRAN—R语言机器上包列表,按算法类型分组。
  • caret—R语言150个机械上算法的汇合接口
  • SuperLearner and subsemble—该包集合了多机上算法
  • Introduction to Statistical
    Learning

数量解析/数据可视化

  • Learning Statistics Using R
  • ggplot2—基于图形语法的数据可视化包。

Scala

自然语言处理

  • ScalaNLP—机器上与数值计算库的套装
  • Breeze —Scala用底数值处理库
  • Chalk—自然语言处理库。
  • FACTORIE—可部署的票房价值建模工具确保,用Scala实现之软件库。为用户提供简单的语言来创造关系因素图,评估参数并拓展测算。

数解析/数据可视化

  • MLlib in Apache
    Spark—Spark下之分布式机器上库
  • Scalding —CAscading的Scala接口
  • Summing Bird—用Scalding 和
    Storm进行Streaming MapReduce
  • Algebird —Scala的架空代数工具
  • xerial —Scala的数码管理工具
  • simmer —化简你的数额,进行代数聚合的unix过滤器
  • PredictionIO —供软件开发者及多少工程师用之机上服务器。
  • BIDMat—支持广大探索性数据解析的CPU和GPU加速矩阵库。

通用机械上

  • Conjecture—Scalding下而扩大的机器上框架
  • brushfire—scalding下之表决树工具。
  • ganitha —基于scalding的机械上程序库
  • adam—使用Apache Avro,
    Apache Spark 和 Parquet的基因组处理引擎,有专用的文件格式,Apache
    2软件许可。
  • bioscala —Scala语言可用的生物信息学程序库
  • BIDMach—机器上CPU和GPU加速库。

伯乐在线已于 GitHub
上提倡「机器上资源全中文版」的重整。欢迎扩散、欢迎加入。

https://github.com/jobbole/awesome-machine-learning-cn

发表评论

电子邮件地址不会被公开。 必填项已用*标注

网站地图xml地图
Copyright @ 2010-2018 亚洲必赢手机官网 版权所有