专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
目录
相关文章推荐
宝玉xp  ·  转发微博-20241113052738 ·  昨天  
爱可可-爱生活  ·  【Real-IAD ... ·  2 天前  
爱可可-爱生活  ·  【WassersteinFlowMatchi ... ·  5 天前  
爱可可-爱生活  ·  【vgt:Go语言测试结果可视化工具,帮助理 ... ·  5 天前  
51好读  ›  专栏  ›  机器之心

机器之心开放人工智能专业词汇集(附Github地址)

机器之心  · 公众号  · AI  · 2017-07-10 12:30

正文

机器之心原创

机器之心编辑部


作为最早关注人工智能技术的媒体,机器之心在编译国外技术博客、论文、专家观点等内容上已经积累了超过两年多的经验。期间,从无到有,机器之心的编译团队一直在积累专业词汇。虽然有很多的文章因为专业性我们没能尽善尽美的编译为中文呈现给大家,但我们一直在进步、一直在积累、一直在提高自己的专业性。


两年来,机器之心编译团队整理过翻译词汇对照表「红宝书」,编辑个人也整理过类似的词典。而我们也从机器之心读者留言中发现,有些人工智能专业词汇没有统一的翻译标准,这可能是因地区、跨专业等等原因造成的。举个例子,DeepMind 的一篇论文中有个词汇为 differentiable boundary tree,当时机器之心的翻译为可微分界树,但后来有读者表示这样的译法如果不保留英文很难明白表达的意思且建议翻译为可微分边界树。


因此,我们想把机器之心内部积累的人工智能专业词汇中英对照表开放给大家,希望为大家写论文、中文博客、阅读文章提供帮助。同时,这也是一份开放的表单,希望越来越多的人能够提供增添、修改建议,为人工智能的传播助力。


项目地址:https://github.com/jiqizhixin/Artificial-Intelligence-Terminology


组织形式




读者在此项目中,可通过以上表盘查看自己想要了解的专业词汇。在单个首字母中,表格的组织形式为:英文/缩写、汉语、来源&扩展。


来源&扩展是对该词汇的注解,内容为机器之心往期的相关文章。例如下图所示的「算法」,我们关联到的三篇文章是《回归、分类与聚类:三大方向剖解机器学习算法的优缺点》和《机器学习算法附速查表》和《深度学习算法全景图:从理论证明其正确性》。因此,我们希望不仅能提供相对应的术语,同时还希望能为读者提供每一个术语的来源和概念上的扩展。但由于这一部分工作量较大,我们还将与读者共同推进这一部分扩展的进程。




准确性


本项目中所有英文专业词汇对照的中文都来自机器之心编译的文章和系列机器学习教科书(如周志华的《机器学习》和李航的《统计学习方法》等),我们力求在提供准确翻译的同时保留最常用的形式。同时,为了保证词汇翻译的准确性,我们将此项目向读者开源,并希望能与读者共同迭代术语的准确度。除此之外,我们还将为每一个词汇提供来源与扩展进一步提升词汇的置信度。


机器之心术语编译标准


因为该项目很多术语都是机器之心平常编译文章所积累的,所以我们首先需要向读者说明机器之心术语编译的标准。


1. 常见术语的编译标准


机器之心常见术语的编译首先会确保术语的正确性,其次再考虑术语的传播广度。例如常见术语。logistic regression,首先机器之心会保证该术语的准确度。我们常见 logistic regression 会翻译为逻辑回归,但中文「逻辑」与 logistic 的含义还是有些差别,因此我们并不太倾向于采用这种译法。在准确度的基础上,我们会考虑术语的传播广度。例如有学者建议可以将 logistic regression 译为对数几率回归,但鉴于该译法的传播度不广,看到中文并不会马上检索到对应英文和概念,所以我们最终在常见术语编译标准下将 logistic regression 译为 logistical 回归。机器之心在对常见术语编译时并不会保留英文,也不会做进一步说明。


2. 非常见术语的编译标准


机器之心在编译技术文章或论文时,常常会遇到非常见的术语。因为像论文那样的文章是在特定领域下为解决特定问题而规范化书写的,所以就会存在较多的非常见的术语。而机器之心在编译非常见术语时,唯一的标准就是准确性,通常我们也会保留英文。因为非常见术语通常是数学、神经科学和物理学等领域上的专业术语,机器之心会尽可能地借鉴其他领域内的译法和意义而确定如何编译。例如 fixed-point theorem,在参考数学的情况下,我们会更倾向于译为不动点定理,fixed-point 译为不动点而不是定点。


3. 歧义术语的编译标准


还有很多术语其实是有歧义的,而对于这一类词,机器之心的编译标准会根据语义进行确定,因此也会有一些误差。例如 bias 在描述神经网络层级单元时可以译为偏置项。而在描述训练误差和与叉验证误差间的关系或学习曲线时,bias 可以译为偏差。这样的例子还有很多,比如 Stationary 在马尔可夫模型中可译为稳态分布(Stationary distribution),在最优化问题中可译为驻点(Stationary point),而在涉及博弈论或对抗性训练时,其又可能表达为静态。


以上是机器之心大概编译术语的标准,虽然我们在常用术语的编译上错误率相对较少,但在非常见术语和歧义术语上仍然会出现一些错误。尤其是在非常见术语的编译上,没有特定的背景知识很容易在编译上出现误差。因此我们希望能与读者共同加强术语的编译质量。


词汇更新


本词汇库目前拥有的专业词汇共计 500 个,主要为机器学习基础概念和术语,同时也是该项目的基本词汇。机器之心将继续完善术语的收录和扩展阅读的构建。词汇更新主要分为两个阶段,第一阶段机器之心将继续完善基础词汇的构建,即通过权威教科书或其它有公信力的资料抽取常见术语。第二阶段机器之心将持续性地把编译论文或其他资料所出现的非常见术语更新到词汇表中。


读者的反馈意见和更新建议将贯穿整个阶段,并且我们将在项目致谢页中展示对该项目起积极作用的读者。因为我们希望术语的更新更具准确度和置信度,所以我们希望读者能附上该术语的来源地址与扩展地址。因此,我们能更客观地更新词汇,并附上可信的来源与扩展。


Letter A


Accumulated error backpropagation

累积误差逆传播

Activation Function

激活函数

Adaptive Resonance Theory/ART

自适应谐振理论

Addictive model

加性学习

Adversarial Networks

对抗网络

Affine Layer

仿射层

Affinity matrix

亲和矩阵

Agent

代理 / 智能体

Algorithm

算法

Alpha-beta pruning

α-β剪枝

Anomaly detection

异常检测

Approximation

近似

Area Under ROC Curve/AUC

Roc 曲线下面积

Artificial General Intelligence/AGI

通用人工智能

Artificial Intelligence/AI

人工智能

Association analysis

关联分析

Attention mechanism

注意力机制

Attribute conditional independence assumption 

属性条件独立性假设

Attribute space

属性空间

Attribute value

属性值

Autoencoder

自编码器

Automatic speech recognition

自动语音识别

Automatic summarization

自动摘要

Average gradient

平均梯度

Average-Pooling

平均池化


Letter B


Backpropagation Through Time

通过时间的反向传播

Backpropagation/BP

反向传播

Base learner

基学习器

Base learning algorithm

基学习算法

Batch Normalization/BN

批量归一化

Bayes decision rule 

贝叶斯判定准则

Bayes Model Averaging/BMA

贝叶斯模型平均

Bayes optimal classifier

贝叶斯最优分类器

Bayesian decision theory

贝叶斯决策论

Bayesian network

贝叶斯网络

Between-class scatter matrix

类间散度矩阵

Bias

偏置 / 偏差

Bias-variance decomposition

偏差-方差分解

Bias-Variance Dilemma

偏差 - 方差困境

Bi-directional Long-Short Term Memory/Bi-LSTM

双向长短期记忆

Binary classification

二分类

Binomial test

二项检验

Bi-partition

二分法

Boltzmann machine

玻尔兹曼机

Bootstrap sampling

自助采样法/可重复采样/有放回采样

Bootstrapping

自助法

Break-Event Point/BEP

平衡点


Letter C


Calibration

校准

Cascade-Correlation

级联相关

Categorical attribute

离散属性

Class-conditional probability

类条件概率

Classification and regression tree/CART

分类与回归树

Classifier

分类器

Class-imbalance

类别不平衡

Closed -form

闭式

Cluster

簇/类/集群

Cluster analysis

聚类分析

Clustering

聚类

Clustering ensemble

聚类集成

Co-adapting

共适应

Coding matrix

编码矩阵

COLT

国际学习理论会议

Committee-based learning

基于委员会的学习

Competitive learning

竞争型学习

Component learner

组件学习器

Comprehensibility

可解释性

Computation Cost

计算成本

Computational Linguistics

计算语言学

Computer vision

计算机视觉

Concept drift

概念漂移

Concept Learning System /CLS

概念学习系统

Conditional entropy

条件熵

Conditional mutual information

条件互信息

Conditional Probability Table/CPT

条件概率表

Conditional random field/CRF

条件随机场

Conditional risk 

条件风险

Confidence

置信度

Confusion matrix

混淆矩阵

Connection weight

连接权

Connectionism

连结主义

Consistency

一致性/相合性

Contingency table

列联表

Continuous attribute

连续属性

Convergence

收敛

Conversational agent

会话智能体

Convex quadratic programming 

凸二次规划

Convexity

凸性

Convolutional neural network/CNN

卷积神经网络

Co-occurrence

同现

Correlation coefficient

相关系数

Cosine similarity

余弦相似度

Cost curve

成本曲线

Cost Function

成本函数

Cost matrix

成本矩阵

Cost-sensitive

成本敏感

Cross entropy

交叉熵

Cross validation

交叉验证

Crowdsourcing

众包

Curse of dimensionality

维数灾难

Cut point

截断点

Cutting plane algorithm 

割平面法


Letter D


Data mining

数据挖掘

Data set

数据集

Decision Boundary

决策边界

Decision stump

决策树桩

Decision tree

决策树/判定树

Deduction

演绎

Deep Belief Network

深度信念网络

Deep Convolutional Generative Adversarial Network/DCGAN

深度卷积生成对抗网络

Deep learning

深度学习

Deep neural network/DNN

深度神经网络

Deep Q-Learning

深度 Q 学习

Deep Q-Network

深度 Q 网络

Density estimation 

密度估计

Density-based clustering

密度聚类

Differentiable neural computer

可微分神经计算机

Dimensionality reduction algorithm

降维算法

Directed edge

有向边

Disagreement measure

不合度量

Discriminative model

判别模型

Discriminator

判别器

Distance measure

距离度量

Distance metric learning

距离度量学习

Distribution

分布

Divergence

散度

Diversity measure

多样性度量/差异性度量

Domain adaption

领域自适应

Downsampling

下采样

D-separation (Directed separation)

有向分离

Dual problem 

对偶问题

Dummy node

哑结点

Dynamic Fusion

动态融合

Dynamic programming

动态规划


Letter E


Eigenvalue decomposition

特征值分解

Embedding

嵌入

Emotional analysis

情绪分析

Empirical conditional entropy

经验条件熵

Empirical entropy

经验熵

Empirical error

经验误差

Empirical risk

经验风险

End-to-End

端到端

Energy-based model

基于能量的模型

Ensemble learning

集成学习

Ensemble pruning

集成修剪

Error Correcting Output Codes/ECOC

纠错输出码

Error rate

错误率

Error-ambiguity decomposition

误差-分歧分解

Euclidean distance

欧氏距离

Evolutionary computation 

演化计算

Expectation-Maximization

期望最大化

Expected loss 

期望损失

Exploding Gradient Problem

梯度爆炸问题

Exponential loss function 

指数损失函数

Extreme Learning Machine/ELM

超限学习机


Letter F


Factorization

因子分解

False negative

假负类

False positive

假正类

False Positive Rate/FPR

假正例率

Feature engineering

特征工程

Feature selection

特征选择

Feature vector

特征向量

Featured Learning

特征学习

Feedforward Neural Networks/FNN

前馈神经网络

Fine-tuning

微调

Flipping output

翻转法

Fluctuation

震荡

Forward stagewise algorithm

前向分步算法

Frequentist

频率主义学派

Full-rank matrix

满秩矩阵

Functional neuron

功能神经元


Letter G


Gain ratio

增益率

Game theory

博弈论

Gaussian kernel function

高斯核函数

Gaussian Mixture Model

高斯混合模型

General Problem Solving

通用问题求解

Generalization

泛化

Generalization error

泛化误差

Generalization error bound

泛化误差上界

Generalized Lagrange function

广义拉格朗日函数

Generalized linear model

广义线性模型

Generalized Rayleigh quotient

广义瑞利商

Generative Adversarial Networks/GAN

生成对抗网络

Generative Model

生成模型

Generator

生成器

Genetic Algorithm/GA

遗传算法

Gibbs sampling

吉布斯采样

Gini index

基尼指数

Global minimum

全局最小

Global Optimization

全局优化

Gradient boosting

梯度提升

Gradient Descent

梯度下降

Graph theory

图论

Ground-truth

真相/真实


Letter H


Hard margin 

硬间隔

Hard voting

硬投票

Harmonic mean

调和平均

Hesse matrix

海塞矩阵

Hidden dynamic model

隐动态模型

Hidden layer

隐藏层

Hidden Markov Model/HMM

隐马尔可夫模型

Hierarchical clustering

层次聚类

Hilbert space

希尔伯特空间

Hinge loss function

合页损失函数

Hold-out

留出法

Homogeneous

同质

Hybrid computing

混合计算

Hyperparameter

超参数

Hypothesis

假设

Hypothesis test

假设验证


Letter I


ICML

国际机器学习会议

Improved iterative scaling/IIS

改进的迭代尺度法

Incremental learning

增量学习

Independent and identically distributed/i.i.d.

独立同分布

Independent Component Analysis/ICA

独立成分分析

Indicator function

指示函数

Individual learner

个体学习器

Induction

归纳

Inductive bias

归纳偏好

Inductive learning

归纳学习

Inductive Logic Programming/ILP

归纳逻辑程序设计

Information entropy

信息熵

Information gain

信息增益

Input layer

输入层

Insensitive loss

不敏感损失

Inter-cluster similarity 

簇间相似度

International Conference for Machine Learning/ICML

国际机器学习大会

Intra-cluster similarity

簇内相似度

Intrinsic value

固有值

Isometric Mapping/Isomap

等度量映射

Isotonic regression

等分回归

Iterative Dichotomiser

迭代二分器


Letter K


Kernel method

核方法

Kernel trick

核技巧

Kernelized Linear Discriminant Analysis/KLDA 

核线性判别分析

K-fold cross validation

k 折交叉验证/k 倍交叉验证

K-Means Clustering

K - 均值聚类

K-Nearest Neighbours Algorithm/KNN

K近邻算法

Knowledge base

知识库

Knowledge Representation

知识表征


Letter L


Label space

标记空间

Lagrange duality

拉格朗日对偶性

Lagrange multiplier

拉格朗日乘子

Laplace smoothing

拉普拉斯平滑

Laplacian correction

拉普拉斯修正

Latent Dirichlet Allocation

隐狄利克雷分布

Latent semantic analysis

潜在语义分析

Latent variable

隐变量

Lazy learning 

懒惰学习

Learner

学习器

Learning by analogy

类比学习

Learning rate

学习率

Learning Vector Quantization/LVQ

学习向量量化

Least squares regression tree

最小二乘回归树

Leave-One-Out/LOO

留一法

linear chain conditional random field

线性链条件随机场

Linear Discriminant Analysis/LDA

线性判别分析

Linear model

线性模型

Linear Regression

线性回归

Link function

联系函数

Local Markov property

局部马尔可夫性

Local minimum

局部最小

Log likelihood

对数似然

Log odds/logit

对数几率

Logistic Regression

Logistic 回归

Log-likelihood

对数似然

Log-linear regression

对数线性回归

Long-Short Term Memory/LSTM

长短期记忆

Loss function

损失函数


Letter M


Machine translation/MT

机器翻译

Macron-P

宏查准率

Macron-R

宏查全率

Majority voting

绝对多数投票法

Manifold assumption

流形假设

Manifold learning

流形学习

Margin theory

间隔理论

Marginal distribution

边际分布

Marginal independence 

边际独立性

Marginalization 

边际化

Markov Chain Monte Carlo/MCMC

马尔可夫链蒙特卡罗方法

Markov Random Field

马尔可夫随机场

Maximal clique

最大团

Maximum Likelihood Estimation/MLE

极大似然估计/极大似然法

Maximum margin

最大间隔

Maximum weighted spanning tree

最大带权生成树

Max-Pooling

最大池化

Mean squared error

均方误差

Meta-learner

元学习器

Metric learning

度量学习

Micro-P

微查准率

Micro-R

微查全率

Minimal Description Length/MDL

最小描述长度

Minimax game

极小极大博弈

Misclassification cost

误分类成本

Mixture of experts

混合专家

Momentum

动量

Moral graph

道德图/端正图

Multi-class classification

多分类

Multi-document summarization

多文档摘要

Multi-layer feedforward neural networks

多层前馈神经网络

Multilayer Perceptron/MLP

多层感知器

Multimodal learning

多模态学习

Multiple Dimensional Scaling

多维缩放

Multiple linear regression

多元线性回归

Multi-response Linear Regression /MLR

多响应线性回归

Mutual information

互信息


Letter N


Naive bayes 

朴素贝叶斯

Naive Bayes Classifier

朴素贝叶斯分类器

Named entity recognition

命名实体识别

Nash equilibrium

纳什均衡

Natural language generation/NLG

自然语言生成

Natural language processing

自然语言处理

Negative class

负类

Negative correlation

负相关法

Negative Log Likelihood

负对数似然

Neighbourhood Component Analysis/NCA

近邻成分分析

Neural Machine Translation

神经机器翻译

Neural Turing Machine

神经图灵机

Newton method

牛顿法

NIPS

国际神经信息处理系统会议

No Free Lunch Theorem/NFL

没有免费的午餐定理

Noise-contrastive estimation

噪音对比估计

Nominal attribute

列名属性

Non-convex optimization

非凸优化

Nonlinear model

非线性模型

Non-metric distance

非度量距离

Non-negative matrix factorization

非负矩阵分解

Non-ordinal attribute 

无序属性

Non-Saturating Game

非饱和博弈

Norm

范数

Normalization

归一化

Nuclear norm

核范数

Numerical attribute

数值属性


Letter O


Objective function

目标函数

Oblique decision tree

斜决策树

Occam's razor

奥卡姆剃刀

Odds

几率

Off-Policy

离策略

One shot learning

一次性学习

One-Dependent Estimator/ODE

独依赖估计

On-Policy

在策略

Ordinal attribute

有序属性

Out-of-bag estimate

包外估计

Output layer

输出层

Output smearing

输出调制法

Overfitting

过拟合/过配

Oversampling

过采样


Letter P


Paired t-test

成对 t 检验

Pairwise

成对型

Pairwise Markov property

成对马尔可夫性

Parameter

参数

Parameter estimation

参数估计

Parameter tuning

调参

Parse tree

解析树

Particle Swarm Optimization/PSO

粒子群优化算法

Part-of-speech tagging

词性标注

Perceptron

感知机

Performance measure

性能度量

Plug and Play Generative Network

即插即用生成网络

Plurality voting

相对多数投票法

Polarity detection

极性检测

Polynomial kernel function

多项式核函数

Pooling

池化

Positive class

正类

Positive definite matrix

正定矩阵

Post-hoc test

后续检验

Post-pruning

后剪枝

potential function

势函数

Precision

查准率/准确率

Prepruning

预剪枝

Principal component analysis/PCA

主成分分析

Principle of multiple explanations

多释原则

Prior

先验

Probability Graphical Model

概率图模型

Proximal Gradient Descent/PGD

近端梯度下降

Pruning

剪枝

Pseudo-label

伪标记


Letter Q


Quantized Neural Network

量子化神经网络

Quantum computer

量子计算机

Quantum Computing

量子计算

Quasi Newton method

拟牛顿法


Letter R


Radial Basis Function/RBF

径向基函数

Random Forest Algorithm

随机森林算法

Random walk

随机漫步 

Recall

查全率/召回率

Receiver Operating Characteristic/ROC

受试者工作特征

Rectified Linear Unit/ReLU

线性修正单元

Recurrent Neural Network

循环神经网络

Recursive neural network

递归神经网络

Reference model 

参考模型

Regression

回归

Regularization

正则化

Reinforcement learning/RL

强化学习

Representation learning

表征学习

Representer theorem

表示定理

reproducing kernel Hilbert space/RKHS

再生核希尔伯特空间

Re-sampling

重采样法

Rescaling

再缩放

Residual Mapping

残差映射

Residual Network

残差网络

Restricted Boltzmann Machine/RBM

受限玻尔兹曼机

Restricted Isometry Property/RIP

限定等距性

Re-weighting

重赋权法

Robustness

稳健性/鲁棒性

Root node

根结点

Rule Engine

规则引擎

Rule learning

规则学习


Letter S


Saddle point

鞍点

Sample space

样本空间

Sampling

采样

Score function 

评分函数

Self-Driving

自动驾驶

Self-Organizing Map/SOM

自组织映射

Semi-naive Bayes classifiers 

半朴素贝叶斯分类器

Semi-Supervised Learning

半监督学习

semi-Supervised Support Vector Machine

半监督支持向量机

Sentiment analysis

情感分析

Separating hyperplane

分离超平面

Sigmoid function

Sigmoid 函数

Similarity measure

相似度度量

Simulated annealing

模拟退火

Simultaneous localization and mapping

同步定位与地图构建

Singular Value Decomposition

奇异值分解

Slack variables

松弛变量

Smoothing

平滑

Soft margin 

软间隔

Soft margin maximization

软间隔最大化

Soft voting

软投票

Sparse representation

稀疏表征

Sparsity

稀疏性

Specialization

特化

Spectral Clustering

谱聚类

Speech Recognition

语音识别

Splitting variable

切分变量

Squashing function

挤压函数

Stability-plasticity dilemma

可塑性-稳定性困境

Statistical learning

统计学习

Status feature function

状态特征函

Stochastic gradient descent

随机梯度下降

Stratified sampling

分层采样

Structural risk

结构风险

Structural risk minimization/SRM

结构风险最小化

Subspace

子空间

Supervised learning

监督学习/有导师学习

support vector expansion 

支持向量展式

Support Vector Machine/SVM

支持向量机

Surrogat loss

替代损失

Surrogate function

替代函数

Symbolic learning

符号学习

Symbolism

符号主义

Synset

同义词集


Letter T


T-Distribution Stochastic Neighbour Embedding/t-SNE

T - 分布随机近邻嵌入

Tensor

张量

Tensor Processing Units/TPU

张量处理单元

The least square method

最小二乘法

Threshold

阈值

Threshold logic unit

阈值逻辑单元

Threshold-moving

阈值移动

Time Step

时间步骤

Tokenization

标记化

Training error

训练误差

Training instance

训练示例/训练例

Transductive learning

直推学习

Transfer learning

迁移学习

Treebank

树库

Tria-by-error

试错法

True negative

真负类

True positive

真正类

True Positive Rate/TPR

真正例率

Turing Machine

图灵机

Twice-learning 

二次学习


Letter U


Underfitting

欠拟合/欠配

Undersampling

欠采样

Understandability

可理解性

Unequal cost

非均等代价

Unit-step function

单位阶跃函数

Univariate decision tree

单变量决策树

Unsupervised learning

无监督学习/无导师学习

Unsupervised layer-wise training

无监督逐层训练

Upsampling

上采样


Letter V


Vanishing Gradient Problem

梯度消失问题

Variational inference

变分推断

VC Theory

VC维理论

Version space

版本空间

Viterbi algorithm

维特比算法

Von Neumann architecture

冯 · 诺伊曼架构


Letter W


Wasserstein GAN/WGAN

Wasserstein生成对抗网络

Weak learner

弱学习器

Weight

权重

Weight sharing

权共享

Weighted voting

加权投票法

Within-class scatter matrix

类内散度矩阵

Word embedding

词嵌入

Word sense disambiguation

词义消歧


Letter Z


Zero-data learning

零数据学习

Zero-shot learning

零次学习



本文为机器之心原创,转载请联系本公众号获得授权

✄------------------------------------------------

加入机器之心(全职记者/实习生):[email protected]

投稿或寻求报道:[email protected]

广告&商务合作:[email protected]


点击阅读原文,查看机器之心官网↓↓↓