Machine Learning - �Basic Principles & Practice�8. An Alternative Margin
Cong Li 李聪
机器学习 - 基础原理与实践
8. 别样的间距
Margin 间距
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
The Alternative 替代品
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Logistic Regression �对数几率回归
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Numerical function for probability estimation 用于概率估计的数值函数
Output 0 or 1 for math elegance 输出0或1(以求数学上的优雅)
Classification 分类
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Classification 分类
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Learning 学习
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
We start from the classical principle: maximum likelihood estimation
我们从经典法则开始:极大似然估计
Maximum Likelihood Estimation�极大似然估计
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Principle: we see the observations; we adjust the parameters to maximize the probability of the observations
原则:我们看到一些现象;我们调整参数,使得这些现象的概率尽可能地大
Maximum Likelihood Estimation�极大似然估计
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Principle: we see the observations; we adjust the parameters to maximize the probability of the observations
原则:我们看到一些现象;我们调整参数,使得这些现象的概率尽可能地大
Maximum Likelihood Estimation�极大似然估计
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Principle: we see the observations; we adjust the parameters to maximize the probability of the observations
原则:我们看到一些现象;我们调整参数,使得这些现象的概率尽可能地大
To make 使得
as large as possible 尽可能大
Transformation 变换
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
We do a transformation using the logarithm function
我们用对数函数作一个变换
Transformation 变换
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
We do a transformation using the logarithm function
我们用对数函数作一个变换
Equivalent to 等价于
Transformation 变换
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
We do a transformation using the logarithm function
我们用对数函数作一个变换
Then equivalent to 于是等价于
Regularization 调整
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Regularization term
调整项
Rationale Behind Regularization 调整的根本原因
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Problem of Learning 学习问题
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
How to solve the problem? 怎么解这个问题?
How to Learn 如何学习
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Minimum around here
最小值在这里附近
How to Learn 如何学习
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Solution: gradient descent
解决方法:梯度下降
Start from here
从这里开始
How to Learn 如何学习
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Solution: gradient descent
解决方法:梯度下降
How to Learn 如何学习
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Solution: gradient descent
解决方法:梯度下降
How to Learn 如何学习
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Solution: gradient descent
解决方法:梯度下降
How to Learn 如何学习
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Solution: gradient descent
解决方法:梯度下降
Repeat the process
重复该过程
Stop if the change of loss becomes too small
当损失变化非常小的时候终止
Gradient Calculation 梯度计算 (1)
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Gradient Calculation 梯度计算 (2)
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Gradient Calculation 梯度计算 (3)
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Practice 8.1 实践8.1
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Practice time: try logistic regression on the example�实践时刻:在这个例子上尝试对数几率回归
We Now Know 我们现在了解了
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
An Alternative Margin�别样的间距
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
0
1
0.5
An Alternative Margin�别样的间距
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
0
1
0.5
An Alternative Margin�别样的间距
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
0
1
0.5
Math Theorem 数学定理
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Upper Bound of Error 错误上界
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Practice 8.2 实践8.2
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Practice time: try logistic regression on word sense disambiguation
实践时刻:将对数几率回归用于词义消歧
How does it perform? 它的表现如何?
Result 结果
Machine Learning – Basic Principles & Practice: 8. An Alternative Margin
机器学习 – 基础原理与实践:8. 别样的间距
Methods 方法 | Accuracy 准确率 |
Nearest neighbor 最近邻 | 69.3% |
Perceptron 感知器 | 83.6% |
Perceptron w/ margin 带间距的感知器 | 85.7% |
Logistic regression 对数几率回归 | 85.0% |
The End