目录
线性回归
线性回归是一种统计方法,用于研究两个或多个变量之间的关系。在这种关系中,每个自变量都与因变量直接相关,而与其他自变量没有关系。这种直接相关的关系称为线性关系。因变量通常是连续值范围中的一个值。
线性回归模型的创建基于以下公式或线性函数:
y
: 表示预测的因变量。B0
: 为y截距,即当所有输入自变量都等于0时,因变量的值。B1X1
: 是第一个自变量(X1)的回归系数(B1),即第一个自变量对因变量的影响值。类似地,BnXn
是最后一个自变量(Xn)的回归系数(Bn)。ε
: 为模型误差。
逻辑回归
逻辑回归是一种用于预测因变量为二进制分类的统计方法。这些因变量的值通过使用有限类别列表得出,称为类别变量。例如,掷六面骰子的结果。这种因变量与自变量之间的关系称为逻辑关系。
逻辑回归公式对特定类别变量的成功或失败概率进行对数转换,即概率的自然对数。公式如下:
y
表示y类别变量的成功概率。e^(x)
是欧拉数e的x次方,是自然对数函数或sigmoid函数的基础。B0
、B1X1
…BnXn
的含义与线性回归中相同,其中B0
是截距,B1X1
到BnXn
表示各自变量对于因变量影响的权重。ε
代表模型误差。
对比
特征 | 线性回归 | 逻辑回归 |
---|---|---|
描述 | 一种统计方法,用于通过一组输入值预测输出值 | 一种统计方法,用于通过一组类别变量预测输出值来自某一类别的可能性 |
关系类型 | 线性关系,以直线表示 | 逻辑关系或S形关系,以S形曲线表示 |
函数类型 | 线性 | 对数 |
分析方法 | 回归 | 分类 |
分布类型 | 正态/高斯 | 二项式 |
应用场景 | 需要通过量表预测连续因变量的任务 | 需要预测一组固定类别中出现某一类别因变量的可能性的任务 |