Loading...

目录


线性回归

线性回归是一种统计方法,用于研究两个或多个变量之间的关系。在这种关系中,每个自变量都与因变量直接相关,而与其他自变量没有关系。这种直接相关的关系称为线性关系。因变量通常是连续值范围中的一个值。

线性回归模型的创建基于以下公式或线性函数:

y=B0+B1X1+B2X2+...+BnXn+εy = B0 + B1X1 + B2X2 + ... + BnXn + ε

  • y: 表示预测的因变量。
  • B0: 为y截距,即当所有输入自变量都等于0时,因变量的值。
  • B1X1: 是第一个自变量(X1)的回归系数(B1),即第一个自变量对因变量的影响值。类似地,BnXn 是最后一个自变量(Xn)的回归系数(Bn)。
  • ε: 为模型误差。

逻辑回归

逻辑回归是一种用于预测因变量为二进制分类的统计方法。这些因变量的值通过使用有限类别列表得出,称为类别变量。例如,掷六面骰子的结果。这种因变量与自变量之间的关系称为逻辑关系。

逻辑回归公式对特定类别变量的成功或失败概率进行对数转换,即概率的自然对数。公式如下:

y=e(B0+B1X1+B2X2+...+BnXn+ε)/(1+e(B0+B1X1+B2X2+...+BnXn+ε))y = e^{(B0 + B1X1 + B2X2 + ... + BnXn + ε)} / (1 + e^{(B0 + B1X1 + B2X2 + ... + BnXn + ε)})

  • y 表示y类别变量的成功概率。
  • e^(x) 是欧拉数e的x次方,是自然对数函数或sigmoid函数的基础。
  • B0B1X1BnXn 的含义与线性回归中相同,其中B0是截距,B1X1BnXn表示各自变量对于因变量影响的权重。
  • ε 代表模型误差。

对比

特征 线性回归 逻辑回归
描述 一种统计方法,用于通过一组输入值预测输出值 一种统计方法,用于通过一组类别变量预测输出值来自某一类别的可能性
关系类型 线性关系,以直线表示 逻辑关系或S形关系,以S形曲线表示
函数类型 线性 对数
分析方法 回归 分类
分布类型 正态/高斯 二项式
应用场景 需要通过量表预测连续因变量的任务 需要预测一组固定类别中出现某一类别因变量的可能性的任务

参考链接