1
3
这里有很多困惑。首先,让我们从定义开始 定义
发生什么事了现在,您可以从两个角度查看线性回归。 统计信息视图一个角度假设您的响应变量Y是正态分布的随机变量,因为: Y~a*X+b+epsilon 哪里 ε~N(0,σ^ sq) X是另一个分布。我们并不真正关心X是如何分布的,也不关心它是如何被给定的。在这种情况下,条件分布为 Y | X~N(a*X+b,σ^ sq) 注意这里的a,b 还有 X是一个数字,不存在与之相关的随机性。 数学视图另一个视图是数学视图,我假设有一个函数f(.)这控制着现实生活的过程,如果在现实生活中我观察到X,那么f(X)应该是输出。当然,情况并非如此,假设偏差是由于各种原因造成的,如量规误差等。声称该函数是线性的: f(X)=a*X+b 合成现在我们如何组合这些?那么,如下所示: E[Y | X]=a*X+b=f(X) 关于你的问题,我首先想挑战它应该是Y | X,而不是Y本身。 第二,关于每个术语在现实生活中所代表的含义,存在着大量可能的本体论讨论。十、 Y(大写)可以是向量。十、 Y(大写)也可以是随机变量。这些随机变量的样本可能存储在向量中,并且两者都用大写字母表示(最好的方法是为每个变量使用不同的字体)。在这种情况下,您的样本将成为您的数据。应在随机变量层面上讨论模型的总体观点及其与现实生活的相关性。推断参数的方法,线性回归算法的工作原理应该在矩阵和向量级别上进行。可能还有其他讨论,你应该关心这两个问题。 我希望这个过于杂乱无章的答案对你有所帮助。一般来说,如果你想学习这些东西,一定要知道你正在处理什么类型的数学对象和运算符,它们作为输入的内容是什么,它们与现实生活的相关性是什么。 |
bz_jf · CNN训练损失太不稳定了 2 年前 |
Bad Coder · 如何在Pyte中使用SMOTE? 2 年前 |
Sherwin R · 随机森林预测错误的输出形状 2 年前 |
Palkin Jangra · 如何迭代一列以获得每行的平均值? 2 年前 |