代码之家 › 专栏 › 技术社区 › ì¡ì¤ì

如何在python中进行多元回归分析?

regression tensorflow python

ì¡ì¤ì · 技术社区 · 6 年前

我使用以下假设运行以下简单代码:

A值和B值彼此相似,通过组合多个变量使B值等于A值。

所以我的假设是这样的

a=w1(重量)*b+w2(重量)c(变异数)+

这是我的代码

hypothesis = tf.sigmoid(tf.matmul(X1, W1)+tf.matmul(X2, W2)+tf.matmul(X3, W3)+tf.matmul(X4, W4) + tf.matmul(X5, W5) + b1)


cost = -tf.reduce_mean(Y * tf.log(hypothesis) + (1 - Y) * tf.log(1 - hypothesis))
train = tf.train.GradientDescentOptimizer(learning_rate=0.000000000000000001).minimize(cost)

predicted = tf.cast(hypothesis > 0.5, dtype=tf.float32)
accuracy = tf.reduce_mean(tf.cast(tf.equal(predicted, Y), dtype=tf.float32))

with tf.Session() as sess:
   # Initialize TensorFlow variables
   sess.run(tf.global_variables_initializer())
   for step in range(5000):
       sess.run(y, feed_dict={X1:ct, X2: temperature, X3:humidity, X4: windspeed, X5:tideheight, Y:sst})

但是,当我验证了这段代码的值时,我发现了一个根本不适合的值。

当我查看数据集时,它似乎不是线性的。

如果你能给我举个例子,我将不胜感激。

我的数据集:

 A         B             C              D         E       F
25.6    27.29999    24.4752741667   71.5801495  6.468   97.1
25.6    27.5    24.3449186667   71.1314193333   5.39    288.3
25.4    27.60001    24.4019961667   71.8209758333   6.076   103.7
25.5    27.5    24.3473485  71.3570816667   6.762   95.3
25.5    27.5    24.3420308333   71.9577738333   5.978   103.7
25.6    27.29999    24.464413   71.993804   6.37    105.8
25.6    27.29999    24.3999401667   71.5558695  6.664   100.2
                           ...

1 回复 | 直到 6 年前

Bogdan Osyka 6 年前

我不确定神经网络是否是这类问题的正确选择。我建议用线性回归法来解决这个问题。我宁愿开始熟悉 SciKit学习库 以及监督学习的算法。 http://scikit-learn.org/stable/supervised_learning.html#supervised-learning 和熊猫 https://pandas.pydata.org/ 便于数据预处理。在您对这些库更加熟悉之后,请尝试遵循以下策略:

进行数据集预处理(即删除nan,不必要的列,缩放功能)
将数据集拆分为培训以及测试部件。
尝试运行几个线性模型(即线性回归,岭),尝试改进验证方案 (Kfold,层叠褶皱)
选择适当的指标以验证模型

SciKit学习文档应包含必要信息。祝你好运

推荐文章

July · 如何定义数字间隔,然后四舍五入

1 年前

Community wiki · 对象名称前的单下划线和双下划线的含义是什么?

1 年前

Brian Johnson · 为什么在Python中列出字典列表会引发TypeError?[已关闭]

1 年前

user026 · 如何根据特定窗口的平均值(行数)创建新列?

1 年前

Ashok Shrestha · 需要追踪特定的颜色线并获取坐标

1 年前

Nicote Ool · 在FastApi和Vue3中获得422

1 年前

NeoExceptCodeBad · 如果我有很多垂直线,我如何找到它们的边缘?

1 年前

Abdulaziz · 如何对集合内的列表进行排序[重复]

1 年前

user2743931 · 带有src目录的Python setup.py

1 年前

asmgx · 为什么合并数据帧不能按照python中的预期方式工作

1 年前