我正在使用sklearn中的支持向量分类器(在python中)来查找标记为“0”和“1”的数据集之间的最佳边界。
见:
https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html
但是,我想在旋转关于边界线的数据后执行一些分析,因此我需要返回允许我定义要开始的线的属性。
我执行SVC如下:
相关进口:
from sklearn import svm
import numpy as np
import matplotlib.pyplot as plt
我将分类器定义为:
clf = svm.SVC(kernel='linear',C = 1e-3 ,class_weight='balanced')
然后与培训数据相匹配:
clf.fit(f_train, labels_train)
因此,可以使用以下方法查看线性类边界:
plt.figure()
ax = plt.gca()
xlim = ax.get_xlim()
ylim = ax.get_ylim()
xx = np.linspace(xlim[0], xlim[1], 30)
yy = np.linspace(ylim[0], ylim[1], 30)
YY, XX = np.meshgrid(yy, xx)
xy = np.vstack([XX.ravel(), YY.ravel()]).T
Z = clf.decision_function(xy).reshape(XX.shape)
ax.contour(XX, YY, Z, colors='k', levels=[-1, 0, 1], alpha=0.5,
linestyles=['--', '-', '--'])
如:
https://scikit-learn.org/stable/auto_examples/svm/plot_separating_hyperplane.html
但打电话时:
clf.support_vectors_.shape
如果试图将线性边界描述为输出具有形状(4485,2),我不知道如何将输出解释为相关的。
任何帮助返回的东西,将允许我定义边界线将非常感谢!