在上面的图片中,最高级别的样本是6499,它被分成3356个真和3143个假。但是如果你遵循真实的路径,它说有2644个样本。为什么没有3356?所有样品似乎与上述水平的结果相冲突。
我想我只是误解了什么样的样本和价值,但如果是代码,这里是图形部分的代码:
dot_data = tree.export_graphviz(clf,
feature_names=columns[1:],
out_file=None,
filled=True,
rounded=True)
graph = pydotplus.graph_from_dot_data(dot_data)
colors = ('green', 'red')
edges = collections.defaultdict(list)
for edge in graph.get_edge_list():
edges[edge.get_source()].append(int(edge.get_destination()))
for edge in edges:
edges[edge].sort()
for i in range(2):
dest = graph.get_node(str(edges[edge][i]))[0]
dest.set_fillcolor(colors[i])
graph.write_png('tree.png')