![]() |
1
1
我的观点与那些提供答案的人不同——也就是说,你需要进一步说明问题。抽象层是正确的。进一步的规范将使问题变得更容易,但解决方案却没有那么有用。 几年前,我看到 graphic 在 ProgrammableWeb --它比较了雅虎的搜索结果和谷歌的搜索结果。covey有很多信息:有些结果在两个集合中,有些只在一个集合中,而共同的结果在各自引擎的结果中会有不同的位置,不知何故必须显示出来。 我喜欢这个图形,并在Matplotlib(一个Python科学绘图库)中重新实现了它。下面是一个使用一些随机点以及我用来生成它的python代码的示例:
这个模型有一些有趣的特点:(i)它实际上是以每个项目为基础处理“相似性”(连接点的垂直线),而不是聚合相似性;(ii)两个数据点之间的相似性程度与连接它们的线的角度成正比——如果它们相等,则为90度,随着差值的增加,角度减小;这是非常直观的;(iii)一个数据集中的一个点不在第二个数据集中的情况很容易显示——一个点将出现在两条线中的一条上,但没有一条线连接到另一条线上的一个点。 这个模型很适合比较搜索结果,因为每个搜索结果都有一个“分数”(其索引或结果列表中的顺序)。对于其他类型的数据,您可能需要为每个数据点分配一个分数——我可能会假设一个相似性度量(在某种意义上,这就是搜索结果的顺序,与列表顶部的距离) |
![]() |
2
0
由于在显示两个文件的diff方面已经做了很多工作,您可以首先用适当的文本格式表示“多个数据集”,然后使用您希望在这些文本格式之间显示diff的任何内容。 但你应该告诉我们更多关于你的数据集! |
![]() |
4
0
我同意彼得的观点,你应该具体说明你的数据是什么类型,以及你希望在比较中显示什么。 根据数据/比较的性质,您可以考虑不同的可视化效果。是你的数据吗 有序或无序 ? 你在比较多少东西,也就是说。 细颗粒或粗颗粒 比较? 示例:
还有,退房 visual complexity ,这是一个很好的可视化资源。 |
![]() |
Erdne Htábrob · geom_多边形填充中的纹理 7 年前 |
![]() |
Hackerds · 使用seaborn绘制序列 7 年前 |
![]() |
Black · Seaborn:使用非对称自定义误差条按组制作条形图 7 年前 |
![]() |
BenAhm · Power BI可视化和格式化 7 年前 |
![]() |
Vivek Subramanian · 用散点图可视化大型三维数据集 7 年前 |
![]() |
galusben · 在redash上,如何创建显示类型计数的图表 8 年前 |
![]() |
silvermax · 散点图绘制错误的ZingChart刻度Y记号 8 年前 |