![]() |
1
2
你引用的两个公式做的事情并不完全相同,但它们在数学上是相关的。从NLTK包中引用的第一个定义称为Jaccard距离(D 贾卡德 )。您引用的第二个称为Jaccard相似性(Sim 贾卡德 )。 数学上,D 贾卡德 =1-Sim卡 贾卡德 。这里的直觉是,它们越相似(Sim卡越高 贾卡德 ),则距离越小(因此,D 贾卡德 )。 |
![]() |
2
1
你确定你没有混淆Jaccard的 指数 用Jaccard的 距离 ?
第一个确实应该按照您的建议进行计算,而第二个是
通过以下更改,实现速度更快(0.83 vs.1.29s=~ 35%):
您可以按以下方式重复我的测试(集合的结构将改变计时-这只是一个示例):
|
|
Cas · 自动制动系统激光雷达传感器的速度测量 7 年前 |
![]() |
Lisarv · 按组列出的所有可能坐标对之间的最大距离 7 年前 |
|
N. Anderson · 计算R中一系列x-y坐标之间的距离 7 年前 |
![]() |
Quinn · 查找多个点之间的最短距离 7 年前 |
![]() |
Redeemer · Redis。不同键中两个成员之间的距离 7 年前 |
![]() |
Jeroen van Onzen · 单个对象的最小屏幕宽度 7 年前 |
![]() |
V. Andy · 使用Python[闭合]计算两个坐标之间的距离 7 年前 |