注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Oracle、MySQL资料及经验

.

 
 
 

日志

 
 

python计算两字符串的相似度  

2017-05-02 11:51:17|  分类: Python |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
使用Levenshtein的distance或ratio计算两字符串的相似度,可用户计算两文章标题是否为类似文章。

# pip3 instatll python_Levenshtein

>>> from Levenshtein import *
>>> print(distance("abc","ac"))
1
>>> print(distance("abc","ac"))
1
>>> print(distance("我来北京天安门","北京天安门"))
2
>>> print(distance("我来北京天安门","京北安天门"))
4
>>> print(distance("我来北京天安门","京北安天门"))
4
>>> print(distance("我来北京天安门","京北安天门卫不让进"))
8
>>> print(distance("我来北京天安门","我来北京天安门"))
0
>>> print(distance("我来北京天安门","ZykjDBAroot 密码"))
14


>>> print(ratio("abc","ac"))
0.8
>>> print(ratio("我来北京天安门","北京天安门"))
0.8333333333333334
>>> print(ratio("我来北京天安门","京北安天门"))
0.5
>>> print(ratio("我来北京天安门","京北安天门卫不让进"))
0.375
>>> print(ratio("我来北京天安门","我来北京天安门"))
1.0
>>> print(ratio("我来北京天安门","ZykjDBAroot 密码"))
0.0
  评论这张
 
阅读(35)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017