提供通用分词器和Hash生成器接口,可以通过实现这两个接口来定制生成SimHash
SimHash算法的核心逻辑
提供了jcseg分词器和MD5Hash生成器
使用SimHash算法查重的演示案例
simhash · 实现SimHash算法,提供算法核心逻辑和定制接口
Advertisement
Top Dependency Usages