1. 您的位置:首页 > 站群资讯 >内容

群控软件免费版-Digg推出了经过改进的内容重复检测技术

Digg周二宣布,他们终于将对重复检测技术进行一些重大更新,说实话–时间到了!他们以前使用的技术几乎不可靠。

它过去的工作方式是,您继续输入要提交的故事的URL和所有详细信息,然后在完成所有操作后,Digg会询问您是否确定不是重复的。除此之外,它还会向您显示它认为可能与您的故事相似的故事列表。许多没有丝毫关系群控软件免费版,有些是在几天,几周甚至几个月前提交的。但是,如果您向Digg保证您的链接实际上不是重复的(即使是重复的),则可以继续并提交您的链接。

根据Digg和Brent Csutoras的说法,他们已经更新了其软件查找重复项的方式。他们说,最常见的重复故事类型是来自同一站点的相同故事 但网址不同。因此,为解决此问题,他们设计了一种解决方案,该解决方案将使用文档相似性算法来识别这些重复项。换句话说,它现在能够识别来自同一来源的相同内容。

另一个问题是在不同站点上报道的相同或相似的故事。在这里,事情变得有些棘手。 Digg声称他们在检测具有相似描述性信息的重复项方面做得更好。他们的软件不会匹配具有相似标题和描述的故事,且准确性更高。听起来这并不是一个完美的解决方案,但群控软件免费版是任何改进都比以前更好。

提交信息的顺序也已更改。在您输入URL和所有描述性信息之前,Digg不会检查重复项,因此,如果有重复项,您要浪费几分钟的时间才能找到。现在它将检查immedi的重复项在输入网址之后,但在输入描述性信息之前。

这些更改仍在完善中,因此在试用期内,Digg将继续仅在30天内阻止完全相同的URL提交。他们还将监视Digg用户何时绕过高可信度重复项。

如果有助于对抗垃圾邮件的无休止的打击,进步是一件好事。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。如若转载,请注明出处:http://www.botadmin.cn/changjianwenti/6373.html