关于原创和抄袭 / 2020-09-23

搜索引擎检索出来的与开发技术有关的文章往往有很高的重复度,翻来覆去在不同网站中的都是同一篇文章,严重影响了用户体验。在这个情况中,即有抄袭者的问题,也有搜索引擎的问题。

2012年我一时心血来潮注册了域名,搞起了独立博客。从2016年开始,启用了现在的「easeapi.com」域名提供服务,除了展示业务产品外,一个重要的功能就是写博客。

不可否认,博客在PC互联网时代的高光时刻已经远离。在移动互联网时代,它早已凋零落寞。现在,更多的人使用微信公众号等新的产品形态来写作。搞独立博客,只是我的个人喜好。我想要更完全的掌控,想要自由,所以选择做独立博客。

从做独立博客以来,不可避免的遇到过很多抄袭问题。

最早的时候,我自己也并没有多少关于原创和版权的概念,只是单纯的写我想写。随着博客文章渐渐多起来,我发现有一些网站转载了我的文章,但大部分都没有标示原文的链接。我试图跟这些未标示来源的转载方沟通,也尝试向平台投诉,发现卵用没有,该抄袭的还是抄袭,丝毫没有影响。博客内容被恶意转载、抄袭、洗稿等,这些年一直都有遇到,只是最近几年随着大家的版权意识提升,情况有所改善。这个问题的难受之处并不是被抄袭了多少,而是在目前这个网络环境中,你根本无法触碰到对方,对方可能只是一个邮件一个网址,他就在那里,做着不以为耻的事情,你却拿他毫无办法。

我们常常有这种感觉:搜索引擎检索出来的与开发技术有关的文章往往有很高的重复度,翻来覆去在不同网站中的都是同一篇文章,严重影响了用户体验。在这个情况中,即有抄袭者的问题,也有搜索引擎的问题。

于抄袭者,抄袭成本太低。通过抄袭能快速获取大量流量却不会有任何负面影响,仅仅可能会被从道德上谴责几句,但跟这帮人谈道德无异于对牛弹琴。他们既然能光明正大的抄袭,也就做好了当无赖的准备,与他们讲道理纯属多费口舌。我只得放宽心态,在文章中适当放一些专属的标记,抄就抄吧。

于搜索引擎,对原创还不是很友好。我记得刚开始写博客时,就了解到百度在加强对原创的保护,打击站群、采集站等。可是,时间过去了这么久,作为普通用户,我没有感觉到百度在提高原创内容的权重上做了任何努力,可以说是毫无建树。这个事情我不认为会需要比AI更高的技术,到现在,识别原创应该是相对成熟的技术。但现实是,往往各种采集站,垃圾站抄袭的文章展示在搜索结果的最前面,而原创文章不知道要翻几页才能看到。

我曾经试图向百度投诉一个明显是采集站网站的抄袭问题,希望从搜索引擎层面降低其权重。收到了下面的回复:

尊敬的用户您好,百度作为一家搜索引擎,仅为网民提供信息检索服务,自身并不能对被第三方网站的原始内容进行编辑,相应内容不代表百度的观点和立场。如果第三方网站上的内容需要更正,建议您直接联系该网站。

你看,非常官方且逻辑严密的话,理由充分的你几乎找不到任何破绽:我百度只是负责信息检索,对网站内容的疑问应该找该网站解决。从百度的角度来看这个问题,它不可能以投诉的方式认定几个网页的抄袭,人工成本太高,判责尺度也不好把握,索性直接不接受此类投诉。

抄袭方不回应不处理,在加上搜索引擎的偏袒,对于原创者来说,就是无处可寻,无路可走。

你看,这个世界,并不是都有个理可讲的。

这就是现状,再耿耿于怀也无益。

我有理由相信,那些抄袭采集站背后,必不是一颗善良的心。我能做的就是保持初心,希望不要变成我讨厌的那种人。

其他文章

回不去的时光:稻场与星空
我为什么要做独立博客
读老舍的《离婚》:我们终不能免俗