我大概写了有十年博客,基本上也算是见证了这十年里屏蔽手段和敏感词的变化。 十年前那会儿也是有敏感词库,不过基本上会限定在一些特定的历史事件和领导人名称上,以及出现一些群体性事件后会短暂屏蔽一些人名和地名。这样的敏感词库你很容易找到,你也很容易学会,只要稍加自我审查,你大抵是能在写作时避开这些内容的。比较好笑是有一次我写“什么什么大海”,结果半天发不出去,后来才知道,原来是某位领导人的名字。
这个词库一直在更新,其涵盖的层面也一直在被扩展,首先是越来越多的名词不能再讲了,尤其是和政治,社会制度,秩序,国家运行有关的词语,再后来就是很多指代性的词也不能再讲了,然后你就得开始考虑如何能够讲出来,你就开始使用许多奇怪的分隔符,同音字,试图骗过机器。但是后来会发现机器学习也在学习,它逐渐开始理解了你那些同音字和分隔符。最好是写英文,但是英文的那些词逐渐也会被屏蔽,用德语可以解决这个问题。但不管是哪门外语,这就意味着你写出来的东西默认别人懂这门语言,这肯定不对。
在这个过程中,你的所有精力都用来在考虑,我如何审查我自己,才能让这篇东西被更多人读到。你的自我审查会越来越严重,而且这还只是对抗机器这个环节,更不要提你还要继续想,你如何才能骗过随时都在巡逻的审查员,来让你的这篇内容不被删除,你写太明白,它看了会直接删除,你写不明白,那没人能够读懂。你要让它看不明白你在讲什么,同时又要让读者看明白。
我后来经常在七八年后收到一条系统管理员私信,提示我我七八年前的一条博客被删除,一条影评被删除,一段游记不适合公开传播,一场演唱会回顾被建议修改,我回去对着那些内容抓耳挠腮,也看不出来修改的地方在哪。
对了,你们知道吗,有一阵子,“屏蔽”和“敏感词”这两个词语也是被屏蔽的,你只能用,“屏了”和“闽赣词”来替代。这就意味着当你今天想说我这条微博会被屏蔽,使用了“屏蔽”这个词,然后就真的会被屏蔽。怎么样,神奇吧!
而且,这甚至还只是到对抗机器与人工审查这一步而已。你还没想到在举报风愈演愈烈的年代,你的随便一句话,一个用词,一点情感表达,都可能会招致一场疯狂的举报运动。你会在每一个角落思索,这一句会不会伤害网民们的感情,会不会被删帖是第一位,除此之外被举报呢?
所有的这一切,我们统统称为自我审查。你审查一切可能,最后将你的表达限定在一个足够安全的范围内,而即便如此,我可能也还是不够敏感,不够审查,大概平均下来,每天会有至少不止一条内容会触发机器,审查员,与举报者的敏感神经。
而且,我所说的这一切,只还是博客时代而已。在短视频时代,技术和手段变了,玩法也变了。我没有用过短视频,我就不讲了。
所以,你告诉我,在这样的一个环境下,当你在讲出中文已死的时候,你究竟在讲些什么东西?
(文章仅代表作者个人立场和观点)
来源:鱼克雅未克
(看中国:http://kzg.io/gb4E8W )