敏感词屏蔽,是一把防护盾,也是一把阉割刀
一次被“禁止词汇”拦下的评论
某一日,在满心的博客上评论时,提交不了,警报说有“禁止词汇”。

刚开始没注意到提示语,再次提交时才看清了。我定睛看了看,不觉有异,尝试小改之后再提交,还是不行。疑惑之下,发邮件向博主询问,他很快就回复我了,并且告诉我是因为“中国”两个字,并且沟通后他去掉了这个屏蔽项,真是一位很nice的博主。

无处不在的屏蔽体验
由此事,触动我关于敏感词屏蔽的很多记忆。我在常用的几个互联网平台上,几乎都遭遇过不合理的敏感词屏蔽。有时候删除,有时候限读或禁言,有时候某个词能说,有时候又不能说。
博客小站设置屏蔽,可以理解,很多时候是必要的,主要是防止垃圾广告机器人乱发或网络攻击,与互联网平台的敏感词屏蔽完全不同,不在本文讨论范围。
我的博客评论区基本上没有设置屏蔽防护,后台检测某些情况下会转入待审核,由人工干预,前台连验证码也去掉了,事实表明,我这个微弱小站的评论区几乎没有出现垃圾评论。
不知是否有人把敏感词屏蔽和古代的避讳联系起来,但本质不同。古代有“为尊者讳”,为帝王、父母、尊长等隐瞒名讳表示尊敬或敬畏,是下对上的尊,是一种文化传统,就像中国人不能没事直呼父母姓名一样。现在的敏感词屏蔽没有这一层意思,只是一种秩序管理或免责手段。
从“屏蔽脏话”到“屏蔽一切”,以及被扭曲的语言表达
敏感词屏蔽,在中文互联网平台上,可以说是自古以来的“优良”传统了。最早是在论坛或游戏里面替换掉一些粗鄙骂人的词汇,渐渐的就扩大到不想让你讨论的话题,再到不想你提及的特殊人名或事物,现在已经许多严肃的词汇(比如国家、医院、警察)都可能被屏蔽了。
看文字内容,如知乎回答或者各平台的文字评论区,经常见到各种莫名其妙的黑话、缩写、拼音、谐音。经常看B站抖音的朋友,必定多次遇见过这样的情形:正常的视频说话过程中,突然刺耳的“哔————”一声,就很难受。
平台上的直播间,更是重灾区。虽然我不看直播,但会刷到直播切片,看到听到大量的黑话替换,真是不舒服。公务员写成GWY,政府写成ZF,人民警察说成帽子叔叔,医院说成加号,婚姻说成扯证,怀孕说成小西瓜,酒说成八加一,钱说成米,微信说成绿泡泡,淘宝说成某宝,等等。
不透明的规则、普遍的自我审查、表达成本高升
大多数时候平台对于内容敏感词的处罚是极不透明的,一切尽在不言中,没有公开的具体规则(只有笼统的可以任意解释的),也不会对判罚细节进行公布,也没有高效的复议通道。导致内容发布者必须陷入麻烦的自我审查,自我阉割。
像赖岳谦这样的爱国学者教授,也直言在B站发视频最累最烦的不是做视频本身,而是反反复复不明原因的审核不通过。马督工这样的非情绪化输出的博主,也会经常遇到视频被毙的情况,以至于视频一发出来,大家就喊着赶紧缓存。
能否寻找平衡
我见到有些人已经在利用自己微薄的影响力呼吁有关部门重视和管理用词乱象,但那不过是头疼医头脚疼医脚,根源还是审查制度本身。我并不反对内容审查,甚至是支持必要的内容审查。显著的暴力、色情、辱骂,任何人都会同意进行屏蔽、删除、惩罚,但如何避免大量伤及无辜,如何避免矫枉过正,是需要符合当代社会发展的制度设计的。AI新世纪了,还在玩“刑不可知,则威不可测”,那我们的文化政策就还在两千年前的水平。
我以为,关键是:统一标准、公开透明、公众参与、快速更新。
如果平台能够检测到发布的内容中的某部分不是显著的恶意违规,只是可能违规,或无意瑕疵,是否可以由平台自动对内容进行打码、标注、提醒,而不是一律审核不通过或删除甚至停号呢?这样对于发布者而言就轻松多了,但平台大概是不愿意多担这样的责任和风险。监管层对于平台的约束也是不透明的,平台也不敢自专。
如果由国家网信办统一建立审查平台标准库,公布和动态更新用于审查的相关的API和软件包,各互联网平台都与其对接,采用统一的审查标准、审查流程、审查格式、复议流程,避免各家互联网平台自建审核部门或外包第三方内容审核公司,是否更好呢?
普通老百姓如何参与其中,也是需要考虑的,这是民主的重要体现之一。是否可以从实名申诉库中抽样由随机选取的大量普通老百姓集体投票表决是否违规呢?
现实无力,未来可期
敏感词屏蔽,本意是一把防护盾,现实中更是一把阉割刀。
作为防护盾的作用,作用非常有限,对平台和内容创作者都有巨大代价,而对黑灰产或专门做坏事的人来说,很容易变换出绕过屏蔽机制的手段。让我想起手机卡实名制,对于防范电信诈骗的作用,防了个寂寞,但使得黑灰产获得了大量的隐私信息,徒增普通人的烦恼,会被骗的人还是会被骗。
作为阉割刀的作用,倒是十分显著,汉字之美,汉语之美,就被割了一刀一刀,内容被挖出一个个丑陋的黑色方块,或填入混乱不堪的杂物垃圾。平台自我阉割,内容发布者也自我阉割,每一方都有无辜之处,每一方都有痛点,似乎世间难得双全法,但总要有个前进的方向。









