内容审查

TGwiki大约 8 分钟

内容审查制度

私信中的审查

Telegram不扫描私信，也不检测其中新的和已存在的非法内容。
仅在消息接受者提交举报的情况下，Telegram才会执行自动检查或将消息转发到审核人员。

加密对话中的审查

即使一方提交了举报，来自加密对话的消息也不会转发给审核人员。
来自加密对话的举报不含消息文本，Telegram使用一种替代信号（alternative signals），无法向公众披露。

私密频道和群组中的审查

提示

所有私密群组和频道中的照片和视频会均被自动检测已知非法内容的系统扫描。

大多数私密频道和群组对审核人员不可见，除非其中的参与者对该社区提交了举报。
Telegram的规则禁止在可公开查看的频道、群组、机器人等中宣传暴力和传播非法色情内容。尽管如此，Telegram并不容忍在服务任何部分出现的非法内容。
Telegram代表澄清说，其规则中的公开 (public)指的是应用程序中任何积极审核的部分。
没有用户名不代表频道是私有的：对于审核人员，如果私密频道或群组通过邀请链接对公众开放，那么就会被认为是公开的，因为审查人员可以通过公开的邀请链接查看其中的消息。

自动检测非法内容

Telegram可自动检测照片、视频和文本中的非法内容，但仅在某些情况下会检测。
Telegram不会自动扫描私信，除非参与者提交举报。
自动检测到的潜在极端主义内容中，有65%发送给审核人员进行人工审查。
新检测到的疑似涉及虐待儿童的材料可能立即自动处理，或者发送给审核人员进行人工审查，“根据相关模型结合其他因素作出的判断的可信度”。

Telegram可自动检测已知的非法内容和新出现的疑似非法内容。两种内容有不同的规则：

已知内容（极端主义和虐待儿童）

Telegram在除私信外的所有部分自动扫描已知的照片和视频，包括私密群组和频道。
默认情况下Telegram不扫描消息中的文本。
如果对消息或对话提出举报，Telegram会扫描匹配已知非法材料的文本。

新出现的疑似非法内容（极端主义和虐待儿童）

被举报的文本、照片和视频，公开群组和频道，故事，头像，简介和用户名被自动扫描。
除非对它们提交了举报，否则私信、私密群组和频道不会被扫描新的非法内容。
被移除的材料会被添加到已知禁止内容的数据库中。

附：自动检测系统的技术结构

Telegram主要使用自己的签名数据库来自动检测非法内容，该数据库仅收集审核人员人工确定的非法材料。
Telegram还定期检查欧洲刑警组织的签名数据库并集成到其系统中，用于检测极端主义文本的模型和工具在大多数语言中都能较好的工作。
Telegram系统跟踪用户被群组管理员移除的时间、原因和频繁程度，并在某些情况下采取适当的措施。此外，Telegram的人工智能模型在处理举报和自动决策时也会考虑这些指标。
Telegram使用某些信号来确定与已知被此前封禁的群组相似的新群组。
Telegram不适用链接黑名单。Telegram表示：“与静态链接黑名单相比，将工作重点放在基于机器学习的分类上往往能取得更好的效果。”
Telegram表示它对媒体来源进行了“广泛监控”，且会审查“未注册用户和可信任组织”通过电子邮件发送给Telegram的链接。

对于使用的模型，Telegram命名为：基于多语言转换器的微调自监督多语种语言模型，微调视觉转换器模型，基于多语言转换器的端到端ASR（自动语音识别）系统，基于多模态变换器的图像-文本数据集对齐模型，基于多语言转换器的大型语言模型，以及自定义数据聚类算法。

根据Telegram的说法，以上模型中的“若干个”已经在报告期结束（2024年2月29日）前部署，此后该公司显著扩展了AI和机器学习技术的使用。

处理用户举报

Telegram指出用户举报由Telegram的“工具”、审核人员和必要情况下人工智能/机器学习模型处理。

关于极端主义内容的举报中，75%发送到审核人员人工处理。

与组织的合作

Telegram定期与以下组织互动：

英国内政部
全球打击极端主义意识形态中心
欧盟互联网论坛
欧洲刑警组织
英国通信管理局
联合国安理会反恐怖主义委员会执行局

Telegram还指出，截至2024年10月，它 “正在加入互联网观察基金会的安全计划，其中包括访问包含已知CSAM网站链接的URL列表” 。

永久封禁的标准

以文字、图片、录音、录像或其他形式传播呼吁使用暴力的材料。
Telegram明确指出，这是指“类似具体和明确的人身伤害威胁”的材料。
传播可怕或令人震惊的图形材料。
Telegram给出的例子包括“酷刑细节、事故照片”或“美化或宣扬暴力或恐怖主义意识形态”的材料。
为恐怖组织或事业募集资金。
持有或管理参与上述活动的社区。

提示

如果属于“记者”或“研究人员”的社区或账户出于传播“合法可选研究、历史材料或新闻”的目的发表了极端主义内容，Telegram可能：

给予例外；
或在终止社区或账户前最多发出两次警告。

Telegram指出，决定的执行取决于 “所发布内容在适用法律下的严重性、目的和相关性” 。

封禁上诉的成功率

与传播极端主义内容有关的自动封禁上诉成功率为3%。
基于用户举报传播极端主义内容的封禁上诉成功率为2%。
与传播虐待儿童内容有关的自动封禁上诉成功率为8%。
根据用户举报传播虐待儿童内容的封禁上诉成功率为8%。

关于审核的其他信息

删除群组或频道后，审核人员会手动检查用户查找该对话时最常用的搜索词。此举为将这些查询从Telegram的公开搜索中排除，从而限制类似内容在未来的传播和使用。
如果群组管理员本身不违反Telegram的规则（例如，如果群组暂时受到攻击者行为的影响），Telegram审核人员可自行决定暂时关闭群组，给管理员清除违规行为的机会。反之，如果社区被用来传播被禁止的内容，无论是由管理员还是参与者发布，则其管理员和违反使用条款的用户都可能被永久封禁。
当Telegram识别到传播极端主义材料的用户时，会检查 “与此用户相链接的更多举报，以及用户拥有或管理的任何社区” 。Telegram表示，任何被发现传播此类材料的社区也将被删除。
频道的订阅者或群组的成员，如果没有参与管理、直接传播或推广违规内容，即使他们是可能存在此类内容的社区的成员，也不会被自动封禁。Telegram表示，采取这种做法是为了避免对执法人员、记者、活动家和其他用户造成意外伤害，因为他们可能会因为客观原因成为此类群组的成员。
鉴于虐待儿童行为的严重性，任何与之相关的违规行为通常都会导致相关账户和社区被永久删除。此类群组和频道的所有者也可能被删除。

提示

本文内容整理自：澳大利亚互联网安全监管机构eSafety于2025年3月对Telegram审核的调查（英文）。