T/GECPA 0001-2024 信息安全技术互联网不良信息治理技术规范
- 文件大小:453.44 KB
- 标准类型:综合团体标准
- 标准语言:中文版
- 文件类型:PDF文档
- 更新时间:2025-03-07
- 下载次数:
- 标签:
资料介绍
ICS 35.240.01
CCS L 70
广东省企业竞争力促进会团体标准
T/GECPA 0001-2024
信息安全技术互联网不良信息治理技术规范
Information Security Technology-Technical Specification for InternetBad Information Governance
2024-9-30 发布2024-10-01 实施
广东省企业竞争力促进会发布
目次
前言................................................................................. III
引言.................................................................................. IV
1 范围................................................................................ 1
2 规范性引用文件...................................................................... 1
3 术语和定义.......................................................................... 1
4 符号和缩略语........................................................................ 2
5 互联网不良信息治理技术总则.......................................................... 2
5.1 治理技术原则.................................................................. 2
5.2 治理技术目标.................................................................. 3
5.3 治理技术架构.................................................................. 3
6 管理规范............................................................................ 3
6.1 管理规范要求.................................................................. 3
6.2 管理办法...................................................................... 4
6.3 管理组织体系建设.............................................................. 4
6.4 业务资产管理机制.............................................................. 4
6.5 审核管理机制.................................................................. 4
6.6 不良信息处置流程.............................................................. 5
6.7 应急响应机制.................................................................. 5
6.8 监督与保障机制................................................................ 6
6.9 跟踪评估管理机制.............................................................. 6
7 技术规范............................................................................ 6
7.1 技术规范要求.................................................................. 6
7.2 监测资产台账.................................................................. 7
7.3 策略资源库.................................................................... 7
7.5 内容采集能力.................................................................. 8
7.6 信息内容预处理................................................................ 8
7.7 不良信息识别能力.............................................................. 8
7.8 黑/白名单检测................................................................ 10
7.9 暗链/外链检测................................................................ 10
7.10 域名备案情况核查............................................................ 10
7.11 自动告警.................................................................... 10
T/GECPA 0001-2024
II
7.12 人工审核.................................................................... 10
7.13 预警处置.................................................................... 11
7.14 自动核验.................................................................... 11
7.15 报告与分析.................................................................. 11
7.16 日志管理.................................................................... 11
参考文献.............................................................................. 12
T/GECPA 0001-2024
III
前言
本文件按照GB/T1.1—2020《标准化工作导则第1 部分:标准化文件的结构和起草规则》的规定
起草。
本文件由广东省企业竞争力促进会提出并归口。
本文件起草单位:中数通信息有限公司、广东省电信规划设计院有限公司、广东烟草东莞市有限公
司、广东省企业竞争力促进会、广东省企业诚信建设促进会。
本文件主要起草人:梁晓丹、杨光、胡耀恩、张宇宏、郭利荣、黄根华、钱漫、陈杜勇、钟培泉、
孙东远、刘映兰。
T/GECPA 0001-2024
IV
引言
本标准详细描述了互联网不良信息治理技术在实施全过程中的管理规范和技术规范。
随着信息技术的高速发展和网络应用的普及,网络与信息的基础性、全局性作用已经成为国家安全、
经济建设和社会发展的重要战略资源之一。而信息内容安全作为信息安全的重要组成部分,随着《中华
人民共和国网络安全法》、《互联网信息服务管理办法》、《网络信息内容生态治理规定》等法律、行
政法规正式施行,明确规定不能传播有害国家社会稳定、青少年身心健康的信息,要求各地和各级单位
务必高度重视,把治理工作当成网络信息安全工作的重中之重。应对互联网中宣扬的不良信息及时清理,
不折不扣、切实落实社会主义精神文明建设对网络不良信息防治的要求。
因此,互联网不良信息治理责任主体需承担起互联网不良信息治理的责任与义务。贯彻落实相关法
律法规,遵循政策、监管要求,在互联网不良信息治理技术实施全过程中通过管理和技术两个层面,对
互联网上的违法和不良信息进行监测、处置、管理和控制,有效进行互联网不良信息治理,以营造清朗
的网络空间,维护信息内容安全,有效防止不良信息传播危及国家安全和利益,引发社会动荡和不稳定,
避免不良信息对经济活动造成负面影响,防止青少年受到不良信息的误导和影响,确保互联网的正常秩
序和公共安全。
在互联网不良信息治理全过程中技术是实现有效管理不良信息的关键工具和手段,而不良信息管理
则为技术发展提供了应用场景和目标导向。在落实信息内容安全相关法律、行政法规的监管规定时,需
要有对应规范标准指导互联网不良信息监测系统的功能、能力和管理建设,确保系统技术能配合管理落
实监管规定,保障并提高治理水平和效果。同时,也要有相应的规范标准细化和指导做好不良信息治理
的管理工作,推动技术迭代,相辅相成,共同做好不良信息防治工作。
T/GECPA 0001-2024
1
信息安全技术互联网不良信息治理技术规范
1 范围
本标准主要规定了互联网不良信息治理技术在实施全过程中的管理规范和技术规范,通过本标准,
组织可以通过管理和技术两个层面,有效治理互联网不良信息。
本标准适用于为组织提供互联网不良信息治理技术在实施全过程中的管理规范和技术规范。
2 规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于文件。
凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GBT 25069-2022 信息安全技术术语
GBT 29246-2017 信息技术安全技术信息安全管理体系概述和词汇
《互联网信息服务管理办法》(国务院令第292 号)
《网络信息内容生态治理规定》(国家互联网信息办公室令第5 号)
3 术语和定义
GBT 29246-2017 和GB/T 25069—2022 界定的以及下列术语和定义适用于本文件。
3.1
治理者governing body
互联网不良信息治理责任主体。
注1:责任主体包括政府机构、互联网接入服务提供者、网站和平台运营者、信息实体运营账号责任单位等。
注2:这个定义只适用于本文件。
3.2
互联网不良信息Internet harmful Information
指通过互联网网络散布的不符合法律规定、有违社会公共秩序与道德、破坏信息安全,对社会产生
有害影响的信息。
3.3
互联网不良信息治理harmful information governance
指治理者以培育和践行社会主义核心价值观为根本,以网络信息内容为主要治理对象,以建立健全
网络综合治理体系,对互联网上的违法和不良信息进行监测、处置、管理和控制的一系列措施和方法,
以营造清朗的网络空间、建设良好的网络生态为目标,保障公众的合法权益和信息安全。
T/GECPA 0001-2024
2
[《网络信息内容生态治理规定》,第二条,做了修改]
3.4
内链internal link
网站或网页内部不同页面之间相互链接的链接关系。
3.5
外链external link
网站或网页链接到其他网站或外部资源的链接。
3.6
暗链hidden link
一种隐藏在网页中不易被用户发现的链接。
4 符号和缩略语
下列符号和缩略语适用于本文件。
URL 统一资源定位符, 也被称为网页地址(Uniform Resource Locator)
OCR 光学字符识别(Optical Character Recognition)
AI 人工智能(Artificial Intelligence)
HTTP 超文本传输协议(Hypertext Transfer Protocol)
HTTPS 安全超文本传输协议(Secure Hypertext Transfer Protocol)
5 互联网不良信息治理技术总则
5.1 治理技术原则
在互联网不良信息治理工作中,为确保有效、合法和秩序井然的治理过程,治理者在治理技术实施
全过程中应遵循以下重要原则:
a) 依法治理:遵守国家法律法规,依法对互联网不良信息进行管理和处理,维护公共利益和社会
秩序;
b) 社会责任:承担社会责任,积极参与不良信息治理工作,维护网络生态和社会秩序;
c) 权责明确:明确各方责任,区分平台责任和用户责任,加强管理和监督,形成多方共治格局;
d) 实事求是:根据事实和数据进行不良信息治理,客观公正地处理信息问题;
e) 科技治理:遵循依法治理的原则,利用科技手段,运用如人工智能、大数据等先进的技术方法,
提高不良信息治理效率和精准度;
f) 精准治理:针对不同类型的不良信息采取相应的治理措施,因地制宜,对不同情况做出精准应
对;
g) 保护用户隐私:在不良信息治理过程中,保护用户个人信息和隐私,合法合规地使用用户数据;
T/GECPA 0001-2024
3
h) 透明公开:治理工作公开透明,及时向社会公布治理结果和举报渠道,接受舆论监督;
i) 防范优先:加强预防工作,防止不良信息传播,减少不良信息对社会的危害。
5.2 治理技术目标
互联网不良信息治理技术在实施全过程中目标为:
a) 净化网络环境,提升网络信息的质量和可信度;
b) 加大不良信息的监管和执法力度;
c) 推动治理者健全不良信息治理管理制度;
d) 有效防范不良信息传播,及时发现不良信息并快速阻断;
e) 确保互联网不良信息有效治理。
5.3 治理技术架构
互联网不良信息治理技术在实施全过程通过管理和技术两个层面,依法对互联网不良信息进行管理
和处置。治理者在互联网不良信息治理技术实施全过程的管理层面上应明确管理规范,理顺管理职责、
处置要求和应急响应保障机制;在技术层面上采用技术工具,通过自动化的内容采集、识别、告警以及
自动核验等技术功能对业务进行实时监控,及时发现不良信息和验证处置结果,确保系统技术能配合管
理落实法律、行政法规的监管规定。管理和技术相辅相成,持续进行监控与管理,跟踪评估治理效果,
帮助治理者有效进行互联网不良信息治理,提高治理效率和准确率。
互联网不良信息治理技术实施全过程中的管理层面和技术层面的关系,应包含如下图所示:
互联网不良信息治理技术的“管理+技术”总体架构示意图
6 管理规范
6.1 管理规范要求
管理规范是在互联网不良信息治理技术实施全过程中的管理层面上,提供不良信息治理管理细则,
T/GECPA 0001-2024
4
指导治理者进行不良信息技术治理管理工作,提高技术治理的效率和效果。管理规范包括管理办法、管
理组织体系建设、业务资产管理机制、审核管理机制、不良信息处置流程、应急响应机制、监督与保障
机制、跟踪评估管理机制等。
6.2 管理办法
治理者通过建立互联网不良信息治理技术实施全过程的“管理办法”,制定规范标准化治理细则,
指导不良信息治理的管理工作。建立“管理办法”,应遵循以下要求:
a) 设立管理组织体系,明确各部门管理职责分工;
b) 制定互联网信息业务资产管理机制,统一管理;
c) 制定明确的互联网不良信息的审核管理机制,统一审核标准;
d) 制定规范化互联网不良信息处置流程,及时处理不良信息;
e) 制定不良信息重大事件处理应急响应机制,快速响应;
f) 制定监督与保障机制,监督保障工作开展;
g) 制定跟踪评估管理体制,持续改进治理措施。
6.3 管理组织体系建设
治理者通过建立健全、高效、有序的互联网不良信息治理技术实施全过程“管理组织体系”,履行
不良信息治理技术实施全过程中的工作职责。管理组织体系建设,应遵循以下要求:
a) 建立清晰的管理组织结构,包括管理层、各级部门和岗位设置,明确责任、权限和协作关系;
b) 建立健全的管理制度和流程,包括制定相关规章制度、工作流程、责任分工等,保障管理工作
有序进行;
c) 明确各岗位的责任分工,确定岗位人员的职责范围和工作目标。
6.4 业务资产管理机制
治理者通过建立健全的互联网不良信息治理业务的“业务资产管理机制”,确定业务资产管理的目
标、范围、责任、流程等管理规范,保障业务资产的信息内容安全。建立“业务资产管理机制”,应遵
循以下要求:
a) 建立信息业务资产明细台账,明确组织内的信息资产范围,理清组织内的资产进行统一管理;
b) 明确信息业务资产的责任归属,明确责任单位及责任人;
c) 根据信息资产的性质和重要性进行分类管理;
d) 评估信息资产的价值,确定信息资产管理的重点和优先级;
e) 建立完整的信息资产生命周期管理机制,包括业务上线、变更、维护、下线等各个阶段;
f) 建立规范化的信息资产管理流程,对信息资产更新进行审批及跟踪记录;
g) 建立健全的第三方的业务资产管理风险管理机制,明确与第三方的安全管理要求及责任。
6.5 审核管理机制
T/GECPA 0001-2024
5
治理者通过建立健全的互联网不良信息的“审核管理机制”,有效减少不良信息对用户的侵害,提
升网络空间的质量和安全性。建立“审核管理机制”,应遵循以下要求:
a) 建立明确的审核标准和规范,明确不良信息定义和分类,根据统一标准进行审核;
b) 建立专业的审核团队,包括审核人员、审核主管、技术支持人员等;
c) 建立规范的审核流程,包括信息提交、初审、复审、处理等环节,确保信息审核全程可控;
d) 支持利用自动化监测技术手段,实时监测业务内容,辅助审核工作,提高审核效率和准确性;
e) 建立审核记录保存机制,记录审核过程中的关键信息和决策过程,为日后溯源和复查提供依据;
f) 建立处理异常情况的机制,对于审核中发现的特殊情况或争议信息,及时调查核实,制定相应
处理措施;
g) 设立用户举报机制,为用户提供举报渠道,对举报信息进行核实和处理;
h) 建立定期评估和审查机制,收集用户反馈意见和审核问题,及时调整审核标准和流程,持续提
升审核管理水平。
6.6 不良信息处置流程
治理者通过建立规范化的“不良信息处置流程”,高效、规范地处置不良信息。建立“不良信息处
置流程”,应遵循以下要求:
a) 建立规范化的不良信息处置流程,明确处置职责分工、处理时效、处理方式等;
b) 支持对不良信息进行分类鉴别,明确不良信息范畴;
c) 支持追溯不良信息源头,查明信息传播路径和渠道;
d) 支持根据不良信息的分类和风险等级采取相应的处理措施,包括警示、删除、屏蔽、封禁不良
信息等处理方式;
e) 支持详细记录对不良信息的处理过程,包括处理人员、处理时间、处理方式等信息,以备后续
追踪和评估;
f) 支持对关键不良信息进行追踪监控,确保信息处理效果,防止信息再次传播或扩散;
g) 不良信息处置后,及时进行业务整改,分析问题产生原因,完善审核保障措施;
h) 建立数据保护和隐私保护机制,在不良信息处置过程中,保护用户的个人信息和隐私不受侵犯;
i) 定期对不良信息处理流程进行评估和审查,总结不良信息处理过程中的问题和教训,及时改进,
加强预防措施,提高处理效率和质量。
6.7 应急响应机制
治理者通过建立健全的互联网不良信息治理技术实施全过程的“应急响应机制”,对突发性、严重
性不良信息事件的快速、有效处置。建立“应急响应机制”,应遵循以下要求:
a) 制定不良信息事件的应急响应程序和流程;
b) 组建应急响应团队,确定应急响应小组成员及其职责分工;
c) 制定详细的应急预案,定期演练和测试;
d) 建立应急预案响应处置机制,明确应急响应时效要求;
T/GECPA 0001-2024
6
e) 建立信息通报机制,及时向上级通报不良信息事件的情况和处理进展。
6.8 监督与保障机制
治理者通过建立互联网不良信息治理技术实施全过程的“监督与保障机制”,监督和保障互联网不
良信息治理技术实施全过程工作的开展。建立“监督与保障机制”,应遵循以下要求:
a) 制定制度保障,从制度上保证各级单位的不良信息治理工作有章可循、有据可依;
b) 明确岗位职责保障,明确各单位工作岗位的职责,治理责任落实到岗到人;
c) 建立日常监测机制,各单位定期对运营中的业务进行监测与巡检,及时发现并整改问题隐患;
d) 建立沟通汇报机制,召开定期或不定期会议交流不良信息治理情况,建立信息安全月报/季报/
年报制度,定期汇报或发布不良信息治理工作整体情况;
e) 建立人员教育与培训机制,定期开展教育与培训考核,提升从业人员素质及处理和应对能力;
f) 建立监督检查机制,各管理组织根据不良信息治理工作开展情况进行检查或抽查。
6.9 跟踪评估管理机制
治理者通过建立互联网不良信息治理技术实施全过程的“跟踪评估管理机制”,对互联网不良信息
治理技术实施全过程工作进行持续性、系统性地监测、评估和反馈,及时改进治理措施和机制。建立“跟
踪评估管理机制”,应遵循以下要求:
a) 建立完善的互联网不良信息治理评估指标体系,包括发现速度、处理效率、用户投诉率等指标,
确定评估指标的权重及评价标准,对治理效果进行量化评估;
b) 建立有效的数据监测与分析机制,对不良信息传播的趋势和规律进行监测和分析,及时发现问
题并采取针对性措施,为治理工作提供数据支持;
c) 建立风险评估与预警机制,对可能引发不良信息传播的风险进行及时评估和预警,及时发现潜
在不良信息;
d) 建立健全的考核机制,定期对相关部门、业务平台不良信息治理工作进行绩效评估,根据评估
结果进行奖惩和改进;
e) 建立健全的第三方合作监督考核机制,约定信息内容安全管理考核制度和违法违规处罚标准;
f) 定期输出不良信息治理评估报告,为不良信息治理决策提供参考依据;
g) 建立健全的内部评审机制,定期对管理体系和工作程序进行评估和审查,及时发现问题并调整
和改进工作方法和流程。
7 技术规范
7.1 技术规范要求
本条目所描述的技术规范是对互联网不良信息治理技术实施全过程中在技术层面上采用技术工具
应具备功能提出要求,其技术工具的功能应包括监测资产台账、策略资源库、拨测扫描配置、内容采集
T/GECPA 0001-2024
7
能力、信息内容预处理、不良信息识别能力、黑/白名单检测、暗链/外链检测、域名备案情况核查、自
动告警、人工审核、预警处置、自动核验、报告与分析、日志管理等功能。
7.2 监测资产台账
技术工具应具备监测资产台账管理功能,包括网站、APP、小程序、公众号、微博、视频号等信息
实体资产台账,并提供查询、新增、导入、修改、删除、启用、禁用功能:
a) 网站台账:包括网站名称、域名、IP、网站状态、归属地、责任单位、责任人等;
b) APP 台账:包括APP 名称、下载链接、归属地、责任单位、责任人等;
c) 小程序台账:包括小程序名称、归属地、责任单位、责任人等;
d) 公众号台账:包括公众号名称、公众号标识、公众号类别、归属地、责任单位、责任人等;
e) 微博台账:包括微博名称、微博标识、归属地、责任单位、责任人等;
f) 视频号台账:包括实体名称、标识、实体载体、归属地、责任单位、责任人等。
7.3 策略资源库
技术工具应具备不良信息监测策略资源库管理功能,包括分类体系、关键词库、文本样本库、图片
特征库、黑名单库、白名单库等,并符合以下要求:
a) 支持定制关键词、文本样本、图片特例、黑/白名单等不良信息检测策略;
b) 具备不良信息的关键词特征库、语义文本样本库;
c) 具备不良信息图片样例库;
d) 具备网站、APP、小程序、公众号、微博、视频号等黑/白名单库;
e) 支持对不良信息进行分类,建立分类体系;
f) 支持不良信息按风险等级进行管理;
g) 支持定期更新维护不良信息特征库;
h) 不良信息包含《互联网信息服务管理办法》第十五条中规定的九类危害信息:
——反对宪法所确定的基本原则的;
——危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一的;
——损害国家荣誉和利益的;
——煽动民族仇恨、民族歧视,破坏民族团结的;
——破坏国家宗教政策,宣扬邪教和封建迷信的;
——散布谣言,扰乱社会秩序,破坏社会稳定的;
——散布淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪的;
——侮辱或者诽谤他人,侵害他人合法权益的;
——含有法律、行政法规禁止的其他内容的。
7.4 拨测扫描配置
技术工具应具备配置拨测扫描任务功能,对指定的网站、APP、小程序、公众号、微博、视频号等
T/GECPA 0001-2024
8
进行主动扫描,检查业务信息的合法性,应支持以下策略配置要求:
a) 支持批量添加拨测任务;
b) 支持对拨测对象按风险等级、检测要求等进行分级,并针对拨测对象分级设定差异化拨测策略;
c) 支持配置拨测任务的优先级;
d) 支持场景化智能策略管理机制;
e) 扫描任务策略配置包括:业务类型、拨测对象、扫描周期、扫描范围、优先级、拨测时间、拨
测层次、采集链路数、任务有效期、任务状态等信息;
f) 支持查询、添加、修改、删除、发布、禁用扫描任务。
7.5 内容采集能力
技术工具应具备互联网信息内容自动化采集能力,对网站、APP、小程序、公众号、微博、视频号
等互联网业务内容进行采集,并符合以下要求:
a) 支持采集互联网业务中的文字、图片、音频、视频、文档、URL 等信息;
b) 支持通过网络爬虫方式对特定的域名、URL、IP 地址/地址段进行内容自动采集,具备反爬虫
功能的网站进行内容获取的能力,支持对HTTP、HTTPS 站进行爬扫;
c) 支持通过终端模拟器或终端实机运行的方式对特定的APP、小程序、公众号、视频号等进行内
容自动采集;
d) 支持按配置的探测扫描策略对互联网信息进行自动扫描采集;
e) 支持对采集数据进行清洗、去重;
f) 支持全量保存自动扫描采集数据,以备查证;
g) 提供对爬取URL 页面的快照功能。
7.6 信息内容预处理
技术工具应支持对采集获取的数据文件进行预处理,确保识别功能兼容主流文本、图片、音频、视
频格式,包括:
a) 格式转换;
b) 文件规范化;
c) 文件大小规整处理;
d) 语言处理和分词。
7.7 不良信息识别能力
技术工具应能依据安全监测策略对采集处理后的互联网信息内容中存在的不良信息进行自动化识
别,通过算法模型判断采集的文本、图片、音频、视频等内容是否为《互联网信息服务管理办法》第十
五条中规定的违法、色情、赌博、谣言、涉政、反动、暴力等不良信息,并对识别的不良信息进行分级
分类告警。
T/GECPA 0001-2024
9
7.7.1 文本识别
技术工具应支持对采集的文本内容进行自动分析与识别,检测出文本内容中含有的不良信息及类别,
并符合以下要求:
a) 支持通过关键词库,对本文信息进行关键词或关键词组进行过滤匹配,判断是否为不良信息,
输出识别结果;
b) 支持基于深度学习模型,对采集并预处理后的文本数据进行AI 语义分类识别,判断是否为不
良信息,输出识别结果;
c) 支持关键词识别及AI 语义识别模型融合,支持并行或串行处理,根据策略输出识别结果;
d) 支持对文本内容进行不良信息分类识别;
e) 支持识别的文本格式包含但不限于text、htm、html、xml、wml、jsp、php、js、asp、aspx、
txt、rtf、multipart、form-data、vnd.wap.mms-message 等主流格式。
7.7.2 图片识别
技术工具应支持对采集的图片内容进行自动分析与识别,检测出图片内容中含有的不良信息及分类,
并符合以下要求:
a) 通过AI 图片智能分类、样例库比对、特征库识别、人脸识别、OCR 识别等多种方法识别图片,
并可支持根据策略综合判定图片是否为不良信息;
b) 支持对图片内容进行不良信息分类识别;
c) 支持识别的图片格式包含但不限于jpg、jpeg、bmp、gif、png、wbmp、tiff、tif 等主流格式。
7.7.3 音频识别
技术工具应支持对采集的音频内容进行自动分析与识别,检测出音频内容中含有的不良信息及分类,
并符合以下要求:
a) 支持对采集的音频内容识别为文本,再通过对文本的智能识别,判断音频内容是否为不良信息;
b) 支持对音频内容进行不良信息分类识别;
c) 支持识别的音频格式包含但不限于CDA、WAV、AIFF、MP3、MID、WMA、RA、AMR-NB、AMR-WB、
VQF、ACC 等主流格式。
7.7.4 视频识别
技术工具应支持对采集的视频内容进行自动分析与识别,检测出视频内容中含有的不良信息,并符
合以下要求:
a) 支持对视频进行智能取帧,提取关键帧图片;
b) 将提取的关键帧图片进行图片内容识别,判断视频内容是否为不良信息;
c) 支持对视频内容进行不良信息分类识别;
d) 支持识别的视频格式包含但不限于AVI、WMV、RM、RMVB、MPEG1、MPEG2、MPEG4(MP4)、3GP、
ASF、SWF、VOB、DAT、MOV、M4V、FLV、F4V、MKV、MTS、TS 等主流格式。
T/GECPA 0001-2024
10
7.8 黑/白名单检测
技术工具应具备黑/白名单检测功能,并符合以下要求:
a) 依据黑名单库中的网站、APP、小程序、公众号、微博、视频号等业务进行检测;
b) 依据白名单库,对加入库中的网站、APP、小程序、公众号、微博、视频号等业务不做检测。
7.9 暗链/外链检测
技术工具应具备暗链/外链检测功能,对网页代码进行分析,发现网页中含有的暗链/外链地址进行
检测,及时发现存在不良信息的链接地址。
7.10 域名备案情况核查
技术工具应具备域名备案情况核查功能,主动发现存在隐患的网站进行预警处置,防止不良信息传
播,包括:
a) 未备案域名;
b) 域名过期;
c) 即将过期;
d) 备案号变更;
e) 域名IP 异常;
f) 首页备案号不一致;
g) 访问异常。
7.11 自动告警
技术工具应具备根据识别结果自动生成不良信息告警功能,并符合以下要求:
a) 支持文本、图片、音频、视频等不良信息告警;
b) 支持命中黑名单库告警;
c) 支持不良信息分级分类告警;
d) 支持对发现的违规内容的页面进行快照,支持生成违规内容链接溯源;
e) 支持告警信息查询、导出、审核功能;
f) 告警信息包括告警时间、业务名称、业务类别、告警级别、嫌疑类别、告警URL、URL 类别(内
链、外链、暗链)、网页快照、链接溯源、命中策略等。
7.12 人工审核
技术工具应具备人工审核功能,对识别的不良信息告警信息进行人工审核,进一步判断是否不良信
息,并符合以下要求:
a) 支持文本、图片、音频、视频告警人工审核功能,判断是否为不良信息;
b) 支持批量审核功能,审核项包含正常和违规;
T/GECPA 0001-2024
11
c) 支持违规告警命中关键词或关键区域高亮,标注违规内容的类别及告警级别,辅助人工审核;
d) 审核时支持查看违规内容链接、查看识别内容快照、查看违规内容链接溯源等信息;
e) 支持查看已审核记录和审核为违规的记录,支持导出审核记录;
f) 支持将人工审核后信息加入算法模型样本库中。
7.13 预警处置
技术工具应具备违规信息预警处置功能,支持自配置预警策略,对审核为违规的信息进行预警处置,
并符合以下要求:
a) 通过短信、邮件等渠道通知相关人员及时对违规信息进行处理;
b) 支持工单派发违规信息至责任单位进行处置;
c) 支持违规信息取证手工或自动截图留痕佐证;
d) 支持违规信息处置流程全流程溯源。
7.14 自动核验
技术工具应具备不良信息处置自动核验能力,自动对已处置的不良信息进行扫描核验,及时验证不
良信息是否已处置完成。
7.15 报告与分析
技术工具应支持对监测、识别、处理过程中产生的数据进行汇总统计和分析,以图表方式显示统计
分析信息,并生成数据报告,包括:不良信息的类型分布、不良信息明细、处理效果评估、趋势分析等,
为管理决策提供参考依据。
7.16 日志管理
技术工具应具备日志管理功能。
a) 应具备以下事件生成日志:
——正常网络访问日志;
——用户操作日志,包括用户登录/退出系统、查询、新增、修改、删除等操作;
——对互联网信息的采集及不良信息识别记录备份与恢复;
——监测服务中产生的异常故障报警等日志;
——其他安全事件;
——应记录每个事件发生的时间、操作业务、描述等信息。
b) 应提供日志管理功能:
——支持日志访问授权,仅授权用户可访问;
——支持日志查询、导出功能,仅授权用户运行查询/导出日志数据;
——支持日志存储时间设定功能,仅超级管理员允许设定日志存储时间;
——对日志数据进行有效地存储和管理,确保日志数据的完整性、可靠性和安全性。
T/GECPA 0001-2024
12
参考文献
[1] GBT 25069-2022 信息安全技术术语
[2] GBT 29246-2017 信息技术安全技术信息安全管理体系概述和词汇
[3] 《互联网信息服务管理办法》(国务院令第292 号)第十五条
[4] 《网络信息内容生态治理规定》(国家互联网信息办公室令第5 号)第二条上一篇:T/GDYGX 001-2023 危险化学品安全信息码应用规范
下一篇:T/ACEF 216-2025 燃煤锅炉尿素脱硝优化控制系统技术导则
CCS L 70
广东省企业竞争力促进会团体标准
T/GECPA 0001-2024
信息安全技术互联网不良信息治理技术规范
Information Security Technology-Technical Specification for InternetBad Information Governance
2024-9-30 发布2024-10-01 实施
广东省企业竞争力促进会发布
目次
前言................................................................................. III
引言.................................................................................. IV
1 范围................................................................................ 1
2 规范性引用文件...................................................................... 1
3 术语和定义.......................................................................... 1
4 符号和缩略语........................................................................ 2
5 互联网不良信息治理技术总则.......................................................... 2
5.1 治理技术原则.................................................................. 2
5.2 治理技术目标.................................................................. 3
5.3 治理技术架构.................................................................. 3
6 管理规范............................................................................ 3
6.1 管理规范要求.................................................................. 3
6.2 管理办法...................................................................... 4
6.3 管理组织体系建设.............................................................. 4
6.4 业务资产管理机制.............................................................. 4
6.5 审核管理机制.................................................................. 4
6.6 不良信息处置流程.............................................................. 5
6.7 应急响应机制.................................................................. 5
6.8 监督与保障机制................................................................ 6
6.9 跟踪评估管理机制.............................................................. 6
7 技术规范............................................................................ 6
7.1 技术规范要求.................................................................. 6
7.2 监测资产台账.................................................................. 7
7.3 策略资源库.................................................................... 7
7.5 内容采集能力.................................................................. 8
7.6 信息内容预处理................................................................ 8
7.7 不良信息识别能力.............................................................. 8
7.8 黑/白名单检测................................................................ 10
7.9 暗链/外链检测................................................................ 10
7.10 域名备案情况核查............................................................ 10
7.11 自动告警.................................................................... 10
T/GECPA 0001-2024
II
7.12 人工审核.................................................................... 10
7.13 预警处置.................................................................... 11
7.14 自动核验.................................................................... 11
7.15 报告与分析.................................................................. 11
7.16 日志管理.................................................................... 11
参考文献.............................................................................. 12
T/GECPA 0001-2024
III
前言
本文件按照GB/T1.1—2020《标准化工作导则第1 部分:标准化文件的结构和起草规则》的规定
起草。
本文件由广东省企业竞争力促进会提出并归口。
本文件起草单位:中数通信息有限公司、广东省电信规划设计院有限公司、广东烟草东莞市有限公
司、广东省企业竞争力促进会、广东省企业诚信建设促进会。
本文件主要起草人:梁晓丹、杨光、胡耀恩、张宇宏、郭利荣、黄根华、钱漫、陈杜勇、钟培泉、
孙东远、刘映兰。
T/GECPA 0001-2024
IV
引言
本标准详细描述了互联网不良信息治理技术在实施全过程中的管理规范和技术规范。
随着信息技术的高速发展和网络应用的普及,网络与信息的基础性、全局性作用已经成为国家安全、
经济建设和社会发展的重要战略资源之一。而信息内容安全作为信息安全的重要组成部分,随着《中华
人民共和国网络安全法》、《互联网信息服务管理办法》、《网络信息内容生态治理规定》等法律、行
政法规正式施行,明确规定不能传播有害国家社会稳定、青少年身心健康的信息,要求各地和各级单位
务必高度重视,把治理工作当成网络信息安全工作的重中之重。应对互联网中宣扬的不良信息及时清理,
不折不扣、切实落实社会主义精神文明建设对网络不良信息防治的要求。
因此,互联网不良信息治理责任主体需承担起互联网不良信息治理的责任与义务。贯彻落实相关法
律法规,遵循政策、监管要求,在互联网不良信息治理技术实施全过程中通过管理和技术两个层面,对
互联网上的违法和不良信息进行监测、处置、管理和控制,有效进行互联网不良信息治理,以营造清朗
的网络空间,维护信息内容安全,有效防止不良信息传播危及国家安全和利益,引发社会动荡和不稳定,
避免不良信息对经济活动造成负面影响,防止青少年受到不良信息的误导和影响,确保互联网的正常秩
序和公共安全。
在互联网不良信息治理全过程中技术是实现有效管理不良信息的关键工具和手段,而不良信息管理
则为技术发展提供了应用场景和目标导向。在落实信息内容安全相关法律、行政法规的监管规定时,需
要有对应规范标准指导互联网不良信息监测系统的功能、能力和管理建设,确保系统技术能配合管理落
实监管规定,保障并提高治理水平和效果。同时,也要有相应的规范标准细化和指导做好不良信息治理
的管理工作,推动技术迭代,相辅相成,共同做好不良信息防治工作。
T/GECPA 0001-2024
1
信息安全技术互联网不良信息治理技术规范
1 范围
本标准主要规定了互联网不良信息治理技术在实施全过程中的管理规范和技术规范,通过本标准,
组织可以通过管理和技术两个层面,有效治理互联网不良信息。
本标准适用于为组织提供互联网不良信息治理技术在实施全过程中的管理规范和技术规范。
2 规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于文件。
凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GBT 25069-2022 信息安全技术术语
GBT 29246-2017 信息技术安全技术信息安全管理体系概述和词汇
《互联网信息服务管理办法》(国务院令第292 号)
《网络信息内容生态治理规定》(国家互联网信息办公室令第5 号)
3 术语和定义
GBT 29246-2017 和GB/T 25069—2022 界定的以及下列术语和定义适用于本文件。
3.1
治理者governing body
互联网不良信息治理责任主体。
注1:责任主体包括政府机构、互联网接入服务提供者、网站和平台运营者、信息实体运营账号责任单位等。
注2:这个定义只适用于本文件。
3.2
互联网不良信息Internet harmful Information
指通过互联网网络散布的不符合法律规定、有违社会公共秩序与道德、破坏信息安全,对社会产生
有害影响的信息。
3.3
互联网不良信息治理harmful information governance
指治理者以培育和践行社会主义核心价值观为根本,以网络信息内容为主要治理对象,以建立健全
网络综合治理体系,对互联网上的违法和不良信息进行监测、处置、管理和控制的一系列措施和方法,
以营造清朗的网络空间、建设良好的网络生态为目标,保障公众的合法权益和信息安全。
T/GECPA 0001-2024
2
[《网络信息内容生态治理规定》,第二条,做了修改]
3.4
内链internal link
网站或网页内部不同页面之间相互链接的链接关系。
3.5
外链external link
网站或网页链接到其他网站或外部资源的链接。
3.6
暗链hidden link
一种隐藏在网页中不易被用户发现的链接。
4 符号和缩略语
下列符号和缩略语适用于本文件。
URL 统一资源定位符, 也被称为网页地址(Uniform Resource Locator)
OCR 光学字符识别(Optical Character Recognition)
AI 人工智能(Artificial Intelligence)
HTTP 超文本传输协议(Hypertext Transfer Protocol)
HTTPS 安全超文本传输协议(Secure Hypertext Transfer Protocol)
5 互联网不良信息治理技术总则
5.1 治理技术原则
在互联网不良信息治理工作中,为确保有效、合法和秩序井然的治理过程,治理者在治理技术实施
全过程中应遵循以下重要原则:
a) 依法治理:遵守国家法律法规,依法对互联网不良信息进行管理和处理,维护公共利益和社会
秩序;
b) 社会责任:承担社会责任,积极参与不良信息治理工作,维护网络生态和社会秩序;
c) 权责明确:明确各方责任,区分平台责任和用户责任,加强管理和监督,形成多方共治格局;
d) 实事求是:根据事实和数据进行不良信息治理,客观公正地处理信息问题;
e) 科技治理:遵循依法治理的原则,利用科技手段,运用如人工智能、大数据等先进的技术方法,
提高不良信息治理效率和精准度;
f) 精准治理:针对不同类型的不良信息采取相应的治理措施,因地制宜,对不同情况做出精准应
对;
g) 保护用户隐私:在不良信息治理过程中,保护用户个人信息和隐私,合法合规地使用用户数据;
T/GECPA 0001-2024
3
h) 透明公开:治理工作公开透明,及时向社会公布治理结果和举报渠道,接受舆论监督;
i) 防范优先:加强预防工作,防止不良信息传播,减少不良信息对社会的危害。
5.2 治理技术目标
互联网不良信息治理技术在实施全过程中目标为:
a) 净化网络环境,提升网络信息的质量和可信度;
b) 加大不良信息的监管和执法力度;
c) 推动治理者健全不良信息治理管理制度;
d) 有效防范不良信息传播,及时发现不良信息并快速阻断;
e) 确保互联网不良信息有效治理。
5.3 治理技术架构
互联网不良信息治理技术在实施全过程通过管理和技术两个层面,依法对互联网不良信息进行管理
和处置。治理者在互联网不良信息治理技术实施全过程的管理层面上应明确管理规范,理顺管理职责、
处置要求和应急响应保障机制;在技术层面上采用技术工具,通过自动化的内容采集、识别、告警以及
自动核验等技术功能对业务进行实时监控,及时发现不良信息和验证处置结果,确保系统技术能配合管
理落实法律、行政法规的监管规定。管理和技术相辅相成,持续进行监控与管理,跟踪评估治理效果,
帮助治理者有效进行互联网不良信息治理,提高治理效率和准确率。
互联网不良信息治理技术实施全过程中的管理层面和技术层面的关系,应包含如下图所示:
互联网不良信息治理技术的“管理+技术”总体架构示意图
6 管理规范
6.1 管理规范要求
管理规范是在互联网不良信息治理技术实施全过程中的管理层面上,提供不良信息治理管理细则,
T/GECPA 0001-2024
4
指导治理者进行不良信息技术治理管理工作,提高技术治理的效率和效果。管理规范包括管理办法、管
理组织体系建设、业务资产管理机制、审核管理机制、不良信息处置流程、应急响应机制、监督与保障
机制、跟踪评估管理机制等。
6.2 管理办法
治理者通过建立互联网不良信息治理技术实施全过程的“管理办法”,制定规范标准化治理细则,
指导不良信息治理的管理工作。建立“管理办法”,应遵循以下要求:
a) 设立管理组织体系,明确各部门管理职责分工;
b) 制定互联网信息业务资产管理机制,统一管理;
c) 制定明确的互联网不良信息的审核管理机制,统一审核标准;
d) 制定规范化互联网不良信息处置流程,及时处理不良信息;
e) 制定不良信息重大事件处理应急响应机制,快速响应;
f) 制定监督与保障机制,监督保障工作开展;
g) 制定跟踪评估管理体制,持续改进治理措施。
6.3 管理组织体系建设
治理者通过建立健全、高效、有序的互联网不良信息治理技术实施全过程“管理组织体系”,履行
不良信息治理技术实施全过程中的工作职责。管理组织体系建设,应遵循以下要求:
a) 建立清晰的管理组织结构,包括管理层、各级部门和岗位设置,明确责任、权限和协作关系;
b) 建立健全的管理制度和流程,包括制定相关规章制度、工作流程、责任分工等,保障管理工作
有序进行;
c) 明确各岗位的责任分工,确定岗位人员的职责范围和工作目标。
6.4 业务资产管理机制
治理者通过建立健全的互联网不良信息治理业务的“业务资产管理机制”,确定业务资产管理的目
标、范围、责任、流程等管理规范,保障业务资产的信息内容安全。建立“业务资产管理机制”,应遵
循以下要求:
a) 建立信息业务资产明细台账,明确组织内的信息资产范围,理清组织内的资产进行统一管理;
b) 明确信息业务资产的责任归属,明确责任单位及责任人;
c) 根据信息资产的性质和重要性进行分类管理;
d) 评估信息资产的价值,确定信息资产管理的重点和优先级;
e) 建立完整的信息资产生命周期管理机制,包括业务上线、变更、维护、下线等各个阶段;
f) 建立规范化的信息资产管理流程,对信息资产更新进行审批及跟踪记录;
g) 建立健全的第三方的业务资产管理风险管理机制,明确与第三方的安全管理要求及责任。
6.5 审核管理机制
T/GECPA 0001-2024
5
治理者通过建立健全的互联网不良信息的“审核管理机制”,有效减少不良信息对用户的侵害,提
升网络空间的质量和安全性。建立“审核管理机制”,应遵循以下要求:
a) 建立明确的审核标准和规范,明确不良信息定义和分类,根据统一标准进行审核;
b) 建立专业的审核团队,包括审核人员、审核主管、技术支持人员等;
c) 建立规范的审核流程,包括信息提交、初审、复审、处理等环节,确保信息审核全程可控;
d) 支持利用自动化监测技术手段,实时监测业务内容,辅助审核工作,提高审核效率和准确性;
e) 建立审核记录保存机制,记录审核过程中的关键信息和决策过程,为日后溯源和复查提供依据;
f) 建立处理异常情况的机制,对于审核中发现的特殊情况或争议信息,及时调查核实,制定相应
处理措施;
g) 设立用户举报机制,为用户提供举报渠道,对举报信息进行核实和处理;
h) 建立定期评估和审查机制,收集用户反馈意见和审核问题,及时调整审核标准和流程,持续提
升审核管理水平。
6.6 不良信息处置流程
治理者通过建立规范化的“不良信息处置流程”,高效、规范地处置不良信息。建立“不良信息处
置流程”,应遵循以下要求:
a) 建立规范化的不良信息处置流程,明确处置职责分工、处理时效、处理方式等;
b) 支持对不良信息进行分类鉴别,明确不良信息范畴;
c) 支持追溯不良信息源头,查明信息传播路径和渠道;
d) 支持根据不良信息的分类和风险等级采取相应的处理措施,包括警示、删除、屏蔽、封禁不良
信息等处理方式;
e) 支持详细记录对不良信息的处理过程,包括处理人员、处理时间、处理方式等信息,以备后续
追踪和评估;
f) 支持对关键不良信息进行追踪监控,确保信息处理效果,防止信息再次传播或扩散;
g) 不良信息处置后,及时进行业务整改,分析问题产生原因,完善审核保障措施;
h) 建立数据保护和隐私保护机制,在不良信息处置过程中,保护用户的个人信息和隐私不受侵犯;
i) 定期对不良信息处理流程进行评估和审查,总结不良信息处理过程中的问题和教训,及时改进,
加强预防措施,提高处理效率和质量。
6.7 应急响应机制
治理者通过建立健全的互联网不良信息治理技术实施全过程的“应急响应机制”,对突发性、严重
性不良信息事件的快速、有效处置。建立“应急响应机制”,应遵循以下要求:
a) 制定不良信息事件的应急响应程序和流程;
b) 组建应急响应团队,确定应急响应小组成员及其职责分工;
c) 制定详细的应急预案,定期演练和测试;
d) 建立应急预案响应处置机制,明确应急响应时效要求;
T/GECPA 0001-2024
6
e) 建立信息通报机制,及时向上级通报不良信息事件的情况和处理进展。
6.8 监督与保障机制
治理者通过建立互联网不良信息治理技术实施全过程的“监督与保障机制”,监督和保障互联网不
良信息治理技术实施全过程工作的开展。建立“监督与保障机制”,应遵循以下要求:
a) 制定制度保障,从制度上保证各级单位的不良信息治理工作有章可循、有据可依;
b) 明确岗位职责保障,明确各单位工作岗位的职责,治理责任落实到岗到人;
c) 建立日常监测机制,各单位定期对运营中的业务进行监测与巡检,及时发现并整改问题隐患;
d) 建立沟通汇报机制,召开定期或不定期会议交流不良信息治理情况,建立信息安全月报/季报/
年报制度,定期汇报或发布不良信息治理工作整体情况;
e) 建立人员教育与培训机制,定期开展教育与培训考核,提升从业人员素质及处理和应对能力;
f) 建立监督检查机制,各管理组织根据不良信息治理工作开展情况进行检查或抽查。
6.9 跟踪评估管理机制
治理者通过建立互联网不良信息治理技术实施全过程的“跟踪评估管理机制”,对互联网不良信息
治理技术实施全过程工作进行持续性、系统性地监测、评估和反馈,及时改进治理措施和机制。建立“跟
踪评估管理机制”,应遵循以下要求:
a) 建立完善的互联网不良信息治理评估指标体系,包括发现速度、处理效率、用户投诉率等指标,
确定评估指标的权重及评价标准,对治理效果进行量化评估;
b) 建立有效的数据监测与分析机制,对不良信息传播的趋势和规律进行监测和分析,及时发现问
题并采取针对性措施,为治理工作提供数据支持;
c) 建立风险评估与预警机制,对可能引发不良信息传播的风险进行及时评估和预警,及时发现潜
在不良信息;
d) 建立健全的考核机制,定期对相关部门、业务平台不良信息治理工作进行绩效评估,根据评估
结果进行奖惩和改进;
e) 建立健全的第三方合作监督考核机制,约定信息内容安全管理考核制度和违法违规处罚标准;
f) 定期输出不良信息治理评估报告,为不良信息治理决策提供参考依据;
g) 建立健全的内部评审机制,定期对管理体系和工作程序进行评估和审查,及时发现问题并调整
和改进工作方法和流程。
7 技术规范
7.1 技术规范要求
本条目所描述的技术规范是对互联网不良信息治理技术实施全过程中在技术层面上采用技术工具
应具备功能提出要求,其技术工具的功能应包括监测资产台账、策略资源库、拨测扫描配置、内容采集
T/GECPA 0001-2024
7
能力、信息内容预处理、不良信息识别能力、黑/白名单检测、暗链/外链检测、域名备案情况核查、自
动告警、人工审核、预警处置、自动核验、报告与分析、日志管理等功能。
7.2 监测资产台账
技术工具应具备监测资产台账管理功能,包括网站、APP、小程序、公众号、微博、视频号等信息
实体资产台账,并提供查询、新增、导入、修改、删除、启用、禁用功能:
a) 网站台账:包括网站名称、域名、IP、网站状态、归属地、责任单位、责任人等;
b) APP 台账:包括APP 名称、下载链接、归属地、责任单位、责任人等;
c) 小程序台账:包括小程序名称、归属地、责任单位、责任人等;
d) 公众号台账:包括公众号名称、公众号标识、公众号类别、归属地、责任单位、责任人等;
e) 微博台账:包括微博名称、微博标识、归属地、责任单位、责任人等;
f) 视频号台账:包括实体名称、标识、实体载体、归属地、责任单位、责任人等。
7.3 策略资源库
技术工具应具备不良信息监测策略资源库管理功能,包括分类体系、关键词库、文本样本库、图片
特征库、黑名单库、白名单库等,并符合以下要求:
a) 支持定制关键词、文本样本、图片特例、黑/白名单等不良信息检测策略;
b) 具备不良信息的关键词特征库、语义文本样本库;
c) 具备不良信息图片样例库;
d) 具备网站、APP、小程序、公众号、微博、视频号等黑/白名单库;
e) 支持对不良信息进行分类,建立分类体系;
f) 支持不良信息按风险等级进行管理;
g) 支持定期更新维护不良信息特征库;
h) 不良信息包含《互联网信息服务管理办法》第十五条中规定的九类危害信息:
——反对宪法所确定的基本原则的;
——危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一的;
——损害国家荣誉和利益的;
——煽动民族仇恨、民族歧视,破坏民族团结的;
——破坏国家宗教政策,宣扬邪教和封建迷信的;
——散布谣言,扰乱社会秩序,破坏社会稳定的;
——散布淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪的;
——侮辱或者诽谤他人,侵害他人合法权益的;
——含有法律、行政法规禁止的其他内容的。
7.4 拨测扫描配置
技术工具应具备配置拨测扫描任务功能,对指定的网站、APP、小程序、公众号、微博、视频号等
T/GECPA 0001-2024
8
进行主动扫描,检查业务信息的合法性,应支持以下策略配置要求:
a) 支持批量添加拨测任务;
b) 支持对拨测对象按风险等级、检测要求等进行分级,并针对拨测对象分级设定差异化拨测策略;
c) 支持配置拨测任务的优先级;
d) 支持场景化智能策略管理机制;
e) 扫描任务策略配置包括:业务类型、拨测对象、扫描周期、扫描范围、优先级、拨测时间、拨
测层次、采集链路数、任务有效期、任务状态等信息;
f) 支持查询、添加、修改、删除、发布、禁用扫描任务。
7.5 内容采集能力
技术工具应具备互联网信息内容自动化采集能力,对网站、APP、小程序、公众号、微博、视频号
等互联网业务内容进行采集,并符合以下要求:
a) 支持采集互联网业务中的文字、图片、音频、视频、文档、URL 等信息;
b) 支持通过网络爬虫方式对特定的域名、URL、IP 地址/地址段进行内容自动采集,具备反爬虫
功能的网站进行内容获取的能力,支持对HTTP、HTTPS 站进行爬扫;
c) 支持通过终端模拟器或终端实机运行的方式对特定的APP、小程序、公众号、视频号等进行内
容自动采集;
d) 支持按配置的探测扫描策略对互联网信息进行自动扫描采集;
e) 支持对采集数据进行清洗、去重;
f) 支持全量保存自动扫描采集数据,以备查证;
g) 提供对爬取URL 页面的快照功能。
7.6 信息内容预处理
技术工具应支持对采集获取的数据文件进行预处理,确保识别功能兼容主流文本、图片、音频、视
频格式,包括:
a) 格式转换;
b) 文件规范化;
c) 文件大小规整处理;
d) 语言处理和分词。
7.7 不良信息识别能力
技术工具应能依据安全监测策略对采集处理后的互联网信息内容中存在的不良信息进行自动化识
别,通过算法模型判断采集的文本、图片、音频、视频等内容是否为《互联网信息服务管理办法》第十
五条中规定的违法、色情、赌博、谣言、涉政、反动、暴力等不良信息,并对识别的不良信息进行分级
分类告警。
T/GECPA 0001-2024
9
7.7.1 文本识别
技术工具应支持对采集的文本内容进行自动分析与识别,检测出文本内容中含有的不良信息及类别,
并符合以下要求:
a) 支持通过关键词库,对本文信息进行关键词或关键词组进行过滤匹配,判断是否为不良信息,
输出识别结果;
b) 支持基于深度学习模型,对采集并预处理后的文本数据进行AI 语义分类识别,判断是否为不
良信息,输出识别结果;
c) 支持关键词识别及AI 语义识别模型融合,支持并行或串行处理,根据策略输出识别结果;
d) 支持对文本内容进行不良信息分类识别;
e) 支持识别的文本格式包含但不限于text、htm、html、xml、wml、jsp、php、js、asp、aspx、
txt、rtf、multipart、form-data、vnd.wap.mms-message 等主流格式。
7.7.2 图片识别
技术工具应支持对采集的图片内容进行自动分析与识别,检测出图片内容中含有的不良信息及分类,
并符合以下要求:
a) 通过AI 图片智能分类、样例库比对、特征库识别、人脸识别、OCR 识别等多种方法识别图片,
并可支持根据策略综合判定图片是否为不良信息;
b) 支持对图片内容进行不良信息分类识别;
c) 支持识别的图片格式包含但不限于jpg、jpeg、bmp、gif、png、wbmp、tiff、tif 等主流格式。
7.7.3 音频识别
技术工具应支持对采集的音频内容进行自动分析与识别,检测出音频内容中含有的不良信息及分类,
并符合以下要求:
a) 支持对采集的音频内容识别为文本,再通过对文本的智能识别,判断音频内容是否为不良信息;
b) 支持对音频内容进行不良信息分类识别;
c) 支持识别的音频格式包含但不限于CDA、WAV、AIFF、MP3、MID、WMA、RA、AMR-NB、AMR-WB、
VQF、ACC 等主流格式。
7.7.4 视频识别
技术工具应支持对采集的视频内容进行自动分析与识别,检测出视频内容中含有的不良信息,并符
合以下要求:
a) 支持对视频进行智能取帧,提取关键帧图片;
b) 将提取的关键帧图片进行图片内容识别,判断视频内容是否为不良信息;
c) 支持对视频内容进行不良信息分类识别;
d) 支持识别的视频格式包含但不限于AVI、WMV、RM、RMVB、MPEG1、MPEG2、MPEG4(MP4)、3GP、
ASF、SWF、VOB、DAT、MOV、M4V、FLV、F4V、MKV、MTS、TS 等主流格式。
T/GECPA 0001-2024
10
7.8 黑/白名单检测
技术工具应具备黑/白名单检测功能,并符合以下要求:
a) 依据黑名单库中的网站、APP、小程序、公众号、微博、视频号等业务进行检测;
b) 依据白名单库,对加入库中的网站、APP、小程序、公众号、微博、视频号等业务不做检测。
7.9 暗链/外链检测
技术工具应具备暗链/外链检测功能,对网页代码进行分析,发现网页中含有的暗链/外链地址进行
检测,及时发现存在不良信息的链接地址。
7.10 域名备案情况核查
技术工具应具备域名备案情况核查功能,主动发现存在隐患的网站进行预警处置,防止不良信息传
播,包括:
a) 未备案域名;
b) 域名过期;
c) 即将过期;
d) 备案号变更;
e) 域名IP 异常;
f) 首页备案号不一致;
g) 访问异常。
7.11 自动告警
技术工具应具备根据识别结果自动生成不良信息告警功能,并符合以下要求:
a) 支持文本、图片、音频、视频等不良信息告警;
b) 支持命中黑名单库告警;
c) 支持不良信息分级分类告警;
d) 支持对发现的违规内容的页面进行快照,支持生成违规内容链接溯源;
e) 支持告警信息查询、导出、审核功能;
f) 告警信息包括告警时间、业务名称、业务类别、告警级别、嫌疑类别、告警URL、URL 类别(内
链、外链、暗链)、网页快照、链接溯源、命中策略等。
7.12 人工审核
技术工具应具备人工审核功能,对识别的不良信息告警信息进行人工审核,进一步判断是否不良信
息,并符合以下要求:
a) 支持文本、图片、音频、视频告警人工审核功能,判断是否为不良信息;
b) 支持批量审核功能,审核项包含正常和违规;
T/GECPA 0001-2024
11
c) 支持违规告警命中关键词或关键区域高亮,标注违规内容的类别及告警级别,辅助人工审核;
d) 审核时支持查看违规内容链接、查看识别内容快照、查看违规内容链接溯源等信息;
e) 支持查看已审核记录和审核为违规的记录,支持导出审核记录;
f) 支持将人工审核后信息加入算法模型样本库中。
7.13 预警处置
技术工具应具备违规信息预警处置功能,支持自配置预警策略,对审核为违规的信息进行预警处置,
并符合以下要求:
a) 通过短信、邮件等渠道通知相关人员及时对违规信息进行处理;
b) 支持工单派发违规信息至责任单位进行处置;
c) 支持违规信息取证手工或自动截图留痕佐证;
d) 支持违规信息处置流程全流程溯源。
7.14 自动核验
技术工具应具备不良信息处置自动核验能力,自动对已处置的不良信息进行扫描核验,及时验证不
良信息是否已处置完成。
7.15 报告与分析
技术工具应支持对监测、识别、处理过程中产生的数据进行汇总统计和分析,以图表方式显示统计
分析信息,并生成数据报告,包括:不良信息的类型分布、不良信息明细、处理效果评估、趋势分析等,
为管理决策提供参考依据。
7.16 日志管理
技术工具应具备日志管理功能。
a) 应具备以下事件生成日志:
——正常网络访问日志;
——用户操作日志,包括用户登录/退出系统、查询、新增、修改、删除等操作;
——对互联网信息的采集及不良信息识别记录备份与恢复;
——监测服务中产生的异常故障报警等日志;
——其他安全事件;
——应记录每个事件发生的时间、操作业务、描述等信息。
b) 应提供日志管理功能:
——支持日志访问授权,仅授权用户可访问;
——支持日志查询、导出功能,仅授权用户运行查询/导出日志数据;
——支持日志存储时间设定功能,仅超级管理员允许设定日志存储时间;
——对日志数据进行有效地存储和管理,确保日志数据的完整性、可靠性和安全性。
T/GECPA 0001-2024
12
参考文献
[1] GBT 25069-2022 信息安全技术术语
[2] GBT 29246-2017 信息技术安全技术信息安全管理体系概述和词汇
[3] 《互联网信息服务管理办法》(国务院令第292 号)第十五条
[4] 《网络信息内容生态治理规定》(国家互联网信息办公室令第5 号)第二条
