
(一)严禁传播这11大类违法信息:
1.反对宪法所确定的基本原则的;
2.危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一的;
3.损害国家荣誉和利益的;
4.歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉的;
5.宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动的;
6.、民族歧视,破坏民族团结的;
7.破坏国家宗教政策,宣扬邪教和封建迷信的;
8.散布谣言,扰乱经济秩序和社会秩序的;
9.散布淫秽、色情、、暴力、凶杀、恐怖或者教唆犯罪的;
10.侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益的;
11.法律、行政法规禁止的其他内容。
(二)防范抵制这8条不良信息:
1.标题党:使用夸张标题,内容与标题严重不符;
2.低俗炒作:炒作绯闻、丑闻、劣迹等;
3.灾难营销:不当评述自然灾害、重大事故;
4.软色情:带有性暗示、性挑逗,使人产生性联想;
5.血腥惊悚:展现血腥、惊悚、残忍等致人身心不适;
6.歧视内容:煽动人群歧视、地域歧视;
7.三俗内容:宣扬低俗、庸俗、媚俗;
8.未成年人风险:可能引发未成年人模仿不安全行为、诱导不良嗜好。
(二)怎么搭建?
第一步:先搞清要拦什么(法规红线)
依据《网络信息内容生态治理规定》等文件,必须拦截的12类内容:反对宪法、危害国家安全、破坏民族团结、散布谣言、色情、暴力、、毒品、教唆犯罪、侮辱诽谤、侵犯隐私、其他违法信息。
第二步:词库分级(别一刀切)
红词(绝dui禁止):匹配即阻断。如"如何制造炸药"中的核心动词+名词组合。
黄词(人工复核):如含低俗谐音的词,先拦截并转人工。
⚪ 蓝词(仅监控):新出现的变体或敏感人名,只打标不拦截,用于分析趋势。
第三步:词从哪里来(别只用开源库)
官方渠道:网信办发布的"网络低俗词"示例、各平台处罚公示中的违规词
自建数据:你产品历史日志中所有被删除/举报的内容,提取高频词
对抗生成:用变体生成器(拼音、谐音、拆字、符号插入)自动扩词
行业共享:加入安全联盟(如AFN)获取脱敏后的黑词库
第四步:技术落地(性能与准确率兼顾)
存储:使用双数组Trie树(百万级词匹配<10ms)
匹配:精que匹配 + 正则变体(如s/ha?i+sha/杀)
降误杀:关键词命中后,再用一个微型BERT模型做二次判断(关键词库负责快,语义模型负责准)
第五步:写进备案材料的"窍门"
不要只写"我们有一个关键词库",而要写:
"本公司建立了分级动态关键词库,覆盖12大类、15万条基础词条,每日通过自动化脚本(抓取违规案例+变体生成)增量更新2000+条。库中每词均标注等级与处置动作,并配合白名单机制。实测拦截率96.3%,误报率0.4%。同时配备语义模型兜底,形成三层过滤体系。"
第六步:持续运营(专家爱问的)
每周:从误报中挑出高频词加入白名单,从漏报中提取新词补入库。
应急:发现新型变体后,运营人员可在后台一键添加,5分钟内全量生效。
审计:所有词库操作(增删改)留日志,支持追溯。
避坑提醒⚠️:
❌ 别直接用GitHub上5年前的词库,会被判定"无效机制"。
❌ 别把所有词都设成"拦截",否则正常内容"学习刑法"也被拦,用户投诉。
✅ 大模型备案中,关键词库只是基础,一定要额外说明对模型输出端的约束(如用安全微调或输出正则)。
记住:备案专家不是在考验你的词库有多大,而是考验你有没有一套可持续、可证明、能对抗新风险的管理体系。核心公式:底层基础库(商业+官方)+ 语义识别模型 + 24/7 人工响应机制。
增值电信经营许可证 ICP证 EDI证 SP证 ISP证 IDC证 VPN证 国内多方通信 内容分发网络 互联网域名解析业务 互联网接入服务 106码号转让 SP公司转让 106码号 网络文化经营许可证 广播电视节目制作 代理记账 注册公司 经营性艺术品备案 呼叫中心许可证 网络食品第三方平台备案 ICP备案
投资咨询;经济贸易咨询;企业策划;组织文化艺术交流活动(不含演出及棋牌娱乐);体育运动项目经营(不含高尔夫球场及高危险性体育项目);市场调查;计算机技术培训;承办展览展示活动;会议服务;设计、制作、代理、发布广告;计算机系统服务;技术开发、咨询、交流、推广、扩散、转移。(企业依法自主选择经营项目,...
北京壹点壹线咨询有限公司(简称:壹线咨询)是一家综合型的服务代理机构,专注于互联网、增值电信、文化传媒等行业资质申请技术咨询服务,为客户提供相关业务政策法律法规、行业信息、申请流程等方面咨询。我公司始终坚持发扬“诚信、创新、沟通”为宗旨,以“质量、服务”为立业之本的团体精神,为广大客户提供最优质、最高效、最便捷的咨询服务,帮助客户在最短的时间内取得相关行业的行政许可审批,并提高对相关行业的专业政策法律法规的认知水平、风险防范能力和综合竞...