攻略I 检索过滤类算法备案怎么做?
根据《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》,在备案前,您需要自行或委托第三方进行安全评估,并形成 《安全评估报告》。:对检索出的内容进行二次处理,根据预设的规则、模型或策略,剔除掉不符合要求的内容,只保留最终呈现给用户的部分。:根据用户的查询(如关键词、图片、语音等),从庞大的数据库中快速找到所有可能相关的内容。与生成合成类算法备案相比,检索过滤类算法备案数量并不算多,这是由于
之前我们给大家介绍过需要备案的五大类算法备案的其中四类,即个性化推送类、调度决策类、排序精选类和生成合成类(含深度合成服务),感兴趣的可以通过下方文章回顾下:
今天我们给大家介绍下最后一类“检索过滤类”该怎么做算法备案?
#资质代办#算法备案#大模型备案#深度合成服务#大模型登记
01、检索过滤类
简单来说,检索过滤类算法是一类专门用于从海量信息中快速找出目标内容,并根据特定规则或标准对内容进行筛选、排除的智能技术。
我们可以把它拆解成两个核心动作来理解:
检索:根据用户的查询(如关键词、图片、语音等),从庞大的数据库中快速找到所有可能相关的内容。这解决了“从海里捞针”的问题。
过滤:对检索出的内容进行二次处理,根据预设的规则、模型或策略,剔除掉不符合要求的内容,只保留最终呈现给用户的部分。这解决了“哪些针能拿出来给人看”的问题。
📌常见的应用领域
1、内容与社交平台(这是应用最广、监管最严的领域)
社交媒体:如微博、抖音、微信朋友圈、小红书
视频/直播平台:如B站、快手、抖音
新闻资讯平台:如今日头条、腾讯新闻

检索:用户搜索话题/视频/事件、好友/博主、感兴趣的内容;
过滤:主要包含安全过滤(色情、暴力等)+质量过滤(垃圾广告、重复内容等)+个性化过滤(不感兴趣的内容)等。
2、搜索引擎
通用搜索引擎👉:如百度、搜狗、Bing
检索:根据关键词返回全网相关信息。
过滤:通常包含SEO垃圾、违法信息、版权与安全和地域过滤等。
3、电子商务平台
如淘宝、京东、拼多多
检索:搜索商品。
过滤:通常包含违禁品、侵权商品和虚假评论过滤等
4、本地生活与服务平台
如美团、大众点评、携程
检索:搜索餐厅、酒店、旅游景点。
过滤:一般涉及资质、虚假评价、不安全内容过滤。
5、企业及专业工具
邮箱系统:如网易邮箱、QQ邮箱、企业邮箱
过滤:垃圾邮件过滤是其中最经典的应用。
网盘/云存储:如百度网盘、腾讯云
过滤:识别和禁止上传、分享违规文件(如色情视频、盗版软件)。
招聘平台:如BOSS直聘、智联招聘
过滤:过滤虚假招聘、诈骗信息。

02、算法备案
数据统计
根据网信办发布的数据统计,目前共有126例检索过滤类算法备案,其中检索过滤类103个,内容过滤类23个,省份分布如下:

与生成合成类算法备案相比,检索过滤类算法备案数量并不算多,这是由于需要做备案的还需满足的要求是“具有舆论属性或社会动员能力”,故目前履行该类备案的主要是大型平台。
检索过滤类VS内容过滤类
1、检索过滤类
核心目标:从海量信息中“找到”并“排序” 用户想要的内容,同时过滤掉不相关或违规的结果;
总结📌:是 “主动索取时的智能筛选”,服务于用户的搜索行为;
类比:图书馆管理员:根据你的要求,从书库里找出相关书籍并按重要性排列给你。
2、内容过滤类
核心目标:对单一或一批内容进行“安检”,判断其是否合规,防止违规内容被发布或传播;
总结📌:是 “被动发布时的安全闸门”,服务于平台的审核职责;
类比:安检员:对你携带的行李进行扫描,判断是否有违禁品,决定能否放行。
信息填报
1、主体信息:公司的基本信息,如名称、统一社会信用代码、证照等。
2、算法信息:这是关键中的关键。对于“检索过滤类算法”,您需要详细说明:
➢ 算法名称:内部使用的技术名称。
➢ 算法类型:选择所属类别,检索过滤类通常可能涉及:
-
检索过滤类:如果主要用于内容安全过滤,应选择此分类。
-
排序精选类:如果算法还对检索结果进行排序和优先级展示。
-
生成合成类:如果还涉及AIGC内容(如AI生成摘要),则可能需要额外勾选此项。
-
个性化推送类:如果检索结果是基于用户画像进行个性化推荐的。
注意事项:
需仔细分析算法核心功能:是纯粹的内容安全过滤?还是兼具排序、个性化推荐功能?如涉及多个算法技术的还需分别备案。
举例🔎:优酷多种算法备案

➢ 算法基本原理:用非技术语言描述算法的工作机制、目标和实现方式。
➢ 算法数据:说明算法运行所依赖的数据来源、类型、规模、标注规则,以及数据安全与个人隐私保护措施。
➢ 算法模型:描述所使用的核心模型、策略和特征。
3、产品信息:应用该算法的具体产品(如APP、网站、小程序)的名称、服务形式、主要功能、访问地址等。
4、安全评估报告⭐:根据《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》,在备案前,您需要自行或委托第三方进行安全评估,并形成 《安全评估报告》 。报告需涵盖:
-
算法对国家安全、社会公共利益、公民权益的影响分析;
-
风险点(如误过滤合法内容、漏过滤违法信息、偏见歧视风险);
-
应对措施(如人工审核机制、用户反馈通道、动态更新规则库);
-
数据安全措施(加密存储、访问控制、漏洞防护)。
备案流程
1️⃣主体备案:难点为《主体报告》,一般审核周期为7个工作日,通过后进入算法部分;
2️⃣算法备案:难点为《安全评估报告》,一般审核周期为15个工作日,部分会被抽查(电话或现场核查);
3️⃣备案公示:网信办一般每两个月统一公示最近一批次通过算法备案的案例,公示后备案系统可查;
4️⃣编号悬挂:备案通过后第一时间将备案号悬挂至产品首页显著位置并超链接至备案系统页面,方便访客查询。
具体可参考本篇(点击阅读):

严正声明:
文章版权归©通晓集团所有,如需转载请联系客服人员
未经允许禁止搬运、引用、抄袭等
否则将视为侵权,我司依法保留追究权
网易易盾是国内领先的数字内容风控服务商,依托网易二十余年的先进技术和一线实践经验沉淀,为客户提供专业可靠的安全服务,涵盖内容安全、业务安全、应用安全、安全专家服务四大领域,全方位保障客户业务合规、稳健和安全运营。
更多推荐


所有评论(0)