最近和几个做AIGC创业的朋友聊天,发现一个扎心的事实:超过一半的大模型备案申请,在首轮就被监管部门“打回”了

不是材料不全,就是逻辑混乱;不是安全评估敷衍,就是算法说明写成了产品宣传稿……更惨的是,有些团队反复被打回三四次,耽误上线节奏不说,投资人信心都快磨没了。

作为深度参与过大模型备案全流程的老兵,今天我就来扒一扒那些高频被打回的原因,并给出可落地的改进建议。看完这篇,至少能帮你省下2-3周返工时间。


一、安全评估报告“形同虚设”

这是第一大雷区。很多团队以为随便找个第三方机构出个“安全检测报告”就行,结果内容空洞、方法论缺失、测试样本不足。

典型问题:

  • 只写了“未发现明显风险”,但没说明测试方法、数据集、评估指标;
  • 对生成内容的违法不良信息过滤机制描述模糊;
  • 缺少对未成年人保护、价值观引导等专项评估。

正确做法:
安全评估必须包含具体测试场景(如政治敏感、暴力色情、虚假信息等)、对抗性测试案例人工复核比例,以及应急响应机制。建议参考《生成式人工智能服务安全基本要求》中的12类风险点逐项回应。


二、算法说明写成“产品白皮书”

不少团队把算法备案材料写成了市场宣传文案:“我们的模型全球领先”“支持多轮对话”“用户体验极佳”……

监管部门要的是技术事实,不是营销话术。

典型问题:

  • 未说明模型架构(如是否基于LLaMA、ChatGLM等开源底座);
  • 训练数据来源模糊(只写“公开数据”,未分类说明);
  • 缺少关键参数(如训练步数、token量、微调方法)。

正确做法:
技术语言+结构化表格清晰说明:

  • 模型类型(基座/微调/蒸馏);
  • 训练数据构成(比例、来源、清洗规则);
  • 是否使用用户数据、如何脱敏;
  • 推理部署方式(云端/端侧/混合)。

三、训练数据“来源不明”或“版权存疑”

这是近年审查重点。如果你的训练数据包含大量爬取的中文网页、社交媒体内容、新闻稿件,却无法提供合法授权或合理使用依据,基本会被打回。

典型问题:

  • 声称“使用公开数据”,但未说明是否遵守robots协议;
  • 使用维基百科、知乎、公众号等UGC内容,未评估版权风险;
  • 未对数据进行去重、去毒、偏见清洗。

正确做法:
建立数据溯源清单,对每类数据标注:

  • 来源渠道;
  • 获取方式(API/爬虫/授权采购);
  • 合法性依据(如CC协议、合理使用条款);
  • 数据预处理流程(含过滤关键词列表)。

四、用户实名与内容审核机制“纸上谈兵”

很多团队在材料里写“我们有严格的内容审核机制”,但实际系统里连用户注册都不强制实名,更别说关键词过滤、人工复审、举报通道了。

典型问题:

  • 未实现用户实名认证(尤其面向公众的服务);
  • 审核策略只有关键词匹配,无语义理解;
  • 无7×24小时应急响应团队。

正确做法:
在材料中附上系统截图+流程图,证明:

  • 用户注册需手机号/身份证实名;
  • 部署了多层审核(AI初筛+人工复审+用户举报);
  • 有明确的违规内容处置SOP(如2小时内下架)。

五、隐私与数据安全条款“照搬模板”

直接从网上下载一份通用隐私政策贴上去?小心被打回!

典型问题:

  • 未说明用户输入数据是否用于模型再训练;
  • 未区分“必要信息”与“非必要信息”;
  • 未提供用户删除/导出数据的入口。

正确做法:
隐私政策必须与你的产品功能一一对应。例如:

  • 若支持“对话历史保存”,需说明存储期限与加密方式;
  • 若允许用户上传文件,需明确是否保留、如何销毁;
  • 提供“关闭数据收集”或“退出训练”的选项(哪怕只是形式,也得有)。

六、缺少“未成年人保护”专项设计

如果你的模型面向公众开放,且未设置青少年模式或内容分级,大概率会被要求补充。

典型问题:

  • 无年龄识别或限制机制;
  • 对涉及暴力、早恋、游戏诱导等内容无特殊过滤;
  • 未在界面显著位置提示“未成年人需监护人同意”。

正确做法:
增加未成年人保护章节,包括:

  • 默认开启“青少年模式”(限制敏感话题);
  • 对疑似未成年用户加强内容过滤;
  • 提供家长控制接口(如使用时长限制)。

七、材料逻辑混乱,前后矛盾

见过最离谱的案例:安全评估说“不收集用户数据”,隐私政策却写着“我们会记录您的对话用于优化服务”……

典型问题:

  • 不同文档说法不一致;
  • 技术描述与实际产品功能不符;
  • 联系人电话打不通,邮箱无人回复。

正确做法:
提交前务必做一次内部交叉校验

  • 让法务、技术、产品三方共同核对材料;
  • 确保所有文档口径统一;
  • 提供真实有效的对接人(最好留两个)。

八、忽略“境内服务器”与“数据不出境”要求

如果你的模型推理或训练涉及境外服务器(比如用AWS新加坡节点),又未说明数据隔离措施,基本过不了。

典型问题:

  • 混合云部署但未说明境内数据闭环;
  • 使用境外开源模型但未做本地化适配;
  • 日志或监控数据同步到海外。

正确做法:
明确声明:

  • 所有中国用户数据仅存储于境内服务器
  • 模型训练与推理全程在境内完成
  • 如使用境外技术组件,已做数据脱敏与隔离

附:自查清单(提交前必看)

  • 安全评估覆盖12类风险点
  • 训练数据来源可追溯、合法
  • 用户实名+内容审核机制已上线
  • 隐私政策与产品功能一致
  • 未成年人保护措施明确
  • 所有材料逻辑自洽、无矛盾
  • 数据存储与处理均在境内

 

Logo

网易易盾是国内领先的数字内容风控服务商,依托网易二十余年的先进技术和一线实践经验沉淀,为客户提供专业可靠的安全服务,涵盖内容安全、业务安全、应用安全、安全专家服务四大领域,全方位保障客户业务合规、稳健和安全运营。

更多推荐