c8da36103f9251f41ef62c77264e8c69.png    

    6月20日,国家互联网信息办公室发布境内深度合成服务算法备案清单,包括阿里、腾讯、百度、科大讯飞等巨头的41个算法入围,这也是国内首批公开的算法备案清单。

    在清单公布的算法包括:美团在线智能客服算法、快手短视频生成合成算法、百度文生图内容生成算法、百度PLATO大模型算法、天猫小蜜智能客服算法、菜鸟物流智能客服算法、讯飞星火认知大模型算法、腾讯云语音合成算法等。

    值得注意的是,在首批备案清单中,明确的大模型并不多,有百度、阿里、科大讯飞三家。其中百度PLATO大模型算法应用于对话生成场景,其基于飞桨深度学习框架和对话语料训练的对话模型,生成开放域的文本回答,获得“服务提供者”备案。

  阿里的达摩院交互式多能型合成算法则是应用于开放域多模态内容生成场景,服务于问答、咨询类的企业端客户,通过API提供根据用户输入生成多模态信息的功能,获得“服务技术支持者”备案。

  而科大讯飞两大入围的算法分别为输入法、讯飞星火认知大模型算法,分别获得“服务提供者”和“服务技术支持者”两类备案。

    对于此次算法备案信息公告,业内有猜测认为属于生成式AI审批政策的松动。北京理工大学法学院教授、外交部国际法咨询委员会委员洪延青否定了这一看法。他指出,算法备案属于常规动作,并不等于生成式AI产品获批落地执行。

    洪延青介绍称,根据2022年3月1日起正式施行的《互联网信息服务深度合成管理规定》,互联网平台涉及到“深度合成服务算法”,都需要履行备案和变更、注销备案手续,属于常规的监管审核动作。

    而备受外界瞩目的《生成式人工智能服务管理办法(征求意见稿)》,除了备案之外,更要求“按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》向国家网信部门申报安全评估”。 

  “显然,今天发布的算法备案清单,并不是《生成式人工智能服务管理办法》已经开始落地执行的标志。”洪延青强调指出,生成式AI产品在我国境内向公众提供服务之前,除了备案之外,还至少需要完成监管部门所规定的安全评估,否则无法上线。

   今年以来,国产AI大模型迎来百花齐放之势。从时间上来看,百度“文心一言”最早于3月16日发布。发布会后一小时内,排队申请文心一言企业版API调用服务测试的企业用户已达3万多家。

  而在4月7日,在阿里云峰会上,阿里云大语言模型“通义千问”正式推出,现阶段该模型主要定向邀请企业用户进行体验测试。另外,阿里巴巴决定未来将所有产品接入通义千问,进行全面改造。

  4月10日,商汤科技董事长兼首席执行官徐立宣布推出大模型体系商汤日日新大模型体系。随后,腾讯、网易、京东也相继公开了自家的大模型产品“混元”、“玉言”和“ChatJD”。

  而传统AI巨头科大讯飞的讯飞星火认知大模型也于5月6日面世。随后科大讯飞又在6月9日发布讯飞星火认知大模型V1.5。据科大讯飞方面透露,其文本生成能力有7%的提升,语言理解能力提升了8%,知识问答提升了24%,在逻辑推理、数学能力和代码能力上分别有了10%、9%和8%的提升。

境内深度合成服务算法备案清单(2023年6月)

序号 算法名称 角色 主体名称 应用产品 主要用途 备案编号 备注
1 大麦小蜜智能客服算法 服务提供者 北京大麦文化传媒发展有限公司 大麦(APP) 应用于在线智能客服场景,根据用户咨询内容,生成文本或语音智能回答。 网信算备110101128387701230011号
2 DraftAi绘图生成合成算法-1 服务提供者 图形起源(北京)科技有限公司 Draft(网站) 应用于图像生成场景,使用文本条件图像生成模型,生成与输入文本语义一致的图像。 网信算备110108007153201230015号
3 智谱ChatGLM生成算法 服务提供者 北京智谱华章科技有限公司 ChatGLM(网站) 应用于对话生成场景,根据用户输入的文本内容,应用对话模型,生成对话文本回复。 网信算备110108105858001230019号
4 美团电话智能客服算法 服务提供者 北京三快科技有限公司 美团(APP) 应用于电话智能客服场景,生成用户问题的语音智能回答。 网信算备110108224236601220017号
5 美团在线智能客服算法 服务提供者 北京三快科技有限公司 美团(APP) 应用于电话智能客服场景,生成用户问题的文本智能回答。 网信算备110108224236601220025号
6 快手短视频生成合成算法 服务提供者 北京快手科技有限公司 快手(APP) 应用于短视频制作场景,利用生成模型对用户上传图片、视频进行属性编辑或风格转换,生成图片、视频。 网信算备110108413760701220011号
7 百度文生图内容生成算法 服务提供者 北京百度网讯科技有限公司 文心一格(网站) 应用于图像生成场景,利用图文匹配神经网络模型和扩散生成模型,生成与输入文本语义一致的图像。 网信算备110108645502801230019号
8 百度PLATO大模型算法 服务提供者 北京百度网讯科技有限公司 小侃星球(APP) 应用于对话生成场景,基于飞桨深度学习框架和对话语料训练的对话模型,生成开放域的文本回答。 网信算备110108645502801230027号
9 剪映特效算法 服务提供者 北京抖音信息服务有限公司 西瓜视频(APP)、轻颜(APP)、剪映(APP)、抖音短视频(APP)等 应用于图像、视频生成场景,基于人像理解技术和视频剪辑技术实现对用户上传图片或视频的渲染处理与格式转换,生成编辑处理后图像或视频。 网信算备110108823483901230015号
10 火山引擎智能美化特效算法 服务技术支持者 北京抖音信息服务有限公司 -- 应用于图像生成场景,服务于图像编辑类的企业端客户,通过API提供人脸图像美颜功能。 网信算备110108823483901230023号
11 出门问问语音合成类算法-2 服务技术支持者 出门问问信息科技有限公司 -- 应用于音频生成场景,服务于音频、视频制作类的企业端客户,通过API提供文本转语音功能。 网信算备110108928160101230017号
12 淘票票小蜜智能客服算法 服务提供者 上海淘票票影视文化有限公司 淘票票(APP) 应用于在线智能客服场景,根据用户咨询内容,生成文本或语音智能回答。 网信算备310107361090201230011号
13 1688阿牛智能客服算法 服务提供者 杭州阿里巴巴广告有限公司 1688工业品(APP)、阿里巴巴(APP、网站) 应用于在线智能客服场景,根据用户咨询内容,结合智能客服知识库,生成文本、图像、音频、视频等形式的回答。 网信算备330108445385801230017号
14 天猫小蜜智能客服算法 服务提供者 浙江天猫网络有限公司 手机天猫(APP) 应用于在线智能客服场景,识别文字或语音问题,结合智能客服知识库,生成文本、图像、音频、视频等形式的回答。 网信算备330110046572901220019号
15 钉钉语音识别算法 服务提供者 钉钉科技有限公司 钉钉(APP) 应用于即时通讯场景,识别语音消息,生成识别后的文本信息。 网信算备330110391028001220019号
16 钉钉翻译算法 服务提供者 钉钉科技有限公司 钉钉(APP) 应用于即时通讯场景,实现对特定语种的翻译服务,生成翻译后文本信息。 网信算备330110391028001220027号
17 钉钉图像识别文字算法 服务提供者 钉钉科技有限公司 钉钉(APP) 应用于即时通讯场景,提取识别图片中文字,生成提取后的文本信息。 网信算备330110391028001220035号
18 钉钉智能客服算法 服务提供者 钉钉科技有限公司 钉钉(APP) 应用于在线智能客服场景,根据用户咨询内容,结合智能客服知识库,生成文本、图像、音频、视频等形式的回答。 网信算备330110391028001230039号
19 达摩院开放域自然对话合成算法 服务技术支持者 阿里巴巴达摩院(杭州)科技有限公司 -- 应用于对话生成场景,服务于智能对话类的企业端客户,利用对话意图理解、对话内容生成等技术,通过API提供对话生成功能。 网信算备330110507206401230019号
20 达摩院图像合成算法 服务技术支持者 阿里巴巴达摩院(杭州)科技有限公司 -- 应用于图像生成场景,服务于图像合成类的企业端客户,通过API提供文字信息转化为图像信息的功能。 网信算备330110507206401230027号
21 达摩院交互式多能型合成算法 服务技术支持者 阿里巴巴达摩院(杭州)科技有限公司 -- 应用于开放域多模态内容生成场景,服务于问答、咨询类的企业端客户,通过API提供根据用户输入生成多模态信息的功能。 网信算备330110507206401230035号
22 淘特小蜜智能客服算法 服务提供者 杭州拣值了电子商务有限公司 淘特(APP) 应用于智能客服场景,根据用户咨询内容,结合智能客服知识库,生成文本、图像、音频、视频等形式的回答。 网信算备330110525191901230019号
23 淘宝人生表情动作复刻算法 服务提供者 浙江淘宝网络有限公司 手机淘宝(APP) 应用于形象图片制作场景,识别照片中人物表情动作,生成淘宝人生形象图片。 网信算备330110872770701220015号
24 菜鸟物流智能客服算法 服务提供者 杭州菜鸟物流信息科技有限公司 菜鸟(APP、小程序) 应用于智能客服场景,根据用户提问分析用户诉求,生成文本智能回答。 网信算备330110977354701220013号
25 讯飞语音识别算法 服务提供者 科大讯飞股份有限公司 讯飞输入法(APP) 应用于文本生成场景,提取语音中声学特征,结合语言模型,识别短音频,生成文本信息。 网信算备340104764864601230013号
26 讯飞星火认知大模型算法 服务技术支持者 科大讯飞股份有限公司 -- 应用于开放域对话生成场景,利用文本、代码、prompt数据及用户反馈数据训练AI大模型,服务于问答、咨询类的企业端客户,通过API提供文本生成服务。 网信算备340104764864601230021号
27 美图图像深度合成类算法 服务提供者 厦门美图网科技有限公司 美图设计室(APP)、美图秀秀(APP)、美颜相机(APP)等 应用于图像生成场景,基于图像内容理解结果,实现对用户上传照片的艺术化重新生成。 网信算备350203814951001230015号
28 UC小蜜智能客服算法 服务提供者 广州市动景计算机科技有限公司 UC浏览器(APP) 应用于在线智能客服场景,利用自然语言技术定位用户需求,生成文本、图像、音频、视频等形式的回答。 网信算备440106203028801230019号
29 易次元生成合成算法 服务提供者 广州网易计算机系统有限公司 易次元(APP) 应用于对话生成场景,根据用户输入内容,应用对话模型,生成对话文本回复。 网信算备440106306769001230011号
30 酷狗音乐语音克隆算法 服务提供者 广州酷狗计算机科技有限公司 酷狗音乐(APP) 应用于音频生成场景,基于用户录音数据,提取用户音色特征,生成与用户音色一致的音频信息。 网信算备440106592132901230019号
31 酷狗音乐歌声合成算法 服务提供者 广州酷狗计算机科技有限公司 酷狗音乐(APP) 应用于音频生成场景,基于用户歌唱录音数据,提取用户音色特征,制作歌曲。 网信算备440106592132901230027号
32 音书语音识别算法 服务提供者 广州音书科技有限公司 音书(APP) 应用于语音转文字场景,识别实时录音数据,生成识别后的文本信息。 网信算备440113773328701230015号
33 秀脸FacePlay人脸融合算法 服务提供者 深圳市鹏中科技有限公司 秀脸FacePlay(APP) 应用于人脸图像、视频生成场景,将用户上传的照片与特定形象进行面部融合,生成融合后的人脸图像、视频。 网信算备440304083805101230015号
34 腾讯云人脸融合算法 服务技术支持者 深圳市腾讯计算机系统有限公司 -- 应用于人脸图像、视频生成场景,服务于图像、视频编辑类的企业端客户,通过API提供用户面部特征融合功能。 网信算备440305295988701230013号
35 腾讯会议虚拟背景算法 服务提供者 深圳市腾讯计算机系统有限公司 腾讯会议(APP) 应用于视频会议场景,利用人像分割得到像素级背景区域,实现对视频背景区域的模糊或替换,生成背景虚化或背景替换后的视频。 网信算备440305295988701230021号
36 腾讯云语音合成算法 服务技术支持者 深圳市腾讯计算机系统有限公司 -- 应用于文本转语音场景,服务于音频、视频合成类企业端客户,使用已授权的声优声纹信息,通过API提供文本转语音功能。 网信算备440305295988701230039号
37 腾讯音乐语音合成算法 服务提供者 腾讯音乐娱乐(深圳)有限公司 QQ音乐(APP)、全民K歌(APP) 应用于文本转语音场景,利用语音合成技术,将文本内容转化为有声读物。 网信算备440305544180001230019号
38 逗拍风格迁移算法 服务提供者 深圳市闪剪智能科技有限公司 逗拍(APP) 应用于视频制作场景,根据用户选择的模板,修改用户上传图片的风格,生成风格化视频。 网信算备440306133199401220023号
39 逗拍动作驱动算法 服务提供者 深圳市闪剪智能科技有限公司 逗拍(APP) 应用于人脸视频生成场景,将用户上传的照片与模板视频进行面部融合,生成与模板视频的人像表情和动作一致的人脸视频。 网信算备440306133199401230035号
40 逗拍人脸融合算法 服务提供者 深圳市闪剪智能科技有限公司 逗拍(APP) 应用于人脸图像、视频生成场景,将用户上传的照片与特定形象进行面部融合,生成融合用户面部特征的人脸图像、视频。 网信算备440306133199401230043号
41 逗拍人脸属性编辑算法 服务提供者 深圳市闪剪智能科技有限公司 逗拍(APP) 应用于人脸图像编辑场景,通过修改用户上传照片中人脸属性信息,改变照片人物的外貌特征。 网信算备440306133199401230051号

  来源:中国基金报

Logo

网易易盾是国内领先的数字内容风控服务商,依托网易二十余年的先进技术和一线实践经验沉淀,为客户提供专业可靠的安全服务,涵盖内容安全、业务安全、应用安全、安全专家服务四大领域,全方位保障客户业务合规、稳健和安全运营。

更多推荐