《生成式人工智能服务管理暂行办法》公布，知道创宇积极响应

yyds 2023-07-14 10:08:59  51291

分类专栏：资讯

近几年，生成式人工智能（AIGC）技术快速发展，为经济社会发展带来新机遇的同时，也产生了传播虚假信息、侵害个人信息权益、数据安全和偏见歧视等问题，如何统筹生成式人工智能发展和安全引起各方关注。

今日（2023年7月13日），国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局公布《生成式人工智能服务管理暂行办法》（下称《办法》），自2023年8月15日起施行。这是国内首个AIGC新规，是国家对人工智能技术发展引导和规范的体现。

《办法》中指出，国家明确支持AIGC的健康发展和商业应用，前提必须是合法合规，且有13条规定都明确指向了生成式人工智能服务提供者（下称AIGC提供商）。

《办法》第二十二条对生成式人工智能技术和生成式人工智能服务提供者的定义：

- 生成式人工智能技术，是指具有文本、图片、音频、视频等内容生成能力的模型及相关技术；

- 生成式人工智能服务提供者，是指利用生成式人工智能技术提供生成式人工智能服务（包括通过提供可编程接口等方式提供生成式人工智能服务）的组织、个人。

《办法》明确，对于AIGC提供者，违反本办法规定的，将依照行政法规的规定，予以处罚；法律、行政法规没有规定的，由有关主管部门依据职责予以警告、通报批评，责令限期改正；拒不改正或者情节严重的，责令暂停提供相关服务；构成违反治安管理行为的，依法给予治安管理处罚；构成犯罪的，依法追究刑事责任。

《办法》第四条明确了提供和使用生成式人工智能服务应当遵守的规定：

- 明确提供和使用生成式人工智能服务应当坚持社会主义核心价值观，不得生成煽动颠覆国家政权、推翻社会主义制度，危害国家安全和利益、损害国家形象，煽动分裂国家、破坏国家统一和社会稳定，宣扬恐怖主义、极端主义，宣扬民族仇恨、民族歧视，暴力、淫秽色情，以及虚假有害信息等法律、行政法规禁止的内容；

- 在算法设计、训练数据选择、模型生成和优化、提供服务等过程中，采取有效措施防止产生民族、信仰、国别、地域、性别、年龄、职业、健康等歧视；

- 尊重知识产权、商业道德，保守商业秘密，不得利用算法、数据、平台等优势，实施垄断和不正当竞争行为；

- 尊重他人合法权益，不得危害他人身心健康，不得侵害他人肖像权、名誉权、荣誉权、隐私权和个人信息权益；

- 基于服务类型特点，采取有效措施，提升生成式人工智能服务的透明度，提高生成内容的准确性和可靠性。

关于以上5条《办法》规定，条条与内容合规息息相关。知道创宇在《办法》的征求意见稿阶段，从AIGC提供商内容风控角度出发，结合国家政策与丰富的业务风控经验，推出ScanA AIGC版。

基于AIGC内容合规解决方案，ScanA AIGC版已实现覆盖模型训练阶段、对外开放阶段、内容生成阶段、模型优化阶段的全流程解决方案。从输入内容安全到生成内容安全，有效识别实时内容信息中存在的风险问题，最大程度降低风险，避免给AIGC提供商带来巨大损失。

【方案1】AIGC 训练标注服务

充分发挥人审专家优势，为各大厂商提供专业的、高质量的RLHF（Reinforcement Learning Human Feedback）服务，助力客户厂商的GPT类模型训练。

【方案2】AIGC模型安全评估

通过对大模型的安全性、性能等进行合规评测、评估，协助建立健全AIGC相关的安全管理制度。

【方案3】AIGC智能审核定制

使用 Instruction GPT 类模型强大的指令执行特性，极速指定审核模版，分钟级上线定制化的机审能力。

【方案4】AIGC 合规基线评测

提供内容安全领域专业的测试人员对AIGC基线开展测试和评估，最终评测结果将为人工智能系统的开发和应用提供参考和指导。

知道创宇AIGC内容合规解决方案

实践说明及部分案例

STEP 1：模型训练阶段

《办法》第七条明确，生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动，使用具有合法来源的数据和基础模型；采取有效措施提高训练数据质量，增强训练数据的真实性、准确性、客观性、多样性。

ScanA AIGC数据标注服务，可对模型训练语料库提供人工标注服务。

模型训练语料库基本决定AIGC生成内容的价值观。数据标注是AI数据训练流程中至关重要的一步，合规的数据源可解决数据训练中90%的问题。

制定清晰、具体、可操作的标注规则，保证数据合规性；对数据标注质量评估，抽样核验标注内容的准确性；对标注人员进行培训，提升遵法守法意识，监督指导标注人员规范开展标注工作；数据训练过程中，不存在侵犯个人隐私及违法违规行为。

STEP 2：对外开放阶段

《办法》第十七条提供具有舆论属性或者社会动员能力的生成式人工智能服务的，应当按照国家有关规定开展安全评估，并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。

ScanA AIGC模型安全评估，可按照《办法要求》对模型的技术安全进行评估，提供技术检测，问题记录、整改建议。评估方向包括：

STEP 3：内容生成阶段

用户认证

《办法》第十四条指出，提供者发现使用者利用生成式人工智能服务从事违法活动的，应当依法依约采取警示、限制功能、暂停或者终止向其提供服务等处置措施，保存有关记录，并向有关主管部门报告。

按照《中华人民共和国网络安全法》规定，提供生成式人工智能服务应当要求用户提供真实身份信息。在用户信息认证能力方面，知道创宇提供多种身份验证方式，灵活组合；创新算法能力+征信大数据，减少恶意注册的安全风险。

用户输入引导+输出内容安全检测

为了遵守法律法规和体现社会主义核心价值观，对于实时交互的prompt指令内容审核和利用AI生成内容，需要加强敏感内容审核，例如涉政、涉黄、涉暴等内容，以确保信息的安全和合规性。

为了解决这个问题，知道创宇提供了针对AIGC+UGC场景下的智能机器审核定制能力，可根据业务场景配置审核策略，选择适当的松紧程度来满足不同场景的合规要求，兼顾用户使用体验和内容安全合规性。

某AI对话和绘画平台在ScanA AIGC版内容安全检测的案例实践：

生成内容标示

可提供生成内容时，附以隐形水印，并在传播过程中，对隐形水印进行检测。

《办法》第十二条提供者应当按照《互联网信息服务深度合成管理规定》对图片、视频等生成内容进行标识。

STEP 4：模型优化阶段

不符合《办法》的生成内容，AIGC提供商应在规定整改时间内，通过模型训练等方式防止再次发生。

新技术发展和监管合规是相辅相成的关系。《办法》的出台，旨在促进生成式人工智能健康发展和规范应用，维护国家安全和社会公共利益，保护公民、法人和其他组织的合法权益。

知道创宇十年如一日，投入我国良好内容生态环境的维护工作中，持续为腾讯、京东、金山文档、知识星球等内容型平台提供内容风控服务，致力让每位合作伙伴获得安全、合规的互联网在线体验，同时不断改进和创新。

在未来，作为网信单位，知道创宇将帮助AIGC平台合规发展，为新行业的可持续发展持续做贡献。

网站声明：如果转载，请联系本站管理员。否则一切后果自行承担。

本文链接：https://www.xckfsq.com/news/show.html?id=26341

赞同 0

评论 0 条

《生成式人工智能服务管理暂行办法》公布，知道创宇积极响应

相关文章

关注我们