《中国金融》|姚前:ChatGPT类大模型训练数据的托管与治理
作者|姚前「中国证监会科技监管局局长」
(资料图)
文章|本文将刊登于《中国金融》2023年第6期
ChatGPT是美国人工智能研究实验室OpenAI于2022年11月30日推出的一种人工智能应用工具。它能够通过学习人类的知识来进行交流,所以也被称为“聊天机器人”。ChatGPT甫一问世便在人工智能应用领域掀起了一阵新的浪潮并引起了全球轰动,仅仅两个月内其注册用户就突破1亿。ChatGPT既好玩又实用,远超之前的自然语言处理应用,许多人认为这是一个划时代的产品,国际上主流商业公司、学术机构乃至政府部门都开始高度重视和全面拥抱大语言模型(Large Language Models,LLM,下文简称大模型)应用。ChatGPT的主要魅力在于,它利用从互联网获取的海量训练数据开展深度学习和强化学习,可以给用户带来全新的“人机对话”体验。海量训练数据可谓是维系ChatGPT进化的核心要素之一。有研究预测,按照目前的发展速度,到2026年ChatGPT类大模型的训练将耗尽互联网上的可用文本数据,届时将没有新的训练数据可供使用。因此,算力瓶颈之外,训练数据将成为大模型产业化的最大掣肘之一。从更深层次考虑,大模型在训练数据方面还存在各种治理问题,比如数据采集标注费时费力成本高、数据质量较难保障、数据多样化不足难以覆盖长尾和边缘案例、特定数据在获取与使用分享等方面存在隐私保护、数据偏见等问题。由此可见,人工智能产业的高质量发展离不开高质量的训练数据,训练数据的安全合规使用是大模型人工智能长期健康发展的基础。本文将以ChatGPT为例,探讨大模型训练数据的来源以及未来使用合成数据(Synthetic Data)的发展趋势,分析大模型训练数据的合规风险以及监管介入的必要性,最后提出利用数据托管机制探索有效的大模型训练数据监管体系。
ChatGPT训练数据来源与处理流程
OpenAI虽没有直接公开ChatGPT的相关训练数据来源和细节,但可以从近些年业界公布过的其他大模型(如DeepMind发布的2800亿参数大模型Gopher)的训练数据推测出ChatGPT的训练数据来源。笔者整理了2018~2022年从GPT-1到Gopher的大模型的数据集(见表1)。
总的来看,大模型的训练数据主要来自于维基百科(Wikipedia)、书籍(Books)、期刊(Journals)、Reddit社交新闻站点、Common Crawl和其他数据集。
数据的质量对于大模型的训练至关重要。在模型训练之前,通常依赖专业数据团队对数据集进行预处理。这些预处理操作通常包括:去重,即去除重复的文本数据,一般以句子为单位;文本正则化或标准化,如全角字符转半角字符,繁体中文转简体中文等;文本清洗,即剔除超文本标记语言(html)或者表情符号(emoji)等非文本内容,并对标点符号进行过滤和统一;分词,即将句子拆分成单个的词;词的清洗,如去除停用词等;词的正则化或标准化,如统一数字的写法等。经过以上预处理流程,通常可以得到质量相对较高的文本数据,防止数据中的噪声对模型的训练产生不良影响,有助于后续模型的高效训练。
除了上述常规操作之外,在一些特定的处理任务中,数据团队有可能还会根据不同目的对模型训练数据进行过滤。比如,若要构建一个金融领域的知识系统,那么最好把大模型训练数据中与金融领域相关的数据筛选出来,这样可以提升模型生成的文本与金融领域的匹配程度,使模型的输出看起来“更专业”。
合成数据将成为大模型训练数据的新来源
当前,大模型的训练严重依赖现有的互联网公开文本数据。如果下一代大模型的参数达到万亿级别以上的话,数据短缺的问题将成为训练瓶颈。对此,合成数据将是一种有效的解决方案。
合成数据是计算机模拟技术或算法创建生成的自标注信息,能够在数学上或统计学上反映原始数据的属性,因此可以作为原始数据的替代品来训练、测试、验证大模型。合成数据可分为三类:表格数据和结构化数据;图像、视频、语音等媒体数据;文本数据。在大模型的训练开发上,合成数据相比原始数据,可以发挥同样甚至更好的作用,实现更廉价、更高效的大模型训练、测试和验证数据供给。ChatGPT类面向终端用户的应用只是大模型落地的开始,而产业互联网领域的应用空间更为广阔,合成数据可以解决ChatGPT类大模型的潜在数据瓶颈,推动科研和产业的进一步发展。
合成数据可以精确地复制原始数据集的统计特征,但又与原始数据不存在任何关联,所以实际应用过程中的效果强于传统的脱敏数据,便于在更大范围内分享和使用。合成数据创造的新样本具有原始数据的性质,甚至可以通过深度学习算法合成原始数据中没有的罕见样本。合成数据的产业价值主要体现在以下几个方面:实现数据增强和数据模拟,解决数据匮乏、数据质量等问题;有效解决数据隐私保护和数据安全问题,这对于金融、医疗等领域尤为重要;确保数据多样性,纠正历史数据中的偏见,消除算法歧视;应对罕见案例,创建现实中难以采集的数据场景,确保大模型输出结果的准确性。
全球IT研究与咨询机构Gartner预测,到2024年用于训练大模型的数据中有60%将是合成数据,到2030年大模型使用的绝大部分数据将由人工智能合成。《麻省理工科技评论》(MIT Technology Review)将大模型合成数据列为2022年十大突破性技术之一,称其有望解决人工智能领域的“数据鸿沟”问题。可以预见,合成数据作为数据要素市场的新增量,在具备产业价值的同时,也可以解决人工智能和数字经济的数据供给问题。
目前,合成数据应用正迅速向金融、医疗、零售、工业等诸多产业领域拓展。在金融行业,金融机构可以在不提供敏感的历史交易信息前提下,通过合成数据集训练量化交易模型提升获利能力,也可以用来训练客服机器人以改善服务体验;在生物医药行业,可以通过合成数据集,在不提供患者隐私信息的条件下训练相关模型完成药物研发工作;在自动驾驶领域,可以通过合成数据集模拟各种驾驶场景,在保障人员和设备安全的条件下提升自动驾驶能力。
大模型训练数据的合规风险及监管必要性
从目前的情况看,ChatGPT类大模型输出侧的结果数据在自然科学领域的应用相对可控,但在社会科学领域的应用尚存在诸多不确定性。尤其值得注意的是,大模型过度依赖训练数据,因此在数据输入层面可能会存在恶意操纵的风险,包括有毒输入、偏见、意识形态攻击、舆论操控、虚假信息、隐私泄露等。例如,有研究者指出,如果向大模型GPT-2输入“北京市朝阳区”, GPT-2会自动补充包含这些信息的特定人员的全名、电话号码、电子邮件和实际地址等个人身份信息,因为这些信息已经包含在GPT-2的训练数据中。这无疑会对个人隐私保护产生不利影响。还有研究人员称,ChatGPT经常在答案中重复和放大性别歧视及种族偏见,这是因为它的训练文本是从互联网中截取出的,而这些文本往往包含种族主义和性别歧视的语言,基于这种文本的概率分布训练出的大模型会被同样的偏见所“感染”。此外,研究人员还发现,这类大模型在训练过程中还善于编造信息,包括杜撰历史日期和科学规律,而且很容易掩人耳目。以上这些风险都会对大模型最终的输出结果造成不良影响,有的甚至可能对社会经济造成巨大冲击,因此需要监管部门对大模型训练数据的来源进行必要的管控,保证大模型的输出结果符合公序良俗和法律法规要求,进而推动人工智能行业健康有序发展。
特别需要指出的是,大模型输入侧的训练数据来源如果不是互联网公开文本数据,通常需要数据主体的授权,否则会产生数据隐私保护和数据合规方面的问题。如前述所言,随着可用于训练的互联网公开数据被逐步“耗尽”,发展大模型产业急需增加合成数据的产能,而合成数据和互联网公开文本数据最大的区别是前者存在数据加工处理方。因此,对数据处理方的有效监管和对合成数据的有效治理以及数据权益分配就成为发展大模型产业的重中之重。
利用数据托管机制构建大模型训练数据监管体系
通常来说,数据活动相关方主要有六类——数据主体、数据处理者、数据使用者、监管机构、国家政府部门以及国际组织。数据主体产生原始数据;数据处理者采集和控制原始数据,并加工形成数据产品和服务;数据使用者从数据处理者获取数据产品和服务,用于商业目的;监管机构按职责对行业进行监管,比如反洗钱、反垄断等;国家层面对数据进行立法,并对数据跨境流动等进行管控;国际组织推动全球范围内的数据标准和规范。这一生态存在的突出问题是,传统的数据处理者过于强势,它们会利用技术优势和场景优势垄断数据输入和输出,无法保证数据权益分配过程中的公平性,对于监管机构来说也是一个黑盒子。
为了扭转上述困局,可以在数据活动中引入数据托管机构,将数据的存储、使用、管理职责相分离,由专业的数据托管机构承担数据存储,监督数据处理者的数据使用和服务,并收取和分配数据权益。数据权益主要分两块:一块是分配给数据主体的原始数据权益;另一块是分配给数据处理者的增值数据权益。数据托管还可以支持监管机构、国家有权部门开展数据流动监管、执法取证、数字税征收等方面工作。
为促进大模型训练数据的合规使用和高质量输出,需要加强对大模型训练数据的源头管控,特别是在国家层面对大模型训练数据进行规范,而数据托管机制恰好可以成为大模型训练数据监管的有力抓手。
可以考虑对大模型训练数据尤其是合成数据建立托管机制。监管机构则通过对训练数据托管方的约束,进一步规范大模型训练数据生产方和使用方的行为。数据托管方可按规定对大模型训练数据来源、数据处理方的处理结果以及数据使用方的数据流向和训练结果进行监测,确保大模型训练数据来源可靠,在数据标准、数据质量、数据安全、隐私保护等方面依法合规,以保障大模型输出结果的高质量并符合监管要求。
大模型产业发展与合规监管思路
数字经济高质量发展的关键是数据,抓住高质量数据这一“牛鼻子”,就能有效应对以数据为核心的科技创新和产业变革。当前AIGC(AI Generated Content,人工智能自动生成内容)和ChatGPT充分展现了高质量训练数据在产业价值创造中叠加倍增作用,大模型训练数据及其输出结果将会是未来社会和生产中的一种重要的数据资产,其有序流转并合规使用也是发展数字经济的应有之义。通过合理的机制理顺市场中各参与方的数据权益关系和分配格局,并加强训练数据的依法合规监管,是促进大模型人工智能产业健康发展的关键。为此,笔者拟提出以下政策建议。
一是重点发展基于AIGC技术的合成数据产业。以更高效率、更低成本、更高质量为数据要素市场“增量扩容”,助力打造面向人工智能未来发展的数据优势。在强化数据要素优质供给方面,应统筹兼顾自立自强和对外开放。可考虑对Wikipedia、Reddit等特定数据源建立过滤后的境内镜像站点,供国内数据处理者使用。
二是构建大模型训练数据的监管体系。国家相关部门应对大模型训练数据的处理和使用标准进行统一规范;建立数据托管机制,对数据托管方进行约束,要求数据托管方按照监管机构的规定对数据来源、处理结果以及使用去向等进行监测,从而使得模型的输入、输出结果符合监管要求。
三是探索基于可信机构或基于可信技术的数据托管方式。数据托管机构可以由相关机构组建数据托管行业联盟,以共建共享的方式建设;亦可利用区块链技术,基于联盟链或有管理的公链,完善源端数据治理机制,实现数据的链上托管、确权、交易、流转与权益分配。
(责任编辑 张林)
标签: ChatGPT
相关阅读
-
努比亚Z50 Ultra系统有亮点:更小系统固件 仅保留8个基础应用
【TechWeb】去年底,努比亚带来了新一代影像性能旗舰手机努比亚Z50。作为努比亚下一轮十年的开篇之作,...
2023-03-07 -
iPhone 14今夜就变黄?消息称苹果将在3月8日推出新品
【TechWeb】3月7日消息,据外媒报道,周末开始就有消息称,连续多年在春季推出新配色iPhone的苹果,在今...
2023-03-07 -
焦点讯息:代表委员这一天丨张进:努力突破“卡脖子”技术 做好中国自己的机器人
现代快报网是由凤凰出版传媒集团旗下的现代快报倾力打造的江苏新闻门户网站,目前在南京、苏州、无锡、常...
2023-03-07 -
-
斗罗大陆魂师对决30000钻石在哪领?斗罗大陆魂师对决金币怎么获得?
斗罗大陆魂师对决30000钻石在哪领?首先玩家需要点击打开游戏,进入到游戏界面中,选择并点击魂师,接着...
2023-03-07 -
环球聚焦:游戏股集体走低 1月中国游戏市场实际销售收入同比下降16.89%
游戏股今日集体走走滴,截至发稿,IGG(00799)跌14 83%,报2 47港元;中手游(00302)跌6 36%,报2 06...
2023-03-07 -
-
从小院到胡同再到一条街,《情满九道弯》导演刘家成表示——拍好京味剧要抓住北京人的魂
原标题:从小院到胡同再到一条街,《情满九道弯》导演刘家成表示——(引题)拍好京味剧要抓住北京人的...
2023-03-07
精彩推荐
阅读排行
相关词
- 闲置杂草公司官网在哪下载 最新官方下载安装地址
- 管道情侣好玩吗 管道情侣玩法简介-当前信息
- 世界微资讯!听见,争春夺秒的中国!
- 铁球抡城市好玩吗 铁球抡城市玩法简介_当前短讯
- 瓷砖玩具比赛什么时候出 公测上线时间预告
- 当前热文:遗忘碑谷好玩吗 遗忘碑谷玩法简介
- 蛟龙出海 踏波逐浪:延边支队圆满完成赴海南三亚参加潜水救援技术培训工作
- 环球即时:宝宝拼图益智什么时候出 公测上线时间预告
- 世界观热点:英勇俯冲好玩吗 英勇俯冲玩法简介
- 海南在成都举办的这场校招活动,现场太火爆
- 找茬侦探家全关卡图文攻略大全 新要闻
- 看见你的声音|焦点热议
- 每日快看:《守望先锋2》推出源氏与一拳超人联动皮肤
- 《卧龙:苍天陨落》发布PS5次世代沉浸版预告片 环球资讯
- 《末日求生》全新DLC“新生” 3月16日发售
- 赛尔计划联结测试资格格怎么获得 环球热讯
- 哈利波特魔法觉醒恋曲重奏活动玩法详情分享
- 英伟达新驱动程序出现漏洞 导致在退出游戏后出现高CPU使用率
- 环球动态:《我的世界》基岩版世界编辑模式泄露 正在开发中
- 全面注册制加快落实落地|全球今日报
- 焦点速读:牢记嘱托 感恩奋进 | 以奋斗之姿奔赴蓬勃春天 总书记在江苏代表团的重要讲话引发广大青年热烈反响
- 《漫威SNAP》收入达5千万美元 下载量达1800万
- 找茬侦探家失踪的藏宝图通关攻略
- 守护女性司机安全,南京多方共筑平安客运防线 天天亮点
- 艾尔登法环展翼大角如何获得?艾尔登法环展翼镰刀属性如何?
- 《守望先锋2》推出源氏与一拳超人联动皮肤 当前视点
- 世界快报:1月全球动力电池装车量33吉瓦时,中国电池企业份额占比近六成
- 小小蚁国如何浇水?小小蚁国平民最强阵容如何搭配?
- 史莱姆牧场蜂蜜史莱姆在哪里?史莱姆牧场六角蜂巢怎么获得?
- 重塑出行数字生态圈 云梦智能助力ETC“全链条”服务 世界快播
- 新华网评:他们,连起了“万家灯火”|每日头条
- 每日热讯!富瑞:维持周大福(01929.HK)“买入”评级 目标价18港元
- 航拍大片《江山多娇》,每一帧都是中国画!-环球头条
- 汇聚发展的信心和力量
- 暗黑地牢新手如何开局?暗黑地牢释放压力要多久?
- 瓷砖玩具比赛官网在哪下载 最新官方下载安装地址 全球头条
- 小兵爱射击什么时候出 公测上线时间预告
- “粉丝留言,托我给两会捎句话”-即时
- 刀片与气球什么时候出 公测上线时间预告
- 财通证券:海外出口持续向好 重卡销量有望逐季度好转
- CINNO:2023 年 1 月中国新能源行业投资额达 7778 亿元,风电光伏占比约 40.7%
- P社公布全新回合制策略游戏《燃灯者联盟》
- 基金累计净值越高越好吗?基金净值高低说明什么问题?
- 每日观察!P社面向各平台公布《城市:天际线2》 年内发行
- 两会同期声|积极应对人口老龄化 提升老年人养老品质
- 彰显韧劲 提振信心 中国经济复苏“进度条”正在加速 当前热门
- 股票账户资金冻结是怎么回事?法院会冻结股票账户吗?
- iPhone 14今夜就变黄?消息称苹果将在3月8日推出新品
- 【播资讯】视网膜屏是什么意思(视网膜屏幕的两个要素)
- 当前讯息:局域网聊天工具哪个好(局域网即时通讯软件排名)
- 加入世贸组织对中国的影响(起伏跌宕的谈判进程) _世界最资讯
- 【全球报资讯】谷歌账号注册网址(免费google账号注册流程)相关内容了解
- 股市注册制中一签是多少股?股市注册制有什么规则?
- bigboss源地址是什么(讲解最新bigboss源地址)
- 环球快资讯丨各地区发展劲头足 务实举措为全国目标实现创造条件
- 华为nova3i上市时间和价格,华为nova3i六大买点介绍
- 妖股是好是坏?妖股有什么特点 妖股可以买入吗?
- 碳钢管是什么材质,碳钢管的用途介绍
- 环球热资讯!DGG为何受到年轻人追捧? 年轻生活感的品牌理念
- 汉化软件工具哪个好用(电脑软件汉化工具使用方法介绍) -当前热闻
- 今日精选:声卡调节技巧,史上最全声卡调节教程 详细步骤如下
- 世界观速讯丨dnf国庆所有光环大全(dnf全职业pk光环展示)
- 环球关注:匈牙利外长:武器与制裁无法实现和平
- 世界快资讯丨舒肤佳沐浴露哪款最好(舒肤佳沐浴露推荐)
- 努比亚Z50 Ultra系统有亮点:更小系统固件 仅保留8个基础应用
- 论文的摘要是什么意思,如何写论文摘要 要闻
- 爱奇艺视频怎么下载到本地(VIP视频解析下载分享) -当前热讯
- 世界观点:唐鹤德晒照缅怀张国荣(张国荣逝世18周年)
- 快报:手机助手安卓版哪个最好(豌豆荚四个受欢迎的原因)
- 【快播报】【青春激昂新时代】王亚平:做航天梦想的“播种人”
- 【新要闻】工程计价软件有哪几种(工程造价定额查询软件推荐:广联达)
- 环球讯息:我从基层来丨全国人大代表赵琢萍:端牢能源饭碗 为国家“加油争气”
- 房贷提前还款日期是房贷扣款日吗?房贷提前还当月还扣款吗?
- 信念是什么意思,浅谈信念对一个人的重要性 相关内容分享
- 《吕布重生模拟器》怎么快速刷满红颜好感-当前消息
- 焦点速递!2月份万宁、琼海等城市楼盘销售业绩出炉,住宅&商办成交备案量攀升!
- 中兴u880刷机教程 详细教学教给你|每日精选
- 世界焦点!mp236打印机驱动安装教程(可以通过以下方式进行安装)
- 苹果手机iphone4s怎么激活 iphone4s激活教程讲解 天天速读
- 世界今亮点!贪吃蛇幸存者什么时候出 公测上线时间预告
- 世界新动态:单电数码相机是什么 文章为你带来详细介绍
- 中银证券:石英供给紧张下硅片价格反弹 看好人造石英投资机会
- 富贵火锅店官网在哪下载 最新官方下载安装地址
- 全球快看点丨空中老司机官网在哪下载 最新官方下载安装地址
- 当前热讯:qq钻皇是什么 一文清楚了解
- 世界今热点:液晶与等离子的区别是什么_液晶与等离子的区别详解
- 惠普平板电脑哪款好 最受欢迎惠普平板电脑前三甲
- MSN是什么 软件资料简介_天天即时
- 索爱X8怎么刷机 XP与WIN7系统建立JAVA环境变量的方法
- 笔记本键盘按键错乱怎么办 下文带你给解决方法
- 当前速递!卡西欧tr100怎么用 卡西欧tr100动作拍摄教程
- 华为P6 USB调试在哪 如何打开USB调试
- 疯狂猜歌歌手英文名5个字母有什么|每日消息
- 热门看点:苹果iphone5怎么剪卡 (使用砂纸来将SIM卡磨薄)
- win7 ultimate是什么版本 以下是详细介绍
- 京东怎么退货?京东退换货服务说明
- P社面向各平台公布《城市:天际线2》 年内发行 世界热闻
- 全球热点!手机如何锁屏 手机怎么解除锁屏
- 《2042》惊现《镜之边缘》彩蛋:新地图藏有女主跑鞋
- 全球即时:淘宝信誉等级表 买家淘宝信誉等级表查询
- 疯狂驾驶挑战官网在哪下载 最新官方下载安装地址
- 全球速看:vivo X5Max什么配置参数?vivo X5Max标配有什么?
- vob文件怎么打开 vob文件怎么打开且合并?
- 手机流量怎么查询 试试下面这下方法吧
- i5处理器2320怎么样 i5处理器2320功能测试|环球精选
- 环球快报:苹果手机无法连接到app store怎么办 解决方法介绍给你
- 双卡双模双通是什么意思?双卡双模双通手机推荐|世界热头条
- 每日速读!智能3d电视机什么牌子好 智能3d电视机品牌排行版(索尼)
- 【世界新要闻】无线点菜机怎么用 无线点菜机使用方法介绍
- 为何会被称为蓝光光盘 蓝光光盘容量是多少 小编为你详细解答
- 【当前热闻】电脑主板报警怎么办 主板报警的含义
- 快看点丨笔记本哪个质量好 笔记本电脑推荐
- 流处理器是什么 流处理器的诞生_全球热头条
- iwatch苹果手表有什么功能 Apple Watch内置应用一览
- 焦点信息:苹果笔记本系统 苹果笔记本系统好用吗
- 世界今亮点!什么是散热硅胶 如何正确涂抹CPU的散热硅胶
- 中信建投:随着国产、进口游戏版号恢复发放 游戏行业景气度有望逐步回升
- 对联什么时候贴最好 贴对联有什么讲究?_全球快看
- 电源什么牌子好 相关内容为你介绍
- 红米note5A有哪些版本_红米Note5A高配版介绍
- 谢娜与刘烨分手原因 谢娜刘烨相恋多少年_环球热门
- 新大话西游3平民职业推荐 文章带来详细讲解
- 每日热议!《宝可梦:朱/紫》1.2更新后部分玩家存档被删除
- 《博德之门3》数字豪华版内容 抢先体验版能免费升级
- 吉利帝豪EC7怎么样 优缺点介绍,感兴趣的别错过了
- 游戏卡是什么原因导致 游戏卡原因介绍 全球讯息
- 国防教育内容资料 你觉得如何呢
- 头条焦点:香山红叶什么时间最红 一起来了解下吧
- 最新笔记本电脑cpu排名情况 笔记本电脑cpu排名介绍_精彩看点
- Arkane确认所有版本《红霞岛》支持跨平台联机 环球报道
- 天天关注:《霍格沃茨之遗》PS4/Xbox One版 将延期跳票到5月
- 邓萃雯演的电视剧有哪些 相关电视剧盘点 精彩看点
- 如何赚到第一桶金 小编为你带来相关知识
- qsv文件怎么打开?qsv是什么格式? 今日热闻
- 世界热点!lol雷霆咆哮上单出装 一起来看看吧
- 当前资讯!绕线器怎么用 还不会的进来学习
- 环球观焦点:中国有哪四大砚台 不了解的别错过本文
- 工商银行大额存单多少钱起步?大额存单要注意些什么?
- dnf分解师快速升级 详细步骤分享给你|世界最新
- 快看点丨传真软件哪个好_传真软件
- 当前热讯:孙淳主演电视剧 有你看过的吗
- edpinaud是什么香水 相关内容介绍
- 每日快播:651错误代码怎么办 本文教你如何解决
- 2010年快男10强名单 有你喜欢的歌手吗
- 【全球热闻】张惠妹怎么突然胖了 张惠妹变胖的缘故
- 光疗美甲多少钱一次 光疗美甲要照灯吗 动态焦点
- 银行卡注销可以在手机上操作吗?销卡是个人现金业务吗?
- 淘宝号申请步骤 你学会了吗
- 全球速递!石家庄有武术学校吗 都有哪些学校呢?
- 花呗上门取证是真的吗?花呗借呗无力偿会怎么样?