焦点日报:中关村科金张杰:领域大模型给了科技公司在大模型市场上弯道超车的机会
自2014年成立以来,北京中关村(000931)科金技术有限公司(以下简称中关村科金)就选择专注于企业服务赛道提供对话场景服务,聚焦生成式AI技术,包括领域大模型、大数据分析、多模态交互三大核心技术。如今基于这三大类核心技术,已形成了一套完备的技术体系,并构建了一个基础的技术底座——即生成式的得助对话引擎。
【资料图】
基于得助对话引擎中关村科金打造了三大产品矩阵,包括数字化洞察与营销、数字化服务与运营、数“智”底座,升级推出全新的云呼叫中心、全媒体智能客服、智能外呼机器人、智能质检、智能陪练、智能音视频等一系列产品和服务,覆盖了用户服务的全生命周期,包括售前、售中、售后等环节,被广泛应用于金融、政务、零售、大健康、制造等行业。
“通过新一代的得助对话引擎,我们正在从传统的对话引擎迈向大模型的对话引擎,用一套对话引擎支持多种业务系统,业务系统会基于行业线进行拆分,在不同的行业线还推出了私有化和SaaS化的版本。”中关村科金技术副总裁张杰介绍,通过一套技术体系对产品进行能力赋能具有很多优势,以前产品矩阵的底层有几百个定制化模型,运维起来非常麻烦,现在可以统一用一套大模型就搞定了。
为何执着于打造领域大模型?
自 2018 年开始,预训练模型逐渐兴起,起初用的比较多的是判别式模型,例如 BERT 模型。近几年,预训练模型几乎是以爆发式的速度增长,参数规模逐年上涨。尤其是去年 11 月底,ChatGPT 火爆出圈成为革命式的事件,基于 GPT 出色的生成效果,很多传统的 NLP 任务都规划到了生成模型中。
其实早在ChatGPT出现之前,中关村科金就已经认识到大模型是个大趋势,决定把公司已有产品的底层核心引擎全部转移到大模型上,这一路线与很多All in AI的公司是一样的,但不一样的是中关村科金聚焦的是领域大模型,而非通用大模型。
目前,虽然AI大模型在文学、医学、数学、计算机科学等领域表现了出前所未有的理解与创造能力,但现阶段大模型面临的挑战是巨大的。
首先,训练大大模型对算法和算力都有着极高的需求。据OpenAI团队发表于2020年的论文《Language Models are Few-Shot Learners》,训练一次1746亿参数的GPT-3模型需要的算力约为3640 PFlop/s-day,成本约为460万美元,以此现状来看,目前市场上的大多数企业是无法承受如此高昂的算力及成本消耗的。
其次,除了算法和算力外,数据对于训练大模型也至关重要。而现在获取与管理数据的成本也在持续增加。还是以GPT为例,OpenAI公司在数据标注上已投入数千万美金,据悉,标注一个强化学习数据成本高达50美元。
第三,大模型所涉及的伦理、道德、安全等问题也在受到越来越多的关注。
张杰认为,从长远来看,通用大模型确实能给行业带来巨大的价值,但从目前来看,通用大模型在处理专业问题方面还不是很聪明,不能满足企业对专业性、合规性、规模化的需求。相反领域大模型不仅不需要依赖特别大的算力和参数,还能切实解决领域内某几类细分场景的问题。比如财富管理领域的大模型只需要50 亿参数规模就能很好地用于营销、客服等场景,那就没必要做成1000亿参数 ,避免用大炮打蚊子,节省算力消耗的资源。
与通用语言模型相比,领域大模型更专注于某个特定领域的知识和技能,具备更高的领域专业性和实用性。
在进行领域模型探索的同时,中关村科金也没有忽略应用层。2022 年,在中关村科金 AI 平台能力中心的主导下,公司的智能外呼、智能客服、智能质检、智能陪练等产品通过自研的对话引擎全面拥抱大模型,充分挖掘企业各类对话场景数据价值,帮助企业实现更加智能的沟通、成本更低的运营维护。
大模型高不可攀,领域模型却能弯道超车
自ChatGPT崛起后,人工智能才真正地走在了聚光灯下。
当前,仅国内号称投入大模型的厂商就多达30多家。按照参数量和应用领域的不同,大模型市场正迅速分化为通用大模型与领域大模型两种路径。虽然通用大模型在许多领域都有着卓越性能表现,但在专业和更加细分的垂直领域,通用大模型所表现出的能力却差强人意。
与“一本正经地胡说八道”的大模型相比,企业客户显然更倾向于针对某一特定领域或任务专门定制的领域大模型。与通用大模型相比,领域大模型对算力和算法的要求没有那么高,而对于数据的要求较为苛刻。
据张杰介绍,To B场景下,训练一个领域模型更要有一些高质量的、小规模的数据,但数据标注成本比较高,不是每家AI公司都有能力自建团队去做,这是中关村科金能做大模型应用的一个门槛和优势。
中关村科金新一代得助对话引擎的核心能力是:领域CoT + 领域大模型 + 领域知识库 + 领域能力套件。通过将领域的know-how转化为领域CoT,使大模型具有更复杂的业务问题解决能力;通过外挂知识库的形式,把事实性知识的流程性知识都放在领域知识中台内,大模型用来做抽取、调度和生成,然后下游业务系统通过API获取结果,以保证业务知识的实时性、可靠性;通过领域能力套件,打通大模型和企业已有系统的融合,建立模型和企业已有业务系统的无缝链接,将大模型的能力充分释放到各个业务系统中。
把某一特定领域高质量的领域常识数据灌到大模型里训练,就可以让模型具备更多的领域知识,学到领域的语言特色,对领域数据的理解能力和生成能力也会提升。得助对话引擎主要特点是以大模型为中心,传统对话引擎相关的意图识别、对话状态跟踪和话术生成等任务全部由大模型进行判别和自主执行。
除了将通用大模型这个“文科生”变成领域专家外,保证整个对话过程的可用、可信、无害和可靠,中关村科金还自主研发了领域prompt工程组件,可以有效将对话能力约束到领域边界内,使大模型可以在业务规范下,安全、可靠地完成对话任务。据张杰介绍,在新一代得助对话引擎的设计中,充分考虑到实际业务情况,轻量化部署本地化大模型是未来企业的强烈需求,中关村科金研发了本地化大模型的快速优化套件,主要包括领域知识的注入能力、领域prompt生成能力、领域指令自主生成能力、领域指令微调能力和领域规范行为对齐能力,可以帮助企业快速构建适合于自身业务场景的大模型,降低大模型在企业的落地门槛。
值得一提的是,通过“学、教、用”三步走路径,得助对话引擎可以帮助企业构建“超级员工”,助力企业提升服务价值。
第一步:学,大模型在领域数据上的无监督学习,这一步的重点是让大模型从散落在各处的数据源中萃取出领域事实性知识,如各种培训材料、行业通用知识等,让大模型能够理解领域知识,成为一个具备领域知识的“普通员工”。
第二步:教,从人类反馈中以小规模有监督学习的方式做微调。“普通员工”依托专业的产品设计,不断和人类专家进行闭环反馈。基于人类专家的反馈,它能够不断地获得提升,逐步成为“超级员工”。
第三步:用,在特定场景下以机器人或助手的方式应用。这一步的关键点是产品设计,如何合理的为人类员工和数字员工分配任务,实现能力互补,并且让数字员工从业绩反馈中持续学习。
张杰坦言,“使用大模型以后,已有的对话产品中定制化建模的成本降低了,而且之前技术达不到要求的对话场景现在也可以做数智化尝试,AI 落地的商业空间更大了。”
在企业的数字化转型进入深水区后,大模型之间的竞争也将进入白热化。想要训练一款性能卓越的通用大模型,无论是技术和资本上的投入都是巨大的,这对于普通的中小企业来说是无异于无底洞。在此情况下,创新型企业可以选择换条赛道,以领域大模型为切入口,与大厂形成错位竞争,根据市场定位和行业发展趋势,提供有差异化和有竞争力的定制化大模型,以此寻求弯道超车的机会,实现业务的更快增长。
领域大模型的未来趋势展望
我们看到,大模型的广泛落地带来了工作方式的革新,大模型正在重塑企业生产关系,重构商业格局。
大模型混战之际,业界也在讨论和预测大模型的终局。张杰的判断是,未来会呈现出基础大模型多家并存、领域模型百花齐放的状态。
“基础大模型,特别是多模态基础大模型,未来应该只有几家公司做,因为做基础大模型需要大量的数据、算力和人才,这些组合资源极少部分企业能够承担得起。因此,未来一定是有数据、有算力、有人才的公司,更可能去构建出基础大模型。基础大模型未来会聚焦在提升多模态能力、挖掘复杂推理能力,以及构建应用生态圈。”
基础大模型如果想用在实际业务中,还有很多方向需要适配,例如在法律、医疗、金融、政务等领域,很多工作流程逻辑复杂,且对数据敏感性、业务可解释性要求高,基础大模型在这些场景无法直接商用。
这就给未来其他企业留下了空间。如何根据实际的业务,将大模型转化成一种具有高效的计算方式的小模型,小模型再根据专业知识做注入、指令微调、思维链提升、对齐等,使其更适配某一领域的规范约束。
对此问题,中关村科金需要思考的是,如何发挥自身优势,在领域内如何积累数据,如何沉淀领域知识,如何将领域知识注入到大模型上,以此构建自己的技术护城河。
“可以畅想,未来大模型领域会是一个百花齐放的局面。个别头部企业会去做大模型,其他企业根据大模型的能力提升每个领域的中小模型,中小模型再结合领域的知识,变得更专业化,这是一个大趋势。”张杰如是展望。
(免责声明:此文内容为广告,相关素材由广告主提供,广告主对本广告内容的真实性负责。本网发布目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,请自行核实相关内容。广告内容仅供读者参考。)
(责任编辑:王治强 HF013)标签:
相关阅读
精彩推荐
阅读排行
相关词
- 世界男排联赛中国队不敌斯洛文尼亚队
- 中国银联发布《中国银行卡产业发展报告》:2022年高端卡产品规模占比20.8%
- 什么是mkv格式?mkv格式和mp4格式的区别有哪些?
- 电脑开机慢是怎么回事?重装电脑系统怎么装?
- 文化和旅游部产业发展司发布20个沉浸式文旅新业态示范案例
- 多巴胺美景点亮夏日旅游新坐标 带动周边旅游线路发展
- 惠同新材北交所IPO打新冻资448.61亿元 获配比例0.23%
- 广西梧州市部署农贸市场整治行动
- 西藏移动承办2023全球数字经济大会拉萨峰会智慧城市分论坛
- 佳能是哪个国家的品牌?国产相机有哪些品牌?
- 全球百事通!旅游 | 川浙“互宠” 成都大运会期间浙江494家景区将为四川游客减免门票
- WAIC 2023|达闼机器人发布业界首个机器人多模态大模型RobotGPT
- 河北省邯郸市2023年上半年开展“双随机、一公开”抽查251次、抽查企业7700家
- 怎么显示文件后缀名?怎么显示文件格式?
- 小米手机怎样设置来电名字
- i9是什么级别的处理器(i9属于什么级别的处理器)
- 肉鸽卡牌对战游戏《天行镖客》Steam上线 年内发售
- 韩国今晨松口了?!称日本核废水排海符合标准 最大在野党仍在静坐抗议
- ip地址划分为哪几类?手机ip地址怎么切换?
- 我们为什么希望王宝强赢一次
- 2023年度文化和旅游系统青年科研人才扶持计划启动-环球热讯
- 五部门调整新能源汽车积分政策 新增积分池管理制度
- 青岛即墨:“海上田园”夏景如画
- 阿兹夫定片禁用人群有哪些?阿兹夫定片多久代谢掉?
- 康拓医疗: 公司生物再生材料人工硬脑膜产品目前仍处于FDA认证过程中,后续进展敬请持续关注公司公告
- 沙棘果和猕猴桃哪个维生素C高?沙棘维生素c片的功效和作用有哪些?
- 环球关注:这一天,我们不敢忘,也不能忘!
- 良渚古城首次对话雅典卫城:话什么、看什么、为什么?-最资讯
- 银耳汤怎么做才能补胶原蛋白?吃鱼补胶原蛋白吗?
- 参数1000亿!华为云发布盘古大模型3.0 覆盖基础、行业及场景三层架构 主流1.1倍效能
- 前5个月我国服务贸易保持增长 旅行服务增长最快 环球今热点
- 消毒液是酒精好还是次氯酸好?酒精和次氯酸哪个安全?
- SensorTower:6月中国手游发行商全球收入排行榜
- 郭台铭将于7月23日宣布参选台湾地区领导人?郭办否认
- 稳外贸外资,深圳出台“金融支持外贸24条”
- 三棵树:预计上半年净利润同比增加213%到244%
- 全球观热点:住建部明确城市更新底线要求 坚持“留改拆”并举
- 全国发布108个高温红色预警,其中河北占了71个 即时焦点
- 浦东新区区筹公租房房源信息汇总表
- wab32res.dll丢失怎样修复
- 云南划分野生菌中毒高、中、低风险区
- 教你如何修复mso9.dll丢失-天天最资讯
- 均瑶健康(605388.SH):味动力要做进一步升级
- 对话格创东智CEO何军:做好工业软件 需要工业基因 天天看点
- 小暑:风动莲生香,心静自然凉
- 在23℃的夏天里感受挥杆的快乐!全国女子门球赛在广元朝天曾家山开赛
- 羽绒服经常洗好吗?洗好的羽绒服怎么变蓬松?
- 《最终幻想16》Boss控制系统打法攻略
- 100秒领略多彩贵州之美|聚焦
- ahci改raid蓝屏解决教程_每日看点
- 世界播报:如何解决联想游戏本蓝屏显示设备出现问题
- 如何解决换系统蓝屏
- 华硕天选fa506蓝屏重启如何解决
- 专家解读城市热岛效应如何影响天气 建设通风廊道有助于城市减热
- 回南天一般持续多久?回南天和梅雨哪个更潮湿?
- 宝马(中国)汽车贸易有限公司召回部分进口7系汽车
- 国航运送“同心•共铸中国心”医疗团队 赴西藏昌都开展健康公益服务
- 北京智慧城市建设名列前茅
- 全球新资讯:《最终幻想16》Boss贝希摩斯打法攻略
- 怎么改ip地址?ip地址的正确格式是怎样的?
- 沅陵军休所:党建引领,永葆政治本色
- “年度最小太阳”都现身了,入伏还得等几天
- 【全球聚看点】龙之灵什么时候出 公测上线时间预告
- 压缩文件怎么加密?压缩文件加密后还是可以打开怎么办?
- 警惕!南阳这17处水域危险
- 奥福环保:董事于发明拟减持不超过1.94%公司股份
- 华为云发布盘古大模型3.0,可在各个垂直场景应用
- 什么是php文件?php文件用什么软件打开?
- 三亚市天涯区西岛渔村旅游观光路线正式开通
- 道县应急管理局开展“专家查隐患”行动
- 硬盘接口类型有哪几种?不插硬盘可以u盘启动吗?
- 全球平均气温连续两天破纪录 气候专家称这是对人类和生态系统提出严重警告
- 甘肃推进“全国个体工商户服务月”活动走深走实
- 以太网是什么?以太网是要插网线吗?
- 应急管理部:2023年上半年灾害形势总体平稳
- 云南禄丰市强化成品油市场监管确保油品质量
- 国际邮箱有哪些?email地址怎么注册?
- 旅游 | 第七届吉林省消夏避暑全民休闲季文旅消夏生活展正式开展-天天快资讯
- epic是什么平台?中国大陆Steam被禁止了吗?
- 【世界快播报】《逆水寒手游》天外飞财奇遇任务流程
- 湖北襄阳市市场监管局打造“信用风险分类+预警监测”新型监管模式
- 安徽石台:大学生暑期带着“健康营养大餐”来了
- 万灵山海之境南宫雪值得培养吗 万灵山海之境南宫雪强度解析 天天新视野
- 16家知名车企,为何宣布不再打“价格战”?
- ppt插入音乐的方法是什么?怎么让ppt的音乐一直播放?
- 科大讯飞与华为大模型合作正式亮相
- 重庆渝北区出台23条措施力促个体工商户高质量发展
- 养成游戏《火山的女儿》宣布销量突破60万 目前Steam促销中
- 深圳市市场监管局召开中小微企业质量管理体系认证提升行动启动会
- 朝阳·中建星光里|开盘火爆出圈!理想人居价值解码
- 东风汽车:6月汽车合计销量1.32万辆
- 达能中国饮料赋能务工青年发展
- 机构:TOP30房企上半年全口径销售额同比增长超一成|世界速递
- 日政府向东电交付“合格证” 福岛核排污设施准备工作全部完成
- 如何用大模型Prompt解决行业场景问题?大厂中文教程来了!
- 纽约街头两大巴相撞,“至少80伤”
- 大额存单成“稳波神器”:中小银行让利意愿强,上市公司大手笔抢单
- 大局观 | 鸽派、务实派、温和派?拜登冀耶伦访华扮演这一角色
- 再见李玟 谢谢你给世界的光和暖
- 每日资讯:歌手李玟轻生去世 导演李安发文悼念
- 商务部:《投资便利化协定》将对我国企业对外投资产生影响
- 中国人民银行发布《中央银行存款账户管理办法》 全球新动态
- 江苏南京举行纪念活动致敬英烈 缅怀遇难同胞_天天热门
- 一箭双雕!新方法同时揭秘宇宙第一代星系和暗物质
- 林州重机07月07日主力大幅流出
- 【天天聚看点】普契尼经典歌剧《三联剧》今明上演
- 网络暴力信息治理将有规可依
- Taylor Swift重置数专《Speak Now (Taylor’s Version)》上线云村_天天时讯
- 刷完bios蓝屏怎么自救|环球通讯
- 高通全球高级副总裁:AIGC的成熟和广泛应用将大幅提升元宇宙内容的生产效率
- 商务部:《投资便利化协定》将为我国企业对外投资提供更多保障
- 全球讯息:“漫步经典”7月9日启幕 21天13场音乐会
- 引力传媒(603598)7月7日主力资金净买入54.60万元
- 王宝强:每个人心中 都有隐形“八角笼” 天天要闻
- 电脑提示ipodupdaterext.dll文件丢失的解决方法_环球看点
- 《原神》隐众游园聚流映灯在哪里介绍
- 观热点:云顶之弈s9裁决天使阵容推荐 裁决天使阵容装备搭配攻略
- 灭蚊灯效果怎么样?灭蚊灯的紫色光对人体有害吗?
- feclient.dll文件丢失如何修复?_全球快播报
- 助力山区26县发展系列报道3|金融服务“零距离”,交行在行动
- 华硕飞行堡垒8蓝屏重启怎么办
- 聚焦"追光者" | 银川《新闻观察》走进TCL中环灵武马家滩光伏项目
- 北!京!真!的!太!热!了!
- 【平安朱老庄】扎实开展“瘦肉精”检测,守护“舌尖上的安全”
- 电脑系统蓝屏修复教程
- 6月份缅甸大米和碎米出口突破6.2万吨 焦点速读
- 白鸭绒和灰鸭绒哪种好?灰鸭绒属于什么档次?
- 安徽举办全省市场监管所长培训班
- 湖南发布《企业商业秘密保护管理规范》
- 《敢达争锋对决》5.5周年庆活动携敢达AGE-FX降临
- 《逆水寒手游》哑巴兄弟任务方法
- 世界微资讯!高盛“掀桌子”VS中资券商反击,二者激辩的焦点是什么
- 日本车企拟借固态电池技术翻身
- 天天热点评!永劫无间免费玩老玩家补偿是什么 免费开玩补偿奖励介绍
- 昔日28倍大牛股崩了 北向资金、机构仓皇出逃!
- 前5个月我国服务贸易保持增长 旅行服务增长最快|焦点日报
- 广东紧抓食药安全和产品质量监管 突出问题整治整改
- 青浦新开一家盒马奥莱店,就在→
- 今年4至6月缅甸对外贸易额73.7亿美元
- 【新东方在线托福视频号】关注有礼,快来关注吧!
- 中指研究院发布《2023上半年中国房地产市场总结&下半年趋势展望》
- 三分钟先生粤语百度网盘(电影《三分钟先生》演员名单)
- 驻日美军承认“放毒” 东京17个地区地下水疑受污染
- 本周末或上演梅雨“谢幕演出”
- 爱尔兰结婚不许离婚吗?爱尔兰离婚的后果有哪些?
- 【OFweek维科杯】成都中建材参评卓越BIPV解决方案企业奖项
- 2023贵州贵阳市白云区云城教育咨询有限公司招聘中小学、幼儿园双轨制教师资格复审合格及进入笔试考生名单更正公告
- 株洲天元区检察院:用《检察建议书》助力企业堵漏洞、消隐患
- 凯迪股份股东户数下降2.09%,户均持股33.39万元
- “外引内培”助推串串香飘天下