案例 | 大模型工程化落地,足够细分的优质数据是关键

11/10/2023

自今年上半年开始,从全球到国内的众多技术团队都在跑步入场基础大模型的研发。Gartner中国企业人工智能趋势浪潮3.0指出,中国企业正在将人工智能项目从原型转向生产。

下半年,大模型工业化量产和工程化落地的趋势已清晰浮现。行业和企业客户更加关注如何选择已有大模型并微调后适配本行业和企业的业务场景,真正将AI用于提高生产力。

在大模型落地的众多行业和场景里,问答模式的客服机器人通常被认为是最佳的落地场景之一。客服机器人的研发基于自然语言,以对话服务为主,甚至许多大模型的对话框都和客服对话框很像……

如何基于大模型改造和提升现有的客服产品,以足够丰富的数据养料重构产品功能与用户体验,一系列新的挑战伴随机遇接踵而至。本期案例故事中的澳鹏客户,以高质量的多领域训练数据加速推进大模型落地进程。


挑战

通常来讲,对于销售订单的成功而言,客户的聊天兴趣和聊天时长至关重要,这在客服机器人身上也同样适用。如果客服机器人不能为用户提供优质且相关的回答,用户体验将大打折扣,短期内将对销售数据造成影响,长期来看更可能于品牌声誉无益。

如何在短时间内大规模、高质量地为模型训练提供各种不同领域、不同类型的数据养料?数据安全如何得到保障?这些问题都是提升模型性能的关键。于是,客户找到了澳鹏Appen团队,为其提供基于大模型部署的专业知识、资源和创新型数据解决方案。


解决

客户面向不同细分领域开发的客服机器人,需要各种细分领域、高质量的训练数据对其进行不断优化。针对该项目,澳鹏大模型数据服务已涵盖35+个领域,其中包括金融、保险、英文等垂类领域,涉及SFT、RM、BELLE、RL等多种模型类型,子任务多达100+个。

目前,澳鹏Appen服务的大模型项目已涉及:宠物,美食,游戏,娱乐,音乐,历史,文化,旅游,运动,金融,科技,养花,学校,笑话,节日,社会,文学作品,婴幼儿,养生,世界,发现,政治,医疗,汽车,军事,故事,购物,心理,法律,生活,教育,美妆,明星,植物,建筑,荣誉,材料,清洁,服装,交通,科学, 情感,玄学,星座,翻译,文学,推理,知识等各类细分领域。

面对数据的多样性和灵活性,澳鹏Appen高质量的标注人员素养和精益的项目管理水平,可以快速应对模型的迭代更新和规则规范的快速变更,澳鹏交付团队可达到半天切换一个项目的响应速度。

在数据安全方面,针对该项目具体的数据安全要求,澳鹏团队第一时间设立了高级别的数据安全场地,并采取了多种安全管理措施,如独立门禁、360°无死角监控、独立IP、UPS、签署高保密内容安全协议等,为客户的数据安全保驾护航。


成果

澳鹏Appen团队丰富的大模型相关项目经验,帮助客户大模型从0到1快速启动部署。在客户项目启动前期,澳鹏Appen团队助力客户量化规范,辅助客户评估标注时效,并合理规划预算,成功完成了项目初期的启动和过渡,在“百模大战”中加快部署和落地的进程。

澳鹏Appen团队保持返工率低至1%以下的交付水平,高标注效率和准确率亦为客户项目整体的成本效益提升提供了有效助力。

  • 澳鹏拥有丰富的大模型相关项目经验,在各垂类领域进行了近百个实战项目打磨,帮助客户加快部署和落地进程。
  • 高效率、高准确率的交付水平,为项目整体的成本效益提升提供有效助力。
  • 高质量的人员素养和精益的项目管理水平,可以快速应对数据规则的多样和灵活。
  • 澳鹏始终采取高标准的数据安全管理措施,多个维度上为客户的数据安全保驾护航。

澳鹏大模型智能开发平台

作为提供高质量数据服务的AI战略合作伙伴,澳鹏大模型智能开发平台面向行业AI提供集大模型数据准备、模型训练、模型推理、模型部署应用于一体,涵盖从数据集管理、数据标注、计算资源调度、模型评估、模型微调等全栈能力,帮助企业轻松拥抱大模型,构建生成式AI应用,为最终用户实现变革性体验。

在2023浦东新区人工智能创新应用大赛上,澳鹏大模型智能开发平台广受好评,获TOP30卓越创意奖。

澳鹏支持全栈式大模型数据服务,包括数据集,模型评估,模型调优;同时,澳鹏智能大模型开发平台与全套标注工具支持您快速部署大模型应用。