大模型数据服务

澳鹏丰富的数据项目经验、全球语言资源以及九大垂类专家，支持微调、RLHF、Red Teaming以及RAG项目。从数据采集标注、数据集、模型评估等方向，为您的大模型部署之旅保驾护航。

大模型数据解决方案

高质量数据服务支持您的模型训练

监督微调（SFT）

人机结合（HITL/RLHF）

LLM评估和A/B测试

红队测试及模型安全

检索增强生成（RAG）

监督微调（SFT）

澳鹏支持创建针对不同需求的自定义提示和响应，以增强模型在不同场景和专业领域的性能。

多应用场景：开放式QA，总结，润色，思维链推理等

多模态：图像，视频，语音，文字信息的互相链路

多垂类领域：九大垂类专家支持

多语言：包括英语、西班牙语、日语在内的235+种语言

人机结合（HITL/RLHF）

澳鹏支持通过人工反馈强化学习（RLHF）和直接偏好优化（DPO）等方式来增强您的模型表现。

支持自定义工作流程和培训要求

单轮或多轮对话

可定义的标注字段

实时人机交互

LLM评估和A/B测试

澳鹏支持从多角度指标对模型进行性能评估，例如相关性、准确性、有用性和连贯性等。

将有针对性的见解融入模型优势和改进领域

通过A/B测试在开发周期内比较不同的模型表现

与市场上的竞争对手进行对比评估

红队测试及模型安全

澳鹏可对您的模型进行漏洞识别，并对比测试不同情景下的模型安全性。包括：

对抗性攻击

危害类别（毒性、偏见、隐私等）

多轮测试

护栏测试（Guardrails testing）

生成内容的审核和标注

检索增强生成（RAG）

澳鹏支持通过引用更广泛的知识库，将模型定制到特定领域并生成更精确、更符合上下文的响应。

数据准备：为您的独特应用场景采集、标注、并管理数据集

提示数据集：创建有效的提示，进行定向模型训练

评估和A/B测试：比较不同模型的性能并优化输出表现

红队测试：为您的模型进行压力测试，以预先识别并解决漏洞

专家赋能的九大垂类数据

高质量数据服务助力行业大模型开发

法律：合规与精准并重

全职法律专家团队，专注民商法、刑法、劳动法等

支持SFT、RM、NLP等大模型业务

应用：法律文本优化、纠纷场景数据（劳动/消费/婚姻）、审核评估等

案例：SFT法律回复结构优化

医疗：医学专家+交付经验

500+医学专家团队（20%硕士，15%执业医师）

覆盖临床、药学、营养、护理等全学科，客户30+，项目500+，交付1000万+数据

应用：AI辅助诊断、医患对话、电子病历结构化等

案例：医学候选词审核，医考大模型试题答案解析编辑

代码：技术栈全覆盖

120+全职工程师（Python/Java/C++/Go/Rust 等）
100+优质兼职开发者（ 30%+稳定合作）
支持代码思维链（CoT）、CR/MR等高难度标注
持续积累高质量行业特定代码数据集

金融：风控与决策赋能

120+全职团队（99%金融/经济本科，70%基金/证券从业资格）

持有CFA/CPA/ACCA等证书的金融专业人员

服务场景：智能投顾、高客理财、投研解读、保险评测等

案例：金融大模型标注、金融大数据智能投研任务

数理：逻辑与算法攻坚

竞赛获奖者团队（全国大学生数学、物理、化学、建模竞赛一/二等奖获得者）

擅长高数证明、物化生模型评估（物理学研究和应用、化学材料学、生物医学等）

案例：实验室模型解题判断，数物化生模型性能评估，大学数物化生考题标注

音乐：艺术与技术的平衡

500+兼职音乐人，精通10+乐器、20+音频软件，涵盖作曲、音响工程、音乐表演等领域

累计标注75万+首（准确率98%+）

服务：编曲、标注、制谱、问答、打轴、评测、检索及音视频匹配等

案例：中文标杆男歌手歌曲标注

多语言：全球化交付能力

全职团队支持英/俄/日/韩/法/意/德/西/葡/波兰/马来/印尼/阿拉伯/土耳其等20+语种

全球众包资源，涵盖200+种语言

自营国内及海外交付中心（标注、翻译、审核、客服等全类型服务）

案例：NLU语言专家，多语种大模型效果评测

TTS：高保真语音数据

数十个国家、数百小时采集经验

专业声优（5年+经验），涵盖普通话/方言、东南亚/日韩/欧美地区各类语言

行业标准录音棚覆盖全国主要城市（NC-20/RT60<100ms）

涉及TTS录制、影视剧配音、新闻主持、游戏解说等多领域

文学：跨模态文化理解

985/211高校文学团队，涵盖汉语言文学、传播学等专业

支持跨领域多模态融合与创新、情感交互等领域大模型发展

案例：多模型回答打分与排序

全面工具支持

Response 的人工标注

对 responese 人工改写，多维度评分，多类型错误标注，自定义属性标注。

多 Response 的排序

支持对多个来源为各模型或人工的回答进行拖拽排序，评估最贴合偏好的回答

构建多轮对话

支持人工/基于模型添加多轮对话

大模型智能体标注能力

基于思维链，工具调用，知识库等，评估和完善大模型智能体内在的思维逻辑

多模态数据标注能力

支持文本、图片、音频、视频等数据融合标注，支持Markdown、LaTeX等不同表现形式

基于LLM的自动标注能力

嵌入LLM自动生成Response，实时获取模型回答并提供反馈

自定义模板引擎

除通用工具模版外我们也支持通过自定义组件拖拽配置的方式完成自定义标注工具的搭建，从而灵活的适配项目的各类标注要求

灵活的数据标注 Pipeline

支持多个人工和模型标注/质检节点的灵活配置

服务优势

专业度

28+年数据行业深耕，支持全球15000+ 个AI项目落地，为您提供全面快速的数据支持。

垂类经验（行业资源）

多行业专业团队支持，包括代码、医疗、教育等，支持您的用例数据需求。

及时响应 / 任务切换能力

澳鹏全球资源的调配及平台技术的支持，快速响应的售前及售后服务团队，确保项目快速准备和部署。

安全合规性

Appen 的安全设备、现场服务、安全众包模型和技术解决方案已经通过 ISO 27001，ISO 27701，ISO 9001，GDPR，SOC 2 类型II 认证，及 HIPPA 认证。

成功案例

多模态大模型数据解决方案

澳鹏基于其大模型平台的多模态数据处理能力，为某 AI 科技厂商提供图像文本描述数据服务。澳鹏为客户提供了超过50亿对高质量图文对，为客户的图文大模型提供了充足的数据支持。同时，澳鹏还为数个多模态大模型项目提供高质量数据服务，涵盖文本、图像、视频、音频等多种不同模态的数据类型。

垂类大模型数据解决方案

澳鹏为某科技公司提供大规模代码类大模型训练数据解决方案。利用澳鹏的定制模板引擎和多模态数据编辑器，聚集了行业专家团队，包括各种开发语言的研发工程师、数据分析师和算法工程师，提供高质量的代码训练数据。覆盖了代码编写、逻辑解析、代码调试和单元测试等各个阶段的数据需求，累计提供了50万组以上的高质量代码数据，为代码大模型的应用提供了可靠数据支持。

“数据是决定机器学习模型性能的三大要素之一。随着各类大模型的智能涌现，数据，尤其是高质量的行业数据，正在成为决定大模型高速发展的关键因素。澳鹏自研的算法模型和核心技术，通过AI赋能数据全生命周期，更快更多地给予AI应用数据养料，为大规模的大模型场景落地提供支持。”

田小鹏

澳鹏Appen全球副总裁大中华及北亚区总经理

田小鹏

澳鹏Appen全球副总裁大中华及北亚区总经理

资源中心

大模型全流程服务

涵盖多语言全开发流程的大模型数据服务