Hot Sale | 澳鹏精品数据集火热来袭!
在人工智能项目需要快速启动时,成品数据集(OTS / off-the-shelf datasets)往往是许多AI团队的首选。
采用高质量、合规的成品数据集进行部署,不仅能够在速度至关重要的今天快人一步进入市场,更可以在预算有限的情况下获得较高的成本效益。
澳鹏提供700+个成品数据集,包括27,600+小时音频、490,000+幅图像和超过一亿字/词文本,涵盖80+种语言和方言。我们也在不断构建新的数据集,以满足全球企业用户的部署需求。
▲专家团队,大规模、高质量的数据供给
▲快速部署,低成本高效益
▲支持所有数据类型
本月,澳鹏Appen精选了metadata信息齐全、数据说明完整、数据量级大、质量高的hot精品数据库限时优惠促销,包括:
22个ASR精品库,9个图片精品库,24个文本精品库,17个词典精品库,8个TTS精品库和8个视频精品库。质检合格率达95%以上。
ASR精品库
澳鹏Appen拥有170+个ASR数据产品,涵盖50+种语言,总长2万+小时。ASR精品库包含多个热门小语种、方言对话&朗读数据库,以及婴儿哭闹、猫狗吠叫、广播等特色语音数据。话题广泛涵盖各个细分领域。
图片精品库
澳鹏拥有量级高达50万+的图像数据。图片精品库包含小语种OCR图像数据库,涵盖广告、看板、商务菜单等热门图片主题;亦包含汽车尾灯、户型图、发丝分割、50亿图文数据对(56TB)Laion 5B等小众宝藏数据集。
文本精品库
重点推荐超过180万词条的大语言模型训练数据库;百万量级的多领域论文数据库;数百万对平行语料库等。量级高达30万+题目的多学科试题库已达到考点全覆盖。JSON等多种可编辑的文件格式方便多渠道查看和使用。
词典精品库
澳鹏Appen自主编写制作的词典数据库覆盖超过20个语种,每个语种涵盖不同区域口音的数据。词典数据库使用说明完备,经过多次实际项目的验证评估,无论在量级还是质量方面都具备优势。
TTS精品库
包含泰语不同年龄段、多种情绪TTS库;美语歌曲数据库;俄语、德语、美语多种音色库;中文客服女声库等等。每一个TTS数据集产品都拥有独特的风格,且均由专业录音人员使用高保真设备录制,确保数据的高质量。
视频精品库
包含当前热门的人物朗读视频数据集,涵盖东南亚五国(越南、菲律宾、马来、印尼、泰国),人均录制时长达20+分钟。此外,人物行走动态视频、宠物婴儿双模OMS数据库等产品也具有较高热度。
澳鹏appen
澳鹏Appen是全球图像、文本、语音、音频、视频等AI训练数据服务提供商,拥有业内先进的人工智能辅助数据标注平台、自研的大模型开发平台及全球100多万名技能娴熟的众包资源,支持290+种语言和方言。澳鹏Appen数据解决方案已助力全球15,000+个AI项目的研发及商业化。
澳鹏提供600+成品数据集,包括ASR、文本、发音词典、图像及视频,为您的快速部署提供高质量数据。