通过 Shotzr 快速识别哪些图像需要元数据定位
Shotzr 如何使用澳鹏平台为其客户改善推荐和搜索体验
对于我们来说,使机器学习切实可行的一大挑战是缩短从构思到生产的周期时间。我们深知,如果我们能够快速地重新平衡我们的训练数据并将 机器学习团队的反馈整合到流程中时,则我们正在取得进步。迭代周期显著加快,我们可以在创纪录的时间内使模型从构思转为生产。
– Mark Lemmons Shotzr 联合创始人
公司简介
在物联网设备数量预计达到 100 亿台的世界中,客户体验和关注是通过图像来驱动的。Shotzr 可帮助您识别客户,然后通过与您的受众群体定位相匹配的上下文图像与他们进行确认。 无论您的业务是 Facebook 和 Instagram 广告活动、社交媒体营销、SEM 登陆页面还是真正的动态广告素材,Shotzr 都能为您提供数字营销所需的所有图像。
挑战
Shotzr 收集的精选高质量图像的数量正在以惊人的速度增长,可访问图片已接近 1 亿张。为了提供营销人员在每个营销时刻需要的精确图像,Shotzr 需要对他们的图像进行正确且准确的标注。 随着 Shotzr 标注者上传的图像数量不断增多,以及 Shotzr 与其他图像提供商合作伙伴关系的不断发展,内部团队已经无法跟上标签和元数据的需求,使业务难以扩展。Shotzr 在 90 天内标注了大约 2 万张图片,但这个速度仍无法匹配平台上庞大的图片数量。 为了确保 Shotzr 的平台能够提供营销人员所需的正确图像,Shotzr 需要创建一种图像识别解决方案,而这个方案需要特定的标签。这些标签仅向客户显示最佳选择的候选列表,而不是让客户滚动浏览数百个与搜索查询匹配的图像。例如,某些图像显然来自特定位置,例如科罗拉多州的阿斯彭 (Aspen)。标记该位置可以帮助人们查找阿斯彭的特定照片,不是树木,而是城镇和周边区域。但有些图像无法分辨位置,例如很多手交叠在一起的照片或典型的图库照片。
解决方案
Shotzr 通过机器学习,希望借助该技术快速并自动识别哪些图像需要具有特定的位置元数据。通过 机器学习尽早证明价值并实际交付这种价值,这是 Shotzr 从试验阶段成功进入生产的关键,因为他们最初的资源有限,无法使模型发挥作用。为了证明这种价值,Shotzr 需要获取高质量的数据并正确和准确地训练他们的模型。 为了提供这种级别的细化标签,Shotzr 需要一个数据合作伙伴,能够应对他们这样公司规模的工作量的挑战,并且定价合理。基于上述原因,他们向澳鹏(Appen)寻求帮助,希望我们提供可输入到他们的搜索相关性模型的数据。
成果
仅仅几周之后,Shotzr 就预计,训练的分类器数量会是他们此前最大估算量的 4 倍。 在澳鹏平台(Appen platform)上完成第一项工作后,Shotzr 识别了超过 1.7 万张不需要附加标签的图片。他们预计,他们可以节省原计划为位置数据投入的超过 6100 万的资产,同时腾出时间专注于可从位置数据获益的图像,并创建新的模型来自动进行位置标记过程。
澳鹏支持多语言的内容相关性标注,包括内容审核、结果评估、行业相关性判断等。