跨越语言边界:20+种语言的AI图像生成挑战

12/05/2024

在这个日新月异的时代,能够熟练运用各种AI软件已经成为“打工人”的必备技能。一家领先的平面设计软件公司创建了一个多模态AI模型,可以从文本提示中生成原创图像。他们与澳鹏Appen合作,评估这些AI生成的图像是否能够成功满足用户期望。

本期案例故事,澳鹏Appen帮助该公司扩展其模型功能至20多种语言,确保模型能够在不同文化背景下生成高质量的AI图像。

目标

从20多种语言的文本提示中创建具有足够文化相关性的高质量图像,项目的主要目标是全面改进LLM图像生成模型的能力。不仅仅是本地化能力,模型各方面的细节完善至关重要,以确保每个设计符合用户期望,在各种文化背景下能够为用户提供高质量、有共鸣的模型结果。

挑战

跨20多种语言评估AI生成的设计图像,本身就面临文化方面的挑战。每种语言的背后,都具备其独特、微妙的文化元素,这需要对各个地区文化的细微差别有深入的了解。与此同时,还需要具备对于视觉和平面设计原则的全面理解,才能够有效评估模型输出。

此外,在20多种不同文化视角下,对提示进行准确的评估和评分,其中的复杂性进一步加剧了模型输出一致性的需求。

解决

该公司与澳鹏Appen合作,通过两个阶段的方法来应对LLM图像生成模型当前所面临的挑战:

  1. 文本提示本地化:澳鹏Appen的母语翻译人员将英文提示本地化成24种语言,并运用文化专业知识确保其准确合理。除了直接翻译外,该阶段还需要在某些情况下进行再创作,以更好地与当地用户产生共鸣。在这个阶段,捕捉特定文化庆典、符号和习惯至关重要,以确保提示能够准确反映出每种目标语言的独特特征。
  2. 设计评估:在第二阶段,澳鹏Appen的专家审核员根据详细的标准,评估每个LLM生成图像的质量,包括文化相关性、是否遵循提示说明、设计风格和图片格式等。每个提示的英文版本也经过评估,作为基准,以确保在20多种语言中保持一致性。通过对每个图像提供清晰一致的反馈,澳鹏Appen帮助客户完善其图像生成模型,全面提升AI生成图像的质量。

成果

澳鹏Appen为各种场景提供了本地化的文本提示,并对每种语言进行了数百次评估。每个图像输出都根据特定的文化标准进行了审核,包括以原始英文提示作为比较基准,使客户能够清楚地分析模型在多语言框架下的表现。

通过这种详细、具有文化敏感性的评估方法,澳鹏Appen帮助客户实现了高质量、符合文化相关性的图像输出,确保该设计软件的用户体验得到改善,增强了多样化的国际受众对产品的满意度和参与度。