跨越语言边界：20+种语言的AI图像生成挑战

12/05/2024

在这个日新月异的时代，能够熟练运用各种AI软件已经成为“打工人”的必备技能。一家领先的平面设计软件公司创建了一个多模态AI模型，可以从文本提示中生成原创图像。他们与澳鹏Appen合作，评估这些AI生成的图像是否能够成功满足用户期望。

本期案例故事，澳鹏Appen帮助该公司扩展其模型功能至20多种语言，确保模型能够在不同文化背景下生成高质量的AI图像。

目标

从20多种语言的文本提示中创建具有足够文化相关性的高质量图像，项目的主要目标是全面改进LLM图像生成模型的能力。不仅仅是本地化能力，模型各方面的细节完善至关重要，以确保每个设计符合用户期望，在各种文化背景下能够为用户提供高质量、有共鸣的模型结果。

跨20多种语言评估AI生成的设计图像，本身就面临文化方面的挑战。每种语言的背后，都具备其独特、微妙的文化元素，这需要对各个地区文化的细微差别有深入的了解。与此同时，还需要具备对于视觉和平面设计原则的全面理解，才能够有效评估模型输出。

此外，在20多种不同文化视角下，对提示进行准确的评估和评分，其中的复杂性进一步加剧了模型输出一致性的需求。

该公司与澳鹏Appen合作，通过两个阶段的方法来应对LLM图像生成模型当前所面临的挑战：

文本提示本地化：澳鹏Appen的母语翻译人员将英文提示本地化成24种语言，并运用文化专业知识确保其准确合理。除了直接翻译外，该阶段还需要在某些情况下进行再创作，以更好地与当地用户产生共鸣。在这个阶段，捕捉特定文化庆典、符号和习惯至关重要，以确保提示能够准确反映出每种目标语言的独特特征。
设计评估：在第二阶段，澳鹏Appen的专家审核员根据详细的标准，评估每个LLM生成图像的质量，包括文化相关性、是否遵循提示说明、设计风格和图片格式等。每个提示的英文版本也经过评估，作为基准，以确保在20多种语言中保持一致性。通过对每个图像提供清晰一致的反馈，澳鹏Appen帮助客户完善其图像生成模型，全面提升AI生成图像的质量。

澳鹏Appen为各种场景提供了本地化的文本提示，并对每种语言进行了数百次评估。每个图像输出都根据特定的文化标准进行了审核，包括以原始英文提示作为比较基准，使客户能够清楚地分析模型在多语言框架下的表现。

通过这种详细、具有文化敏感性的评估方法，澳鹏Appen帮助客户实现了高质量、符合文化相关性的图像输出，确保该设计软件的用户体验得到改善，增强了多样化的国际受众对产品的满意度和参与度。