Discuz! Board

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 24|回复: 0

英语摄影斯瓦希里语摄影泰

[复制链接]

1

主题

1

帖子

5

积分

新手上路

Rank: 1

积分
5
发表于 2024-5-8 18:50:33 | 显示全部楼层 |阅读模式
卢固语摄影麦凯萨维奇摄菲律宾人摄影中国摄影示例图像展示了带注释图像的地理多样性。在许可下使用的图像。字幕生成总共所有张图像每种语言张图像均以所有种语言进行了注释每种语言平均有两个注释总共产生了个字幕。注释器以个图像为一组进行工作。第一个屏幕显示所有张图像其英文字幕是由经过训练的字幕模型生成的该模型经过训练可以输出<>在<>中执行<>形式的一致风格通常带有对象属性例如例如微笑的人红色的汽车等。注释者被要求对标题质量进行评分给出的指导方针是从优秀到糟糕的分制再加上信息不够的选项。此步骤迫使注释者仔细评估字幕质量并促使他们内化字幕的风格。

接下来的屏幕再次显示图像但单独显示且没有英文字幕并且要求注释者以目标语言为每张图像生成描述性字幕。选择的图像批量大小以便注释者能够内化样式而无需记住确切的标题。因此 南非手机号码列表 我们期望评估者仅根据图像内容生成字幕并且不存在翻译伪影。例如在下面所示的示例中西班牙语标题提到泰语标题提到而英语标题中都没有提到。还为注释者提供了创建字幕时使用的协议从而实现了跨语言的风格一致性。布莱恩索利斯摄 英语 陈列室中的一辆老式跑车和许多其他老式跑车品牌老爷车一排排展示西班牙语 画廊车展中的经典跑车—画廊车展中的经典跑车车展上编号为的小型银色赛车泰国 展览中排列着五彩敞篷车—展览中排列着五彩敞篷车几辆老式赛车在展会上排队—几辆老式赛车在展会上排队。





三种不同语言的示例标题共种请参阅论文附录中的完整标题列表展示了跨语言风格一致的注释的创建同时没有直接翻译工件例如直接从英文版本翻译时西班牙语的或泰语的是不可能的。图像在许可下使用。字幕质量和统计数据我们对每种语言进行了两到五项试点研究以解决字幕生成过程中的问题并确保高质量的字幕。然后我们手动评估字幕的随机子集。首先我们随机选择了张图像的样本。然后为了衡量特定语言的字幕质量对于每个图像我们选择手动生成的字幕之一进行评估。我们发现种语言中有种语言的字幕评分为好或优秀的比例在以上其余都在以上。种语言中有种语言被评为差的字幕比例低于其余均低于。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Comsenz Inc.

GMT+8, 2024-5-20 09:34 , Processed in 0.052988 second(s), 18 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表