VQA dataset

网友投稿 285 2022-09-17

VQA dataset

原文:

VQA is a new dataset containing open-ended questions about images. These questions require an understanding of vision, language and commonsense knowledge to answer.265,016 images (COCO and abstract scenes)

At least 3 questions (5.4 questions on average) per image10 ground truth answers per question3 plausible (but likely incorrect) answers per questionAutomatic evaluation metric

译文:

VQA是一个新的数据集,包含关于图像的开放式问题。这些问题需要了解视觉、语言和常识知识才能回答。265016图像(COCO和抽象场景)

每张图片至少3个问题(平均5.4个问题)每个问题10个基本事实答案每个问题3个合理(但可能不正确)的答案自动评估指标

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:DoMarketing-营销智库:品牌明星代言年度盘点:六大营销新趋势,谁最出圈?
下一篇:Rdeis的学习-事务
相关文章

 发表评论

暂时没有评论,来抢沙发吧~