“微软为视障人士提供的新AI自动字幕像”
微软的新ai被设计为在文档和电子邮件的图像上自动添加字幕,以便视觉障碍软件能够读取图像。
微软的研究者在关于该存储库arxiv预印的论文中说明了机器学习模式。
该模型采用视觉语音词汇预训练( vivo ),通过大量配对图像标签数据学习视觉词汇。
然后,采用带有适当字幕的图像的第二个数据集,有助于教ai如何最好地解释图像。
理想情况下,所有人都需要在文档、互联网和社交通信媒体上添加备用副本,以允许盲人访问副本并参与对话。 但是,很遗憾,人们没有。 微软ai平台团队的软件工程经理saqib shaikh说。
一般来说,研究者希望ai能够提供是微软现有字幕系统两倍的性能。
为了以新ai的性能为基准,研究者将其纳入了无上限的挑战。 写这篇文章的时候,微软的ai现在排名第一。
无上限的挑战实际上怎么描述在训练数据中没有看到的什么罕见的物体? 微软研究室首席执行官王丽娟发表了评论。
由于azure cognitive services的computer vision软件包中包含此功能,因此希望使用microsoft自动字幕ai构建应用程序的开发人员可以执行此操作。
微软令人印象深刻的seeingai应用程序将使用新的ai进行更新,该ai用计算机视觉描述视力受损的人周围的环境。
图像字幕是能够实现广泛服务的核心计算机视觉功能之一,azure ai识别服务微软CTO Huang Xuedong说。
黄伟继续以ai的这一突破作为azure的平台,为越来越多的顾客服务。 这不仅仅是研究上的突破,用azure把突破变成生产所需的时间也是一个突破。
本文:《“微软为视障人士提供的新AI自动字幕像”》
心灵鸡汤:
免责声明:学习富国网免费收录各个行业的优秀中文网站,提供网站分类目录检索与关键字搜索等服务,本篇文章是在网络上转载的,本站不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,本站的工作人员将予以删除。