微软今天宣布,它已经开发了一种新的图像字幕系统,可以自动为图像生成字幕。该公司今天早上说,这项新功能今天首先在Azure认知服务中启动,并将很快传播到Microsoft word,outlook和powerpoint。
Ai模型是用庞大的图像数据集与单词标签配对训练的,每个标签都映射到图像中的不同对象。然后,研究人员对用于字幕的预训练模型进行了微调。训练过程协助模型学习怎么撰写句子。新的Ai模型利用视觉词汇为包含新颖对象的图像准确生成标题。
尽管研究人员承认Ai并不完美,但它比公司产品和服务中当前使用的图像字幕模型好两倍。该研究人员发现,它可以创建比人类手工编写的标题更准确的描述性标题。
微软技术研究员,华盛顿州雷德蒙德的Azure Ai认知服务首席技术官Huang xuedong说:“你们将Ai的这一突破性突破作为Azure的平台,以服务于众多客户。”“这不仅是研究上的突破;在Azure上将突破转化为生产所需的时间也是突破。”
自近期几年以来,微软一直致力于实现一个雄心勃勃的目标,即在其若干产品和服务中注入Ai的力量,以提高生产力。借助这一新的自动图像字幕系统,Microsoft旨在协助所有用户为视障人士访问任何图像中的重要内容。
分享到: