QQ空间联合腾讯 AI Lab,让视障者也能“看到”图片

2018年01月28日 1571阅读

*文章来源:腾讯QQ

*原文标题:我们上线了一个小功能,让视障者也能“看到”图片

很多时候,我们已经习惯于用图片承载想表达的信息,无论是表情包还是风景照,都比用文字表达来的更直接更便捷。但对于视障用户来说,他们虽可以借助智能手机里的读屏功能听到文字,却依然无法了解文章中配图的内容、社交平台上好友分享的照片、聊天时对方发送的表情……

那么,如果我们可以利用人工智能的识图能力,让图片“说话”呢?

图:AI技术,让图片会“说话”
图:AI技术,让图片会“说话”

在最新安卓版QQ空间APP中,我们增加了「图片语音即时描述功能」,借助腾讯AI Lab的技术,能够将图片识别成一句文字描述。这意味着,视障用户借助科技的力量也能“看到图片”,了解图片的内容。

 

是的,在8亿多鹅粉里,不乏视障用户的身影。之前,他们只能了解好友发布动态中的文字,遇到只有图片没有文字的动态时就需要旁人解释,或者只能知道这条动态里有图片,和好友评论互动显得非常困难。现在,图片的内容能够以文字的形式被朗读出来,无疑使视障用户获得了更好的社交体验。

图:最新安卓版QQ空间APP的图片描述功能

使用安卓系统的小伙伴只要打开手机里的系统设置→辅助功能→开启talkback,随后打开最新版QQ空间APP就能体验图片描述功能。

一直以来,QQ空间都会努力做出一些专为障碍用户的更新,让科技成为他们的贴心小助手。而QQ空间团队也一直在主动关注和聆听着障碍用户的需求,这一次图片无障碍功能的灵感,就是来源于2017年QQ空间团队与深圳信息无障碍研究会的一次交流。

为了让无障碍功能更实用、体验更好,在正式上线之前,QQ空间产品团队还邀请视障伙伴们测试和体验,并持续收集视障用户在体验过程中给到的反馈和建议,对功能进行不断优化。

刚听说QQ空间客户端推出可以描述文字配图的功能时我有些错愕,因为自己一直也没想到会有一天能有这种体验。怀着好奇试了一下,正好一个好友在晒她做的美味,虽然空间客户端的图片描述没有告诉我那是什么饭,但却说“图片——一名女士在吃饭。”
 
可能你不会觉得有什么,甚至认为参考性不是很大,但对我而言却仿佛打开了一扇全新的大门。
 
之前我对于一般熟的好友动态,只会通过文字揣摩他要表达的意思,关系好的才会评论问图片是什么?而以后这一步基本可以省掉,在也不必让好友描述配图了。
就在刚刚,我给那条分享美食的好友评论:你做的美味,看起来很好吃的样子。看到我的评论她立刻秒回,表示特别惊讶,因为她只发了图片,没有配任何文字。

这是其中一位参与内测体验的视障伙伴的评价,科技带给他的惊喜和改变着实不小。

其实,此次图片描述功能所用到的图像识别生成技术,许多鹅粉在之前我们推送的让AI为你的2017年「尬歌」一首》内容中就有所认识,并纷纷感叹AI的识别和描述能力。(还未体验过的同学可以点击蓝色字体

通过图像识别生成技术,AI能够理解图像内容并学习和组织语言,以通顺并符合人类语言习惯向用户表述图片。"图像描述生成"技术由腾讯AI Lab提供,该自主研发的强化学习算法在国际顶级大赛MS COCO的该类别挑战赛上排名第一,超越微软和谷歌等公司。

虽然我们在最新版QQ空间APP里加入AI增加了“图片描述”功能,但这只是我们在无障碍社交领域的一小步。无论是QQ还是QQ空间团队,都会听取每一个使用者的反馈和建议,不断改进误差,优化大家的使用体验。

除了视障者之外,还有更多的听障者、老年人以及认知障碍人士需要方便、无障碍地获取信息,我们希望能有更多的障碍用户能够凭借科技的力量了解更广阔的世界,这也是我们始终坚持并为之奋力的目标。

P.S. 最新版QQ空间APP已于安卓端上线,使用iOS系统的小伙伴过不久也能更新版本,体验图片描述功能。