科技无障碍快讯 | 人工智能在无障碍领域的五个新思路

2018年03月05日 1487阅读

为了方便大家了解当下应用科技改善信息无障碍问题的案例,拓宽信息无障碍创新解决新思路,信息无障碍研究会将持续收集备受关注的创新科技,不定期分享给业内人士和各位用户。

QQ空间图片描述功能

让视障者“看”图片

 

图:来自《科技日报》报道配图 视障者正使用QQ空间图片描述功能

图:来自《科技日报》报道配图

视障者正使用QQ空间图片描述功能

 

日前,腾讯宣布在安卓版QQ空间客户端融入腾讯AI Lab提供的"图像描述生成"技术,让视障用户也可以“看到图片”。腾讯AI Lab图片描述生成技术一般都是基于编码器—解码器框架。这一技术的难点在于设计出能够充分理解图像内容的模型,进而将相应编码的图像内容再‘翻译’成自然语句。QQ空间团队与信息无障碍研究会一直保持着长期稳定合作。QQ空间的图片描述功能的灵感,来源于与信息无障碍研究会的一次日常探讨,视障工程师提出的建议。

 

这次,QQ空间借助AI技术,为图片自动添加描述文本,能够让视障者通过读屏软件,以听觉(读屏软件)、触觉(点显器)等感官了解图片内容,在QQ空间这个社交场景实现了图片信息的多重感官的传递。QQ空间是国内率先将人工智能应用在信息无障碍领域的社交产品。海外社交网站Facebook此前也推出了与QQ空间“图片描述”相似的功能。

 

国内的信息无障碍优化,大多是基于对读屏软件兼容性的优化,而这次QQ空间团队利用人工智能技术升级产品体验,让各界人士看到了科技赋予更多信息无障碍的可能性。

 

谷歌MLCC课程

无障碍在线教育新思路

 

图:谷歌Learn with Google AI课程官网介绍页截图
图:谷歌Learn with Google AI课程官网介绍页截图

 

 

近日,谷歌推出了Learn with Google AI在线课程项目。其中“机器学习速成课程”(英文简称“MLCC”)已于 3 月 1 日上线,供全球人工智能爱好者免费学习。除了“免费”这个亮点,谷歌的的MLCC课程还有另外一个亮点:利用谷歌的人工智能技术,英文讲师的授课内容可以即时翻译成包括中文在内的多种语言的语音。

 

技术原理是谷歌先把英文讲师的语音转为文本,后将文本翻译为机器中文配音,并根据机器算法按照讲师的语速、停顿等即时播放机器配音。用媒体“量子位”的说法是,在线课程做成了译制大片的既视感。

 

这项在线课程即时翻译配音功能惠及的是众多自称“英语废”的学习者,以及包括视障人士、读写障碍人士在内的障碍人士,为无障碍在线教育提供了新思路。虽然学习MLCC的课程需要一定的高等数学和编程基础,有一定的学习难度,并且因为机器翻译的缘故会有一些翻译上的误差,但这仍然是一个让人为之鼓舞的好消息。

 

试想,如果日后有人工智能作为同声传译助手,包括障碍人士的所有人便能第一时间享受到国内外先进课程的资源,通过自主学习实现自我提升。

 

天使眼

“共享助盲眼镜”计划

 

图:来自媒体Maxidea极创意的视频报道截图
图:来自媒体Maxidea极创意的视频报道截图

 

在国内,由上海肇观电子科技有限公司生产的“天使眼智能眼镜”是为视障人士熟知的电子科技产品。

 

天使眼智能眼镜前方双目立体摄像头模拟人眼采集前方物体位置信息并转换成听觉信号,再通过骨传导耳机传达,即时提示避障,自动定位导航、智能识别物体。天使眼同时适用于不同类型的视障人士比如全盲、低视力等,为视障人士提供安全、便捷的出行保障。

 

最近,官方还推出了天使眼“共享助盲眼镜”计划:通过共享天使眼智能眼镜,为视障群体提供更便利的出行辅助,帮助视障人士安全避开日常出行时遇到的楼梯、坑洼、车、门、树、栏杆、人等障碍物,并识别文字、钞票、颜色、斑马线和手机等常用物品。

 

肇观电子作为一家专注于人工智能和计算机视觉系统和芯片的科技公司,天使眼于2017年7月投入量产并面向全球发售,是世界首款采用计算机视觉及人工智能技术辅助视障群体感知世界和出行的智能眼镜。

 

来自官方的数据是:搭配天使眼智能眼镜使用的天使眼APP下载量已经突破10万次;2017年11月上线的天使眼导航功能已为视障人士提供82695公里的导航服务。

 

微软Soundscape应用

辅助视障人群更好地探索城市

 

图:微软Soundscape官方介绍页截图
图:微软Soundscape官方介绍页截图

 

微软从2011年起,就与英国导盲犬组织合作,一个“视障耳机”的概念,并且在过去的几年,不断改进新产品模型。

 

如今,微软的这个项目有了新进展:微软发布了名为Soundscape(音景)的新应用。按微软的官方说法,Soundscape应用是通过3D音频技术,为视障人士提供地点导航和探索服务。

 

看了他们的官方宣传视频,可能更为容易理解一些:当开启Soundscape应用,戴上立体声耳机,使用者在路过包括商店在内的地标或道路时,Soundscape就会读出地标或道路的名称。使用者也可以对自己本身熟悉的地方添加标签,下次再经过同样地方的时候,就会自动播报。

 

微软称,Soundscape不仅仅是为了辅助视障人士了解路况,更希望这款应用能让视障人士更好地探索和发现城市。目前这款应用已上架ios版本。

 

 

Oton智能眼镜

解决阅读障碍的黑科技

 

图:Oton智能眼镜原型
图:Oton智能眼镜原型

 

不知道明眼人小伙伴有没有遇到过这样的情况:看文本太久,眼睛累了,心想如果文字能自己朗读就好了。对于明眼人来说,文本自动朗读可能是缓解疲劳的一种方法,但对于全球的读写障碍人士来说,却是能解决很多实际的生活问题。

 

据外媒报道,日本Oton公司正在众筹开发一款智能眼镜,以解决读写障碍问题。Oton智能眼镜的镜片内置有摄像头,当使用者阅读文本时,摄像头会追踪眼球并识别眨眼动作,眨眼的一瞬,Oton智能眼镜会捕获文本并上传到专有云系统上进行文本分析,然后转为语音,最后通过眼镜侧旁配置的耳机进行播放。

 

如果系统无法识别或读取文本,Oton还提供远程人工服务。据悉,创始人Keisuke Shimakage在东京大学读书时,父亲因脑梗塞损伤,阅读文本时产生了障碍。为了帮助父亲,他投入到Oton眼镜的研发设计中。后来父亲痊愈,他还是坚持把项目完善,因为相信这个产品可以帮助到更多的读写障碍人士。这让人不由自主地想到,乔布斯也是因为自身的读写障碍问题,而在苹果手机里开发了VoiceOver旁白功能。

无论是人工智能、硬件革新,还是软件升级,通过上面这些例子,我们可以看到:科技一直有着自有的温度,不断推动着社会公平、科技人文关怀的前进。我们期待有更多的创新产品、应用、功能的出现,让人与人之间,能无障碍地沟通,无障碍地生活,享受科技带来的进步与便利。