Echo

Echo 关注TA

大家好,我是Echo!

Echo

Echo

关注TA

大家好,我是Echo!

  •  普罗旺斯
  • 自由职业
  • 写了309,770,225字

该文章投稿至Nemo社区   资讯  板块 复制链接


两年时间过去,微软这个应用离盲人“看到”世界又了进一步

发布于 2019/03/14 15:57 571浏览 0回复 1,585

2016年4月,微软向全世界展示了一个特殊的眼镜。

它外表看上去平淡无奇,但内置了摄像头与麦克风。当有人戴上它时,只需轻轻触摸,眼镜内置的摄像头就会捕捉面前的画面,并通过AI系统分析后告诉用户这是什么,无论是周围的环境、物体还是人的表情,用户都能立即知晓。

这项技术的核心开发者是一位叫萨基博·萨科(Saqib Shaikh)的微软员工,他是一位盲人。萨科相信AI技术的可能性,于是他尝试开发了这样一副眼镜,并将其称为Seeing AI。2017年,微软基于萨科和团队的研究,推出了一款移动应用Seeing AI,让萨科的愿望在每个人的手机上更进一步实现。

如同当年那个神奇的眼镜一样,Seeing AI这款应用能借助AI技术来分析周围的物体,通过手机镜头捕捉到的文字、条形码、图像等直接「口述」出来传达给用户,让他们得以「看到」周围世界。我们也在App发布后带来过第一时间体验。如今,两年时间过去,3月12日微软大幅更新了这款应用,这一次它离「看见」的目标又进了一步,极客之选也第一时间下载下来体验了一番。

更丰富的体验

和两年前相比,Seeing AI最大的变化在于功能的进一步完善(但依然不支持中文)。在原来支持人物、短文、文本、条形码和场景识别的基础上,如今的Seeing AI还加入了颜色(Color)、手写体(Handwriting)、光线(Light)的识别功能,这些功能对盲人朋友来说不但实用,而且也易于上手。

颜色功能是通过手机的后置摄像头来捕捉画面当中出现的颜色,并直接用语音传达给用户,它的处理速度很快,因为这一功能相比场景识别更简单。不过颜色识别和场景识别的作用并不一样,比如当盲人朋友买衣服或者鞋子的时候,这个简单的功能其实非常有用。

手写体识别的功能则接近于之前的文本识别,但细分出来可以更好识别出某人手写的信件或者菜单之类的图像信息,很遗憾经过尝试,手写体也同样识别不出中文语言,但对英文和阿拉伯数字识别准确率已经非常高,可以满足日常使用。

光线这个功能比较特殊,在摄像头捕捉到明暗程度不同的画面时,它会通过高低不同的声音(听起来类似蜂鸣)来表示当前场景的光线强度,这个功能我想象不出具体使用场景,但对于盲人使用者来说,或许也会在一些特定场合起到作用(比如晚上睡觉关灯?)。

不仅仅是这样的细分功能尝试,Seeing AI本次更新还有一大亮点,它终于支持浏览手机相册了。盲人群体虽然看不见世界,但他们也会用手机拍照,或者保存一些有美好回忆的照片在自己相册,新的Seeing AI可以直接打开每一张照片,给手机前的用户讲出每张照片的内容,并且告诉他们照片拍摄时间、地点,这不得不说是非常贴心的功能。

技术摆脱黑暗

利用AI技术来帮助弱势群体这件事,微软似乎做过很多尝试。

比如我们曾经介绍过的能帮助帕金森病人更好写作和吃饭的智能手环,以及能帮助「渐冻症」患者进行输入的眼球追踪,这些看起来和普通人距离较远的技术,在有的公司看来或许并没有多少经济价值,但对很多弱势群体来说却是能彻底改变生活的技术。

也正是这个原因,作为微软工程师,同时也是一位盲人,萨科才会不断将Seeing AI这样的技术努力开发出来,他明白对于盲人来说可以「看到」世界是一个多大的诱惑,而在一步步的推进中,此次Seeing AI的更新,更进一步实现了很多人想象当中的「看见世界」的愿望。

AI技术的更多可能性在被我们发掘,现在的手机正在一步步变成很多人的眼睛,也许它未来还将会代替一些人的耳朵,或者代替一些人的双腿,也许,正因为那些社会中的「不同声音」的存在,我们才能发现技术的更多可能性。不过目前,Seeing AI这款应用只能在美区App Store下载且只支持英文,但或许不久的将来,我们能看到更多语言版本的Seeing AI出现帮助身边这群特殊的用户。


本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/414/305.htm]

本文标签
 {{tag}}
点了个评