环球360

抖音集团举办“ AI 助力视障群体”技术公益比赛 相关成果将孵化落地

小编

  【TechWeb】1 月 16 日消息,1 月 13 日下午,北京大钟寺的一个报告厅里,由抖音集团产品经理、研发工程师以及清华大学、浙江大学等高校学生组成的 12 支队伍正在进行决赛。5 个多月前,64 支队伍,501 名参赛选手开启了这场 AI 助力视障群体 为主题的技术公益大赛。

  经过三个多小时的角逐,3 号参赛队伍 灵瞳 团队以最高分获得一等奖,他们设计了一款 对话式视觉助手 。这是一款应用于手机和智能眼镜的 APP,初始界面类似相机。它可以听取和理解用户发起的提问,同时点击按钮录制物品信息,它会根据问题提取有效信息并语音回答。

  灵瞳 在交互和视觉技术上的表现得到了评委和观众的一致青睐。交互上,除了连续探索模式,它还可以实现指尖探索,即用手触摸屏幕来告诉用户物品的相对应位置。还有一种功能是对话定位,用户可以先告诉 灵瞳 想要什么样的物品,比如想要寻找一个红色的东西,用户可以拿着摄像头去寻找,一旦你想要的目标出现在屏幕中, 灵瞳 就会提示用户的位置,在屏幕的左侧还是右侧。 灵瞳 还有一些辅助能力,比如找对袜子,线下买衣服, 灵瞳 都可以帮助你做一些辅助信息和判断。

  灵瞳 团队的成员,一名抖音集团的研发工程师在赛后接受媒体采访时表示,他最早的触动来自于身边人——一位好友去年患上视网膜相关的疾病,接下来,他的眼睛会慢慢受影响甚至失明。从那之后,他就开始关注相关领域的技术和研发,直至这次参加比赛。

  其他 11 支进入决赛的团队根据自身的技术特点,还提供了关于视障人群的出行、办公、购物、美妆、游戏等需求的智能解决方案。抖音公益的相关负责人表示,赛后会支持和协助有价值的项目进行孵化和落地,期待它们成为视障群体切实可用的产品。

  比如 BANG 团队,他们为视障群体提供了一款无障碍的创作工具:用 AI 技术实现文本转图、图像编辑、色块成图等功能,支持语音交互方式,帮助视力障碍人群进行便捷创作和表达。

  而 世界和平 团队则从工作场景出发,希望提供一种面向 B 端的 工区无障碍改造 的智能工具,为有视力障碍人群就职的机构提供无障碍化改造方案,以给视障群体提供更加舒服的办公环境。

  相关数据显示,中国目前有 1700 多万视力障碍人士,越来越多的社会力量关注到了他们,并试图用技术和公益的方式来助力他们解决现实的困境。F88体育F88体育