陶新乐是一位从事软件开发的高级工程师,也是华为全球160万开发者的一份子,他开发的文字识别软件“白描”目前在华为应用市场上的安装次数已达932万。这次,他将携白描APP参加2020年9月10日-12日举行的华为开发者大会2020(Together),与来自全球的开发者分享、交流、学习彼此的开发经历。 三年前,陶新乐辞去北京的工作,来到云南与女朋友白白一起生活,白白很喜欢读书,经常会一边读书,一边把喜欢的句子摘录下来,为此她尝试使用了不少文字识别软件,不是流程复杂、不够准确,就是费用太贵。因此,陶新乐决定为她做一款好用的文字识别工具。 之所以叫白描,一是因为女友叫“白白”,二是“白描”在美术上的含义更契合它本身的功能。他们还特意将家里养的白猫形象作为白描APP的logo,寄托着“我们都在一起”的愿望。 白白为软件开发提出优化建议和使用反馈 作为白描APP的种子用户,白白会给陶新乐很多软件优化建议和使用反馈,这也启发了白描APP在后续开发出了文件扫描、表格识别、批量识别翻译等功能。 开发过程中,陶新乐利用了HUAWEI HiAI平台,通过调取通用文字识别(OCR)和文档检测校正能力后,文字扫描更准确,边界检测速度也更快。同时,白描还免费集成了华为HMS Core的ML Kit(机器学习服务)。两大平台OCR能力的免费调取,不仅帮助陶新乐节省了一大笔开发费用,更实现了白描从中低端手机到高端手机、从华为手机到非华为手机离线识别功能全覆盖。 “这种全覆盖对于开发者来说非常省力,离线识别能力目前其它服务商也都没有提供。”陶新乐说到。离线识别是指不依赖网络也可以使用应用的功能,这一方面可以让用户数据更安全,识别对象的信息只保留在自己的手机中,不会接入网络;另一方面即使在没有网络或网络环境较差的山区,用户也可以正常使用该应用。 陶新乐与女友白白进行软件调试 白描起初的定位是给像白白一样爱读书的用户提供多方面的便利,但令陶新乐欣喜的是,白描还“意外”地为视障人群开辟了另一片“光明”的世界。 “我通过白描‘看’课程表、歌曲简谱、电器说明书、药品包装盒,甚至在上楼时记不清所在楼层时,也会用它来拍照识别。”视障者安之在描述如何使用白描APP时说道,“假如手机上只能留下一个应用,我的回答会是白描,因为它对我的生活有着实实在在的帮助,帮我‘看到’世界更多。” 白描APP通过集成华为HMS Core AI相关能力,并适配手机中无障碍辅助功能,让“拍照—识别文字—朗读结果”这一过程得以实现,从而让视障人群更方便地知道工作、生活中的各种平面印刷文字。更贴心的是,陶新乐还在拍照识别的过程中加入了语音提醒,帮助他们调整拍照的角度和方式,以便得到更准确的识别结果。 “当我意识到白描APP还能以这样的方式帮助到更多人的时候,觉得自己所做的事情也更加有意义。”陶新乐讲到。 科技有时候只能为部分人所用,但是真正强大的科技应该让每一个人受益,不让任何一个人掉队。产品应用的无障碍使用,就如同现实社会中的盲道,而开发者就是修葺这条“科技盲道”的工人和防止它受阻的清障者。 |