他家系统识别医生话语 不用动笔生成电子病历 精准度95%


 中科汇能创始人杨文骥


文| 铅笔道 记者 毛宁


 导语


早已过了下班时间,公司的全部员工却都守在电脑前不发一言。


当时,团队研发的“医语通”正攻克语音识别95%精准度的难关。此前,这关已经让团队失败了三次。 “成功了!”霎那间十几个人炸开锅一样,跑过来提醒杨文骥,分享喜悦。


回想起过去三个月,所有人都为把识别精准度从90%提升到95%而倾尽全力,杨文骥看着欢呼雀跃的伙伴们,眼眶有些湿润。


拥有95%语音识别准度的“医语通”是一款电子语音病历系统,主要面向医疗机构销售,帮助医疗人员通过语言输入生成电子病历,目前可识别八种带口音的普通话(四川普通话、广东普通话等)。


医语通”已与十家医院达成基本意向合作,预计3月底正式推行市场使用。


 

 

注: 杨文骥承诺文中数据无误,为其真实性负责,铅笔道已备份录音速记,为内容客观性背书

做款人工智能产品

上世纪末在上海交通大学当了三年老师之后,杨文骥便清楚地规划了人生路线。不想被校园体制束缚着人生价值,工程技术出身的他决定一步步转型,做项目、干销售,最后运营自己的公司。


2009年,他有了真正意义上属于自己的公司,做的是自己擅长的领域——通讯行业。四年来,盈亏平衡,但自觉持续发展性有限,杨文骥决定放弃。


2015年年底,正值人工智能行业发展,杨文骥萌发了一个念头——做一款软硬结合的终端智能产品。但自己并不太擅长人工智能技术,思考之际,他想到了一位老乡。


对方研究人工智能已有很长时间,在业内也有一定口碑。杨曾与他也在聚会上遇见过,但都是各谈各的,没有太多交集。思来想去,他决定试一把,按下拨号键,简单介绍意向后便邀请对方当面详谈。


两人在之后的谈话中更加投机。杨文骥提出做一款盲人导航眼镜,能识别斑马线、红绿灯和道路障碍物等,并可实时语音播报。在进一步探讨后,他们又放弃了这个想法,“种子期阶段可以获得的投资额不足以支撑到完成这个产品的雏形开发”。


从实际出发,杨文骥觉得,要做就做一个能较快完成硬件产品的项目。去年8月,在结合投资人的意见后,两人把焦点聚在了医疗行业人工智能产品上。


随后,他在与约谈的医疗人员口中得知,病历录入对他们而言很是困扰。原来,医院为了电子系统化,要求医护人员用电脑输入病历。键盘输入不及手写方便,数字符号不断切换,效率明显降低,“一分钟也就录20个字”。


两个月后,杨文骥初步明确项目方向:面向医疗机构人员研发一款语音电子病历系统。医生们只需要对着麦克风说病情,系统便能同步转译为文字,并记录到电子病历档案中。


95%语音识别准度

去年10月中旬,“医语通”项目正式启动。要做一款语音识别智能系统,首先要解决的便是语料问题。


系统需要提前对语料进行适配,从而确保即时、准确转译。团队分别从医院、网络端和语料公司等获取大量医疗行业的语料,其中包括了医用专有名词、病历内容、各类医学文献和著作,甚至还有文言文类的医学语言。“有些中医从业者,文字功底很强,都在用古文方式记录病历。”


另一个重点是地域口音的适配性,即对说话者口音的适应。不同地域的人所说的普通话都一定程度带有当地口音,完全以统一标准适配不太现实。于是,团队开始为有意向合作的落地医院进行地域口音采集。目前,“医语通”已能识别八种带口音的普通话,如川普、广式普通话等。


在医院安装了整体系统后,医护人员只需将语音设备插入电脑或者Pad等移动端,便能实现语音输入。在办公室坐着,或在查房时走动,“医语通”都能自动排除其他环境噪音干扰,获取有意义的信息。杨文骥称,除非在车水马龙的马路上可能会受干扰,“医语通”一般情况下都能保证准确度。


此外,“医语通”为合作医疗机构提供私有云服务,即搭设对接医院内部系统,可自动将电子病历上传到中心系统,保密性也更高。公有云版本可通过“医语通”合作的 App上使用,但出于医院系统对病人信息的私密性要求,公有云只能语音转译病历供参考,无法自动上传到中心系统。


在语料收集到200万条时,“医语通”便已达到90%的识别精准度。近期,团队历经3个月时间,收集整理近4000万条语料后,最终将精准度提升了5%。


今年1月初,杨文骥获得创业工场一笔天使轮投资。而下个月月底,“医语通”将正式推向市场销售。在产品正式销售之后,杨文骥将启动下一轮融资,预期金额1000万~1500万元。


目前杨文骥已与10家医院洽谈合作。下一步,他打算将提高产品服务、进一步推广宣传作为工作重点。