当前位置: 首页 > 科技 > 人工智能 > 干货分享!云翻译携手循证医学,赋能药企数字化转型_腾讯

干货分享!云翻译携手循证医学,赋能药企数字化转型_腾讯

天乐
2020-11-29 15:05:52 第一视角

11月25日,跨国企业智能医疗创新论坛在微软大厦举办,微软医疗行业解决方案专家以及远景科技集团、来也科技、爱特曼的领导者共聚一堂,就医疗和制药领域数字化转型的痛点展开探讨。

爱特曼CPO兼任医学智能事业部负责人周昕为在场嘉宾带来了《云翻译携手循证医学赋能药企》的演讲,引起极大共鸣和广泛讨论。

以下为演讲全文

大家下午好,首先做个自我介绍,我叫周昕,是Atman的CPO,也是医学智能业务的负责人。我之前作为员工在微软工作了很长时间,带领团队开发Bing和Cortana相关产品,在AI产品研发和优化方面比较有经验,加入到Atman后组建了现在的团队。

今天也是第一次作为微软的合作伙伴来到这里,希望能通过我们的产品帮助在座的各个企业加速完成数字化的转型。

首先给大家介绍的是我们的机器翻译产品——爱特曼云翻译(ACT)。爱特曼云翻译是世界领先的成熟的医学机器翻译解决方案,覆盖广泛的医学场景,为医学客户提供最佳服务体验。

典型的应用包括日常的医学文献、会议等文件的翻译,也包含支持像药物警戒、合规申报中的各类专业递交材料,比如PSUR、eCTD等的自动化翻译需求。

产品拥有文字翻译、多格式文档翻译以及行业首创的图片翻译等丰富的功能。同时,为满足企业级应用需求,爱特曼云翻译还支持企业管理及对各类系统的集成。比如在PV领域常用的Argus/Aris等工具,或在专业翻译领域常用的Trados,亦或是更广泛使用的Word等产品,均可集成这款产品。

通过使用爱特曼云翻译,可以帮助企业节约50%以上的翻译成本。同时通过首创的人机结合翻译流程,可以有效提升3倍的效率,大幅提升翻译的速度和业务吞吐量。

爱特曼深厚的技术积累在医学领域形成了独特的竞争力。

爱特曼自主研发的医学机器翻译引擎从2017年的第一家药企客户开始,就大幅超越谷歌等翻译引擎的翻译质量。并且我们还在持续不断的优化完善翻译引擎,超越自我。

在由国际计算语言学协会 ACL(The Association for Computational Linguistics)举办的 WMT 2019国际机器翻译比赛上,爱特曼云翻译团队打败了多个国内外巨头和研究机构,以显著优势,在生物医学赛道上斩获中英、英中双向客观评测和人工评测双料冠军

除此之外,我们的翻译引擎还分别针对非临床、临床、CMC等细分医学领域进行了相应的优化,从而达到在子领域内的最优效果,这也是其他方案不具备的能力。

除了过硬的翻译质量,还有一项能力决定了机器翻译产品的好坏——那就是文档的处理

爱特曼云翻译支持主流的文档格式,如word/ppt/excel/pdf等,通过技术处理,使得正确翻译文字内容的同时,还能够高质量地还原译文格式。

就像上方的示例一样,对于复杂的表格、双栏甚至多栏的医学文献等多种类型的文档,爱特曼云翻译都可以原汁原味地进行翻译呈现,通过中英文对照阅读大幅提升用户的阅读体验。

上方的图片中所展示的,还创新地支持图像翻译,结合了爱特曼云翻译领先的医学机器翻译引擎(文字)、光学文字识别(OCR)、图像处理、自然语言理解等一系列前沿技术,为客户大幅提升图像类型幻灯片的翻译和排版效率。该功能适用于翻译纯图片文件,支持纯图片的PPT和PDF、JPG、PNG、SVG、BMP格式文件。当PPT或者图片上传翻译后,系统对文字大小和颜色都根据原文进行了还原,因此译后编辑工作被极大的减轻,快速提升工作效率。图像翻译功能特别适合经常参加医学会议的用户转录转发现场拍照的课件、海报等内容。

目前整套的爱特曼云翻译是基于Azure的安全可扩展架构实现。系统主要由运行翻译界面的Web服务、执行核心翻译任务的文档处理系统、翻译引擎及相关的语料数据存储系统组成。

对于对数据安全要求比较高的客户,比如翻译机密的递交材料等,我们通常会采用私有云的方案,基于Azure强大的安全基础设施,高效完成翻译任务的同时保证用户数据安全。

另外,对于成本敏感的客户,我们也会通过共享翻译基础设施等方式进一步优化方案。当然,在任何方案的全流程中,我们不会保存、分享或使用任何用户的私有数据,这也是我们选择任何技术方案的首要考虑因素。

我们充分尊重客户对自己商业数据的权力,这也是爱特曼在行业开展合作的基础。

这里给大家分享一个实际的案例。我们目前正在给某知名药企的PV团队部署这样一套方案。

因为政策等因素影响,今年对比去年同期,PV团队需要进行的翻译量暴增了超过5倍,他们很难用传统的方法去解决这个问题。通过充分的沟通,我们采用爱特曼云翻译+PV领域翻译引擎定制的方案,成功帮助他们解决了这一难题。

我们的方案成功让这家企业的PV团队,在规模没有扩大的情况下,轻松接下了这5倍的业务量增长。经评测,对比Google等顶级翻译引擎,Atman的翻译质量有巨大的领先优势;结合少量的人工校对,可以大幅提升翻译的效率和业务吞吐量。

除翻译外,今年我们还重点打造推出了循证医学产品——云端知识管家

产品面向药械研发、临床研究、医学事务等多个领域,提供对医学证据的发现、提取、维护、分析、总结、应用的一站式自动化管理,利用人工智能技术赋能药械企数字化转型与创新,加速科学传播。

目前主要落地的场景包括有医学沟通、医生问询、合规申报等。通过对超过4千万各类医学数据的收集、提取、理解及分析,有效帮助药械企业在医学事务等场景实现大幅度的降本增效的目标 —在每年节约数百万开支的情况下,将领域覆盖度提升至100%,并且时刻保持获取最新的医学证据。

同时,我们也在积极探索这款产品为数字化营销等创新场景带来的前所未有的新机会。

医学领域工作的一大特点就是一切工作都围绕医学证据展开。面对百万级别的数据,用户很难有效地筛选、挖掘和使用这些数据。云端智能管家第一个特点就是采用了机器阅读+垂直搜索的解决方案。

平台全面接入了中英文文献数据、会议数据、临床数据等多种类别的数据,并且采用了贴近自然语言的检索式,方便用户在极低的学习成本下实现一键检索全部现有数据。

上面图中右边就是一个真实的检索式的样例,可以看到它非常容易理解,即便没有学习过检索式的规则,也可以轻松使用和修改。

另外注意到这个检索式中既有中文也有英文,这是因为我们集成了爱特曼的机翻引擎,所以可以实现跨语言的检索,用户不再需要查字典或者记住很多非常难以记忆的医学术语的英文拼写了。

更特别的是,注意到检索式中有一些彩色的部分,我们称之为标签。我们利用AI仿照人阅读的方式,让机器去代替人工阅读,将PICOS等关键信息进行提取,可以看到图中右下方就是经过机器阅读提取过的一篇文章的样例。

通过这种方式,我们可以让用户直接用标签进行语义检索,从而将人工阅读才能做到的筛选变成通过一键式检索自动完成的筛选,大幅提升数据筛选的效率。

药械企业一般都需要为每个产品构建医学证据库,用于上市前和上市后的各类内外部沟通和产品销售推广工作。

传统的方式去构建一个产品的一个适应症的库就需要一个3-5人的医学团队一个月的时间才能完成,并且因为不断有新的证据发表,可能刚构建好的库还没有用,证据就不是最新的了。因为投入很高,所以一般的企业很难推广到所有的产品,导致很多产品没有全面的证据支持,可能错失一些潜在的机会。

另外,因为缺乏统一的标准,每个人每个产品的管理使用方式可能都不一样,无论学习成本还是后期的数据深入分析挖掘都十分困难,分享起来就更麻烦了。曾经听到一个case,因为数据太大,客户会通过快递U盘的方式解决证据共享的问题。

通过我们的解决方案,用户只需要输入少量的关键信息,系统将自动创建检索策略、提取关键信息并自动将信息归类建库,用户只需要几分钟就可以得到这样的一个证据库。自动创建的证据库将所有证据数据以产品为核心进行分类,包含有医学团队关注的基础信息、适应症相关信息,并且可以根据企业需求进行自定义。

整个库会被安全存储在云端,用户可以随时分享、访问,加上少量的人工校验与调整,可以轻松推广到所有的产品,解决前面提到的所有问题。

医学行业是一个特别需要持续学习的行业。

在面对每天动辄超过5000篇文献更新的情况下,医学行业的人员,无论是药械企业职员还是医生,都特别需要能够帮助他们高效学习的工具。借助我们对医学数据的理解和检索等能力,我们通过提供网页端+微信端的方式,深度贴合医学用户的工作学习习惯,帮助他们打通碎片化浏览与沉浸式学习,高效地保持专业积累。

同时,通过订阅基于语义标签的检索策略,加上移动端的收藏、 翻译及推荐等功能,帮助用户更加精准的获取有效的知识,减少信息爆炸带来的焦虑与困扰。

目前这款产品也是基于云基础设施构建,正在向Azure的方案进行迁移的过程中。

因为产品经常要在海量数据的基础上进行操作,除了基础的Azure VM外,还会用到Cosmos DB, Blob及Service Bus等多种Azure基础设施进行数据的安全存储、传递和分布式系统解耦。Azure Key Vault, VNet等不同层面的的基础设施将帮助整体解决方案实现安全可控。

下面跟大家分享几个实际应用的案例。

围上市期产品的一项重要工作就是科学沟通,也就是医学沟通。一般分为对内的部门内沟通、跨部门沟通以及对外面向HCP/KOL等医生的沟通。

通过使用产品的自动化构建证据库+检索订阅推送的方案,对比既往的传统方案,在人力、预算等投入大幅减少的情况下,还将产品覆盖率提升超过70%,证据库的构建时间也由1个月降到了1天。

同时,通过全面结构化产品相关证据,不断通过系统沉淀领域知识,将逐步帮助企业积累数字化资产,为今后的各类业务场景提供医学证据的支持。

目前这个场景已经在某国际知名药企落地,有来自医学、销售、市场准入等多个部门近300名同事在日常使用,并收到了良好的反馈。

另一个场景是,企业的医学人员经常会收到医生关于产品的各类问询

这其中除了一小部分简单的可以从标准的FAQ中找到的内容外,很多内容还需要非常多的时间搜集资料、总结才能够给到合理的回复。

就像这里的例子,医生询问了关于某个药品的药代动力学的相关情况,医学人员需要给到一个大约3页左右的一个回复,包含了主要的情况的总结,产品的说明书以及相应的数据所发表的文献出处及相关文献的摘要。

完成这样一项工作,需要一名有3年工作经验的医学硕士或者博士,花近两周的时间才能完成。

这其中,涉及到使用各类不同的数据库,学习并使用不同的检索式对相同的内容进行全面的证据检索。检索可能会得到几十至几百篇结果,然后需要阅读这些文章,从中筛选、提取出有用的信息,并加以提炼,最后根据回复的格式要求,撰写相关的内容。

这还只是完成了一个回复,想象每年相关的工作量有多么大。但同时这里也存在一个供需矛盾的问题:企业很难找到合适的人去做这件事,成本也比较高,因为对于人员的素质要求比较高。但同时对于能完成这件事的人来说,这又是十分枯燥的事情,往往具备这样素质的人更希望做有创造性的工作。

通过使用产品提供的搜索、中英文对照阅读、分析总结等功能,可以有效的提升工作效率,把原来需要2周完成的事情降低到1天,大大缓解了前面提到的供需矛盾问题。

最后一个例子是用于合规提交相关场景的知识提取

跟前面所述的写作有点类似,这里也是涉及到对海量文章的筛选、过滤、标签提取以及相应的分析计算。与前面场景最大的不同是,这个场景需要提取的标签数量更多更细致,像在器械领域可能会有上百个。

上面图中左边是传统方案和AI方案的效果的对比,也是通过我们的产品会达到的效果。中间的系统就是当前我们在介绍讨论的产品。特别值得一提的是右边的系统,这其实是一整套辅助开发的基础设施。

如何能够在较短的时间、较低的成本提取这么多标签,并且不断优化,依靠的就是这套方法和系统。

通过将医学专家的标注和原始数据进行融合训练,得到一些较高质量的初始模型,结合我们对领域的理解及少量的领域数据,以较低成本快速地完成大量标签的从无到有的过程。

配合完善的反馈优化闭环,不断将用户的反馈及修正数据纳入到系统进行迭代,从而不断提升提取的质量。

整套方案就像是火箭一样,多级推动的系统,为了达成循证场景的最大效能提升,底层的技术、数据和方法通过二级的系统向用户提供可用的产品,通过反馈迭代的方式,不断提升用户的效率与使用体验。

最后简单介绍一下我们公司。爱特曼是一家专注医学领域AI研发和应用的创业公司,成立于2016年,在北京和苏州两地设有办公室。

“爱特曼”是梵语中人类的自我意识的意思。这是我们给公司的一个长远的愿景,希望通过做真正的智能技术,赋予机器这样的自我意识。

我们聚焦于医学领域,公司第一家天使客户就是世界500强药企,到今天为止我们跟国内外50多家药企建立了合作关系,并积累了不错的口碑。

目前公司大部分是研发人员,超过一半来自于微软,从事机器学习与大数据相关的产品研发工作。同时,我们也有自己的医学团队,目的是与客户更好的进行专业交流,帮助研发人员加深对行业的理解,加速跨界融合的产品落地。

但这仍然是不够的。医学行业是一个专业壁垒很高的行业,但又恰恰是最需要数字化技术、人工智能技术帮助的行业。

所以我们非常希望有机会能跟在座的各个企业、以及像微软这样的平台一起合作,我们所取得的任何一点突破也都将帮助在座的各个企业以及整个行业加速发展,共同为患者,为整个社会的健康服务。

提示:支持键盘“← →”键翻页
为你推荐
加载更多
意见反馈
返回顶部