当前位置: 首页 > 科技 > 人工智能 > 每周AI应用方案精选:无感支付;精确诊断多种疾病的AI工

每周AI应用方案精选:无感支付;精确诊断多种疾病的AI工

天乐
2020-06-05 13:51:25 第一视角

每周三期,详解人工智能产业解决方案,让AI离你更近一步。

解决方案均选自机器之心Pro行业数据库。

方案1:无感支付

解决方案简介:

浦东机场存在停车场管理设备落后、收费方式单一等亟待解决问题。在这一问题的困扰下,车辆进出机场的效率低下,机场周边交通及室内停车位缺乏引导,多个航站楼停车场之间无法实现数据互通,停车场财务管理困难。针对浦东机场面临的一系列问题,捷顺科技作为其「无感支付」停车场项目的承建方,在全面考察机场实际情况的基础上,依托视频识别技术、互联网技术、移动支付技术、云计算与大数据技术为浦东机场停车场设计了一套量身定制的改造升级方案。

解决方案详解:

无感支付停车缴费技术,是将停车场车牌识别技术与银行卡快捷支付技术结合,进出签约停车场,用户只需在支付宝内绑定车牌号并开通免密支付即可实现「无感停车」,停车场整体效率提升数倍。

新的停车场系统上线,解决了每日超大车流量的出入管控问题。目前,浦东机场停车场 P1、P2 两个三层停车场进出口规模为 22 进 20 出,共计设置 42 台捷顺 I-Cloud C 系列停车场系统和 4500 个车位设置超声波车位引导/自助缴费终端,同时在应急 5 进 5 出停车场设置 2000 个捷顺捷易通Ⅳ型纸票版停车场系统,可以充分满足日均 30000 的车流量进出管控需求。

新停车场系统支持支付宝「无感收费」缴费模式,用户只需在支付宝内绑定车牌号并开通免密支付即可实现「无感停车」。

同时新系统还支持机场公众号缴费、自助终端缴费、现金缴费、上海交通卡缴费、微信/支付宝缴费等多种缴费方式,充分满足多元化用户的停车需求。 车主无需下车、无需掏现金、甚至也无需掏手机,就能自动完成扣款放行,快速离开停车场。无感支付停车场 0 秒识别车辆,出场后代扣停车费,通行效率较传统收费方式提升 80% 以上。

]据介绍,「无感支付」已经不存在纯技术上的瓶颈,关键是如何平衡投入与产出。

方案2:精确诊断多种疾病的人工智能工具

解决方案简介:

随着人工智能在医学领域研究的不断深入,深度学习的劣势慢慢凸显出来。此前,Google 和斯坦福大学在皮肤癌等病种上出过一系列成果,但是此类成果需要数十万张高质量标注的图像。考虑到一些罕见病的数量,每种疾病都收集数十万张高质量的标注图像几乎是不可能实现的。

这个问题不解决,现阶段 AI 在医疗领域的应用就很难全面展开。张康教授团队采用了一种称为「迁移学习」的技术,就很好的解决了这个问题。

为了验证这个 AI 系统在迁移学习的帮助下能应用于视网膜疾病之外的其他疾病,在本研究中,张教授团队在 10 万张准确标注的视网膜 OCT 图像训练出来诊断眼疾的 AI 系统基础上,只用了 5000 张胸部 X 线图像,然后利用迁移学习,就构建出肺炎的 AI 疾病图像诊断系统。

这个研究集中在黄斑变性和糖尿病性黄斑水肿中,这是导致不可逆失明的两种常见病因。但是,如果提前发现这两种情况,便可以进行治疗。

机器派生的诊断结果与五位检查相同图像的眼科医生的诊断结果进行了比较。除了进行医学诊断之外,AI 平台还产生了以前研究中没有做过的推荐和治疗建议。科学家们并没有把他们的研究局限在眼科疾病上。他们还测试了他们的 AI 工具,收集了 5232 张胸部的 X 光片,用于 AI 系统的训练。根据对胸部 X 射线的机器分析诊断儿童肺炎,这种病是全球 5 岁以下儿童死亡的主要原因。 该 AI 系统在眼病诊疗方面的表现接近于专业的眼科医生,并可以在 30 秒内确定患者是否应该接受治疗,准确度达到 95%以上;并且在区分病毒性肺炎和细菌性肺炎上,准确率也超过 90%。

解决方案详解:

通过获取视网膜组织的高分辨率图像,医生们能够精准地对年龄相关性黄斑变性(AMD)和糖尿病性黄斑水肿等致盲性眼病作出诊断,并提供治疗方案。

张教授团队应用一个多层次的前馈 DNN 概念,将预训练模型 Inception-v3 架构植入到开源机器学习平台 TensorFlow,输入总共约 10 万张准确标注的视网膜 OCT(Optical Coherence Tomography, 光学相干断层成像术)图像,最后开发出可以准确诊断眼疾的 AI 系统。

张康教授团队获取了超过 20 万张 OCT 的图像,并使用其中来自近 5000 名患者的 10 万张图像,训练一款深度学习算法。在经历了大量迭代训练后,这款算法的精准度达到了峰值。张康教授团队采用了一种称为「迁移学习」的技术,把已训练好的模型参数迁移到新的模型来帮助新模型训练,运用已有的知识来学习新的知识,找到已有知识和新知识之间的相似性。

研究人员接下来添加了遮挡测试。在该测试中,计算机识别每幅图像中最感兴趣的区域以及其结论的基础。

通过测试,计算机可以告诉我们它在图像中的位置以便诊断,因此我们可以找出系统为什么会得到这个结果。这使得该系统更加透明,并增加了我们对诊断结果的信任度。 - 张康教授,是加州大学圣地亚哥分校(UCSD)的眼科教授,也是眼科遗传学的首席医师(Chief,Ophthalmic Genetics)。

方案3:网络言论对话数据挖掘

解决方案简介:

研究人员希望其人工智能系统及时发现具有挑衅意味的网络言论,实现网络维稳和谐。

解决方案详解:

数据集:为了进行实验,研究人员们共收集了 1270 次对话,其中有一半在交流后期陷入对喷,另一半则始终较为平和。相关对话由 Jigsaw 方面的「Perspective」API 收集而来,而相关标签则通过 CrowdFlower 以众包形式实现。这些对话的平均长度为 4.6 条评论。

工作原理:凭借这套数据集,研究人员们通过其构建的「真实设备表意礼貌」机制对对话内容进行描述。该机制属于一组判断准则,用于分析对话内容是否包含友善性特征例如使用大量『谢谢』或『请』等字眼),以及是否包含表示欢迎辩论立场的词语。例如『我认为』、『我相信』等短语。此后,他们开始借此分析真实评论,看自己的系统到底有没有学会预测只言片语中流露出的吵架意向。

结果:在对数据集中的争吵对话进行预测时,人类的判断准确率约为 72%。而研究人员们设计出的人工智能系统,单纯依赖于逻辑回归,可实现约 61.6% 的准确率,且基准判断,基于词袋模型与情感词典,约占 56%。此项技术的另一变体获得了 64.9% 的准确性,但其训练数据量更大,所以并不一定能说明问题。此外,考虑到其使用同一套训练语料库,目前也不清楚这一变体是否存在过度拟合。

研究人员还推导出一些统计相关性结论,能够帮助人类与机器更准确地发现容易变成骂战的评论。「我们发现直接的表达与人身攻击之间存在着一种粗略的对应关系。具体来讲,直接加以反问或者以第二人称开头的评论往往更容易把讨论双方的负面情绪激发出来。这种效应与我们的直觉判断保持一致,这意味着双方的直接性对话可能令人感到一些潜在敌意,或者说是加强了争议的客观存在。」

方案4:医院信息化平台技术

解决方案简介:

华山医院的数据中心汇集了过去 16 年医院系统数据,近 10 亿条记录,已接入 80 多亿条,涵盖门诊、住院、医技、检验、手术、财务等十几个领域的数据,为深度数据分析利用构建了坚实的数据平台。

医院里还是以非结构化的数据为主,实际应用当中的痛点是可用的优质数据不多。为此,华山医院从2013 年起,利用平台的方式做成一个数据中心,通过平台来扫盲,找出医院面临的各类问题。 平台的持续性改进中,临床用药是重要部分。

在两年时间内,医院在临床药师工作方面做了基于数据层面的工作,在医嘱中已整合了个性化给药。通过在数据平台中药剂科的给药模型与临床医生的整合,根据病人生理和病理的数据,基于模型直接把计算结果反馈给临床医生,临床医生会根据结果给病人很精准的剂量,同时基于药物的监测去回顾看病人的用药依存效果,实现精准医疗。

还有患者主索引,医院要建队列做随访,首先要进行标化。华山医院每日的门诊里面约 60% 是上海的医保病人,40% 是外部的病人,因为患者如不实名制就医,其 VID 很难进行标化。

解决方案详解:

因为华山皮肤科较好,故建设数据中心的时候医院先将皮肤科的数据纳入尝试。后来由医务牵头,让各个科室固化各自科室的诊断名称,制定医院内部的诊断编码。而国家的 INCD10,INCD9,包括上海卫计委出台的一套编码统统作为外部编码。

从运营管理的角度来讲,医院面临的最大困难是绩效分析不佳。因为医院的科室体系非常复杂,有绩效的科室体系、医疗服务的科室体系,可能还有其他科室体系,数据标法多。

这些不同的科室体系都用一套标准是行不通的,在做集成平台的时,院长牵头,把各个科室聚在一起构建了一套完善的科室体系,甚至包括医院的人也做了一定的标准化。很多的电子病历、电子医嘱的录入由研究生和基地医生在做。

做主数据平台的时候,医院为做全主数据,建立了一套学员管理系统,确定系统跟系统之间的交互以及术语的约定。在传统的 HIS 里面,包括电子病历、赏罚系统、超声系统等,同一事物在不同系统里面的定义不同,平台可解决该问题。在建立患者主索引方面,医院按照身份证,或根据医院的就诊卡,甚至是将病人的姓名,性别、年龄等基本特征整合,再进行统一的标化。

方案5:图像分割、无缝克隆技术、3 色信道

解决方案简介:

使用了卷积神经网络,并训练使其能够从一个人的照片的非结构化集合中获取目标身份者的外观。通过将该面部交换问题描述成一种风格迁移问题而实现,而风格迁移的目标是将一张图像渲染成另一张图像的风格。 解决在图像中进行面部交换(face swapping)的问题——即在保持原有姿势、面部表情和光照的同时,将一个输入的身份转换成一个目标身份。

解决方案详解:

公司设计一种能让该网络生成高照片真实度结果的新损失函数(loss function)。通过神经网络和简单的预处理与后处理步骤的结合,公司的目标是无需来自用户的输入就能实现实时的面部交换。

具体操作: 将输入图像 A 的姿势和表情作为内容,输入图像 B 的脸作为风格,假设对应两组图像,同时系统有两个另外的组分用来做脸对齐(face alignment)和背景/头发/皮肤分割。 假设所有的图像(内容和风格)都与一张前向视角的参考脸。这可以通过一个仿射变换(affine transformation)实现,这需要将给定图像中的 68 个面部关键点对齐到参考的关键点。 面部关键点是使用 dilb 提取出来的。

使用了分割来恢复来自输入图像 x 的背景和头发,而 x 目前还不会被变换网络(transformation network)保存。使用了 OpenCV 中的一种无缝克隆技术(seamless cloning technique)来拼接背景和所得到的面部交换了的图像。一个带有分支的多尺度架构,这些分支在输入图像 x 的不同下采样版本上执行运算。每一个这样的分支都有零填充的卷积(zero-padded convolution)模块,其后还跟着线性修正(linear rectification)。这些分支再通过相差一倍的最近邻上采样(nearest-neighbor upsampling)和沿信道轴的级联(concatenation along the channel axis)组合起来。 该网络最后的分支是以一个 1×1 卷积和 3 色信道结束的。光照网络是一个 siamese network,其被训练用于最大化带有不同光照情况的图像(输入 A 和 C)之间的距离和最小化带有同等光照的图像(输入 A 和 B)之间的距离。这个距离被定义成了全连接层的特征空间中的一个 L2 范数(norm)。

提示:支持键盘“← →”键翻页
为你推荐
加载更多
意见反馈
返回顶部