English
 您当前所在位置:首页 » 视点动态 » 研究成果 » 产业洞见
AI x医疗是个伪命题吗? ── 中恒星光产业洞见系列(28)
 中恒星光RDDM组          2017-08-14


人工
智能在近来是炙手可热的话题,特别是医疗领域,已经成为人工智能现在最火的应用场景之一科技巨头、创业公司纷纷进驻,相关的新闻铺天盖地袭来那么医疗领域是否真的需要人工智能?当前的应用场景、难点困境又是哪些呢?

医疗需要人工智能吗?
如同前几年的大数据一样,人工智能似乎已经成为当今公司用于标榜、宣传自身技术先进性的“万金油”标语,从当前人工智能的发展进度来说,人工智能起码在短期内仅适用于部分场景,特别是那些存在流程繁琐复杂依靠人力重复劳作、数据量过大有一定规律可循、需要大量经验积累动态发展人力难以预测问题领域最适合人工智能的发展,而医疗领域恰恰存在这些问题。
我国存在非常严重的医疗资源供给不足的问题。我国病患数量规模庞大,医生数量严重不足,并且分布非常的不平衡,优质的医疗资源都集中在发达地区,在基层医疗机构有非常严重的医疗资源缺口。特别是在医生资源方面,举个简单例子,我国单病理科人才的缺口就达10万现有2万),不用说其中经验的资深医生缺口了。并且,由于医生能力的过度依赖,造成不同地区间基层医院与三级医院间的医疗水平差距巨大。目前国家正在主推的分级诊疗,目的就是缓解医疗资源供需不均问题,将80%的普通疾病筛查放在基层医院,而将20%的疑难杂症放在三级医院交由专家检查但在执行上受到了基层医生数量少、水平不足问题制约,推动十分缓慢
而在资源供给不足的前提下,又存在着对医生资源的浪费现象,进一步加剧供需不均的问题。现代医学虽然经过长久的积累和发展已经取得了相当大的成就,但在临床治疗上,许多领域仍然没有坚实的理论支撑和量化诊疗标准,导致临床治疗对医生的依赖性太大需要依靠医生的经验等来弥补理论的缺失。因此医生需要深度介入到病人从前期诊断到后期治疗过程中所有环节,以保证实施有效、正确的治疗方案。在这其中,医生需要做大量的重复性劳动,例如影像、病理诊断都需要以人力去完成对大量数据的筛查、分析,这些机械性劳动实际有一定的规律可循,是最适合由机器完成的,用宝贵的医生资源去完成这些任务医疗资源是非常大的浪费
如果机器能够在一定程度上代替人工,解放医生精力的同时,又能提供平均水平之上的诊断、治疗解决方案,那么必然会对解决当前医疗问题起到关键性的作用这就是人工智能在医疗领域未来的发展方向。

 
影像是人工智能最先落地的应用?
医疗领域,智能图像识别主要包括医学影像病理学图像两类,由于市场规模够大,其痛点最明显,加上基础理论研究蓬勃发展,因此成为最常见的人工智能应用领域之一
在医学影像中,由于病灶往往形态各异,经常出现同病异影(同一病变可有不同的影像表现)、异病同影(不同的病变有相似的征象)现象,缺乏诊断的量化指标,导致医疗影像的解读需要长时间专业经验的积累医师间的水平差距过大。资深影像医师的稀缺,因此基层医疗机构难以满足患者需求。此外,医影像包含了海量的数据,真正病灶可能仅仅占全图像的千分之一,即使是资深医生也往往无从下手,需要花费大量功夫看片、解读,并且可能有八成的病患都是健康的,但同样要花费大量时间诊断。放射科医生在诊断常规的CT扫描图像需要10-20分钟,并且需要花费10分钟来进行撰写诊断报告时间过长。并且在这种情况下,解读的结果往往不尽如人意根据WHO调查,我国每年影像误诊人数高达5700多万,误诊现象主要发生在基层医疗机构
病理诊断面临着医学影像同样的问题。病理科医师数量稀缺程度远比影像医师来得严重,一名资深病理科医师可能需要长达15年的培训和经验积累。医生缺失导致我国超过半数以上的二级医院没有病理科半数以上设有病理科的三级医院则缺乏诊断能力,只能诊断任务转诊。医师图像的解读上难度比医学影像有过之而无不及,一张病理切片10像素x10像素以上,医师需要这其中筛选出热点区域,再在热点区域中观察可能1像素大小都不到的细胞的微弱区别,进行解读诊断。判断的高难度造成病理诊断的误诊率同样居高不下,基本上误诊率都5成左右。
对于人工智能来说,其能通过对海量的图像数据进行学习,加快了经验累积的过程并且从海量数据中识别细微病灶或捕捉变异细胞等也是人工智能擅长的,最终人工智能提供在平均水平甚至是超过资深医师水平之上的诊断结果为医师诊断提出建议。根据美国知名人工智能医学影像公司Enlitic数据显示,对于肺癌检出精度比人工检测精度高出5成以上并且将诊断的时间缩短至5分钟左右。当然,在短期内人工智能尚不足以取代影像医师,但能在相当大的程度上提升全行业的诊断水平,缩短诊断时间,解决资源供给不足效率低下问题。
从产品落地层面上看,检测结果必须先实现数字化,才能够通过人工智能进行诊断。而图像领域有比较强的先天优势,数字化的图像系统发展多年,虽然我国仍有相当大部分的医疗机构仍在使用最初级的胶片、玻片作为图像载体进行诊断,但随着数字化趋势的不断推进,人工智能介入基础也在不断建立中


企业
在比拼什么?
相信大家都已经知道,算法、数据是人工智能企业最核心的两大竞争力,而在医疗领域,具体的情况又是如何呢?
首先是算法方面,近年来人工智能算法发展异常迅速,很多适合企业快速上手的训练框架,加上有大量学术团队公布算法和训练样本,这初创企业进入降低了门槛。但是这些公开算法往往只能训练出一个粗浅的产品,只适合作为前期尝试,并且随着应用场景、应用人群的不同都需要算法和模型做不同程度的改进目前各种算法处于百家争鸣的态势,各企业间也是博采众长,不断对自身模型进行改进。从长期来看算法必然会遇到瓶颈,各家企业间的差距也会不断缩小,其重要性也会不断下降,企业必须平衡好高额研发投入的性价比问题
在临床层面,各类算法最终比拼的是准确度。目前行业正处于风口有大量企业拿着公开的算法、样本稍加改动即在市场大肆宣扬,实际产品远远达不到落地的标准。这类企业会在准确度上大做文章却不对准确度定义做解释,有误导之嫌。举个简单例子,我国乳腺癌发病率为每10万人21例,即使算法将每个样本都标记为乳腺癌,那最终结果对是否乳腺癌患者的识别率也高达99.9%,但在临床上却没有任何意义。因此,谈论准确度必须同时谈论敏感度和特异度,即漏诊率和误报率,才能算法的准确度有明确的认识。
其次前文所说,当各家间在算法上太大差距的情况下,数据就成了最重要的核心竞争力了。观察数据两个维度,一是质量,二是数量。人工智能系统必须通过大量的有效数据来进行训练,改进模型,才能不断提升输出结果的质量。中国拥有庞大人口,各类病例数都全球领先,理论上数据量并不缺,但关键是数据缺乏有效性,难以投入到模型训练当中。第一,仍有大量的数据没有实现电子化无法使用这将依赖于之后电子化系统的普及;第二,数据缺乏标准化规范,市场没有对此形成统一标准,导致企业只能自己花费大量时间进行清洗甚至弃用;第三数据必须经过统一标准的、高质量的标注,才能作为有效的训练集来使用对于动辄几十万的数据量来说,数据标注是非常大的挑战和成本投入第四,医疗数据十分敏感,医院、政府出于安全性考量,数据外流限制非常严格。因此,在这些因素叠加之下,导致当前适用于我国临床的数据十分匮乏。而国外的数据,又由于针对的人种、环境等等不同,用其训练出来的模型最终输出结果在我国往往会出现较大的偏差并不适用。因此在数据问题的解决,人工智能企业都面临着大的挑战。
最后,人工智能企业往往在商业模式上陷入困境。一方面,企业需要稳定的数据来源另一方面,不论是FDA、CFDA等监管机构,还是医院,对于人工智能都保持着谨慎的态度,产品最好能借助载体进行落地。这要求企业最好能打造出涵盖各类硬件、信息化系统人工智能解决方案的平台型企业占据流量入口,不断积累多维度、海量的数据,并且有能力在语音、图像、自然语言处理上保持领先,形成生态圈。

上一篇:消费升级:素质教育不再“吃素” ── 中恒星光产业洞见系列(27)
下一篇:海外上市回归路之港股私有化 ── 中恒星光并购漫谈系列(4)
其他动态
More Views & News