选自Newyorker作者:Siddhartha Mukherjee机器之心编译参加:侯韵楚、Rick R、微胖、吴攀、蒋思源
深度学习体系变得越强壮,它就越迷糊。因为更多的特征被提取了出来,确诊本身变得越来越精确。可是为什么这些特征会从数以百万计的其它特征中被提取出来,这依然是一个无法回答的问题。
棒球运动员一次又一次地抛了一百万次球,他或许不了解任何方程式,可是他知道球终究会有多高、能抵达多大的速度以及它会降落到地上的方位。物理学家能够写方程式来判别同一件事物。可是二者终将异曲同工。——Geoffrey Hinton
上一年 11 月深夜,一名来自布朗克斯的 54 岁妇女因为剧烈的头痛而来到哥伦比亚大学医疗中心挂急诊。她对急诊室的医师说,她的视力现已变得迷糊,左手无力且伴有麻痹症状。医师查看后,对她的头部进行了 CT 扫描。
几个月后,本年 1 月份的一个清晨,4 名操练中的放射科医师挤在医院三楼的一台电脑前。这个房间暗淡无窗,仅有几丝光线从屏幕映出,就像被海水层层滤过。隔间里挤满了人,哥伦比亚大学的神经放射科主任 Angela Lignelli-Dipple 正拿着铅笔和 pad 站在他们死后;她正在操练他们怎样看懂 CT 扫描。
她说:「一旦大脑不作业了,变成灰色,很简略确诊出中风。技巧便是把握好确诊机遇:赶在神经细胞过量逝世之行进行确诊。」中风一般由堵塞或出血引起,神经放射学家有大约 45 分钟的窗口期进行确诊,以便医师采纳干涉方法,比方,溶解正在变大的结块。Lignelli-Dipple 持续说着,提高了决议计划时刻所带来的巨大风险:「假定你正在急诊室中,每过一分钟,大脑的某部分正在逝世。失掉时刻便是失掉大脑。」
时刻一分一秒地消逝,她扫了一眼墙上的钟,问道:「问题终究出在哪里?」
中风一般很不对称。血液会供给大脑的左右分支,然后会分解为纤细支流;凝块或出血一般仅会影响其间的一个分支,导致大脑一部分呈现反常。当神经细胞失掉血液供给并逝世时,安排会略微胀大,在扫描时,解剖结构之间明晰的鸿沟或许变迷糊,终究安排会舒展,并发生枯燥的暗影。可是,一般在中风后进行扫描的几小时乃至几天之后,暗影才会呈现,此刻确诊窗口期早就完毕了。Lignelli Dipple 对我说:「在此之前,扫描时仅会呈现很纤细的痕迹」,即中风先兆。
这名布朗克斯妇女的扫描图画是对头骨的横切面切开图,就像是从底部切到顶部的瓜。医师们像是翻查一本手册相同阅览着图层,喊出解剖结构的称号:小脑、海马区、岛状皮层、纹状体、胼胝体、脑室等等。此刻一名年近 30 的医师在一张相片前停下了,用铅笔尖比划着大脑右侧边际的一片区域说道:「这儿有些不对劲,它的鸿沟很迷糊。」但在我眼里,因为像素不明晰,整张图片都是不协调而且迷糊的,但他显着发现了不寻常的状况。
「迷糊?」Lignelli-Dipple 探听道:「你能描绘得更具体一点吗?」
这名医师缄默沉静着思索了一会,好像正在收拾脑海中的解剖结构,衡量着各种或许。之后他耸耸肩,说道:「它仅仅不相同。我也不清楚,它看起来很风趣算了。」
Lignelli-Dipple 展现了第2次 CT 扫描(比榜首次晚 20 小时),此刻,被那名医师指出的区域现已肿胀到了葡萄的直径那般巨细,而且色彩显得很暗。之后展出的一系列接连几天的扫描图片让他们了解了本相——呈现了一块显着的楔形灰色区域。她抵达急诊室不久,神经科医师便企图用溶栓药物疏通堵塞的动脉,但现已太晚了。初度扫描的几个小时后,她便失掉知道,被送往重症监护室。两个月后,这名妇女仍住在楼上的病房里,但此刻她的左半部分身体——从上臂到腿都现已瘫痪了。
我跟从 Lignelli-Dipple 去了她的办公室。我想了解关于学习的作业:医师是怎样学习确诊的?机器是否也能做到?
一
1997 年的秋天,我在波士顿开端了临床轮转(clinical rotations),也敞开了自己的确诊生计。为了做好预备,我读了一本医学教育的经典教科书,这本书将确诊行为清晰分为四个阶段。榜首,医师运用患者的病史以及身体查看,收集有关患者的疾病或身体状况的实际;第二,收拾这些信息并生成一份或许病因的归纳列表;第三,经过发问和开端测验,进行「区分确诊」——即扫除一种假定并加强另一种假定,一同给出权重来体现疾病的常见程度,以及患者的病史、风险与露出状况(谚语有云,不要把简略的问题杂乱化);所以列表的或许项就变少了;终究,布置供认的实验室查看、X 光或 CT 扫描以供认假定并供认确诊。数十年来,医学教课书都照实仿制着这些进程的变体,咱们也从一代又一代医学院学生的身上看到了这幅图画:他们有条有理、不辞辛劳地从症状找到病因。
但不久后我便得知,实在的确诊技能并不那么简略。我地点医学院的主任是一个高雅的新英格兰人,他总穿戴抛光的便鞋,口音浓重,并以成为专家确诊医师而骄傲。他会让患者体现出一种症状,比方咳嗽,然后再靠到椅子上,嘴里冒出一串形容词。他或许会说「弱小而尖锐」,或是「底部有嗡嗡声」,好像正在描绘一瓶波尔多葡萄酒。而对我来说一切的咳嗽声听起来都相同,可是我会参加其间——「是的,尖锐」,就像酒会中严峻的南郭先生。
咳嗽分类学家会立刻缩小确诊的或许规模。他或许会说:「听起来像一种肺炎」,或是「充血性心力衰竭的湿疹」,接着他会问询一系列问题。患者最近体重是否有所添加?是否有石棉曝露的前史?他还会要求患者再次咳嗽,斜倚身子,用听诊器细心听诊。他或许会依据成果得出另一系列的或许状况,就像突触的加强和削弱。然后就像路旁边魔术师的纵身一跃一般宣告他的确诊——「心力衰竭!」,并进行测验来证明它的正确性,而成果一般的确无误。
几年前,巴西的研讨人员研讨了放射科专家的大脑,来了解他们怎样做到确诊。这些经历丰富的确诊医师是否对图画运用了心思「规矩」?仍是说他们运用了「方法辨认或非剖析推理」?
25 名放射科医师被要求点评肺部的 X 光,而核磁共振成像机能够盯梢他们的大脑活动(这个系列的递归很棒:若要确诊确诊,成像器就有必要成像)。X 光在他们面前一闪而过。一些图片包括或许常见的单一病理损害,或许是肺部的棕榈状暗影,或积聚在肺内衬层后边发暗且不通明的流体壁。嵌在第二组确诊图画中的是动物的线条图;而第三组则是字母表的字母概括。这三种图画会依照随机次序向放射科医师展现,然后在核磁共振成像机追寻其大脑活动的一同,让他们尽快说出图画的称号。放射科医师均匀需求 1.33 秒才干做出确诊。在这三种状况下,大脑亮起的区域相同:左耳邻近的神经元宽三角洲以及颅骨后基上方的蛾形带。
研讨人员总结道:「咱们的研讨成果支撑这样的假定:当医师当即发现一种特征以及已知的病变时,这个进程与日常日子中命名事物的进程相似。」辨认病变与命名动物的进程相似。当你认出犀牛时,你并不会考虑并消除代替的候选者。也不是在精神上将独角兽、犰狳和小象交融在一同。你会以一种方法认出犀牛的悉数,而放射科医师也是如此。他们并没有深思、回想以及差异,他们看到的是一个一般方针。对我的主任来说,那些湿漉漉的声响也相同像了解的叮当声一般能够辨认出来。
二
1945 年,英国哲学家 Gilbert Ryle 举办了一场颇具影响力的讲座,主题关于两类常识。一个孩子知道一辆自行车有两个轮子,其轮胎充溢了空气,而且能够经过骑脚踏板让它行进;Ryle 将这种实际、出题类的常识称为「知其然(knowing that)」。但学习骑自行车触及到另一个学习范畴:这个孩子会在跌倒、平衡两个轮子以及穿过坑洼的进程中学会骑自行车。Ryle 将这种隐性的、体验式的、根据技能的常识称为「知其所以然(knowing how)」。
这两种常识好像是相互依靠的:你能够运用实际性常识来深化经历性常识,反之亦然。可是,Ryle 正告要抵抗以为「知其然 (know that)」能够简化为「知其所以然(knowing how)」这种引诱,因为一本规矩手册无法教会孩子骑自行车。Ryle 以为,只要当咱们知道怎样运用规矩时,规矩才干实在发挥效果:「例如,对鸟类来说,只要经过日子才干把握规矩。」一天下午,我看着 7 岁的女儿骑自行车经过一个小丘。她榜首次测验时停在了斜坡最峻峭的部分,然后跌倒了。下一次我看到她屈身向前歪斜,开端视点很小,随后越来越显着;而当斜度减小时,她会向后添加分量。可是,我从未教过她骑自行车爬上那座小丘的规矩。我想,当她的女儿学习骑自行车翻过这座小丘时,她也不会教她这些规矩。咱们会教授一些与国际有关的规矩,可是会将剩余的留给大脑。
参加完 Lignelli-Dipple 与放射科学员的会议之后,我曾与经过 CT 扫描发现前期中风的年青人 Steffen Haider 交流了一下。他是怎样发现病变的?是「知其然(know that)」仍是「知其所以然(know how)」?他以习得规矩作为说话的开端。他知道中风往往发生在一面,安排会细微「变灰」,且常常伴有略微肿胀,形成解剖鸿沟丢掉。他说:「大脑中有些当地的血液供给特别软弱。」为了辨认病变,他有必要在大脑的一侧寻觅没有呈现在另一侧的痕迹。
我提示道,他忽视了图画中许多不对称的状况。这个 CT 扫描与大多数状况相同,在左边存在其他灰色的波纹,但右侧却没有,它们或许是妇女中风前大脑中的反常运动或潜在改动。他是怎样把要点缩小到这片区域的?他停了下来,脑筋风暴却仍在持续。总算,他开口道:「我不知道,有一部分是潜知道的」。
Lignelli-Dipple 告知我:「当你在学习中逐步生长为放射学家时,这种状况就会呈现,而问题在于机器能否以相同的方法『生长与学习』」。
三
2015 年 1 月,核算机科学家 Sebastian Thrun 开端痴迷于医学确诊的难题。这位在德国长大的科学家很瘦,剃着光头,周身充溢着漫画人物的气味;他看起来就像米歇尔·福柯(法国闻名哲学家——译者注)和憨豆先生的奇特组合。Thrun 从前是斯坦福大学教授,领导者该校的人工智能实验室,后来脱离创立 Google X,领导会自学的机器人和无人驾驶轿车的研制。可是,他发现自己对有着学习才能的医疗设备有了极大的爱好。49 岁时,他母亲因乳腺癌逝世——正是他现在的年纪。Thrun 告知我:「大多数癌症患者开端并没有症状,我母亲就没有,当她去看医师时,癌症现已转移了。我沉迷于找到一种能在癌症前期就将其侦测出来方法——那时,还能用手术刀将其切除。我也一向在想,机器学习算法能否有所协助?」
前期在主动确诊方面的研讨往往与教科书代表的显性常识(explicit knowledge)范畴严密相关。以心电图为例(心电图将心脏的电信号改动转变为纸张或屏幕上的线条),曩昔的二十年来,电脑解读的一般是这些体系的特征。履行这些作业的程序一般比较直接,特征波形与多种状况相关(如心房颤动或血管堵塞),以及辨认这些特征波形并输入到运用中的规矩。当机器辨认到这些特征波形时,它会把这种心跳符号为「心房颤动(atrial fibrillation)」。
在前期胸部肿瘤 X 射线透视技能中也是这样,「核算机辅佐确诊」现已层出不穷。图画辨认软件会杰出显现疑似病变的区域,然后放射科医师会复查成果。但这种辨认软件一般也是运用根据规矩的体系来辨认或许病变的区域。这样的程序没有内置的自主学习机制,即一台现已查看过三千张 X 光图画的机器并不比仅查看过四张 X 光图画的机器更聪明。2007 年的研讨对运用核算机辅佐确诊设备前后胸部肿瘤 X 射线透视技能的精确性进行了比较,其间这些局限性变得反常显着。人们或许会估计在设备投入运用后,确诊的精确率会显着提高。但实践上设备发生的影响很杂乱:在核算机辅佐确诊组中,活体查看的精确率上升,但肿瘤学家最期望检测到的小型侵入性乳腺癌精确率却有所下降(乃至后续研讨显现这种技能存在假正类(false positives)问题)。
Thrun 坚信,他能经过从根据规矩的算法转变为根据学习的算法来逾越榜首代确诊设备,从「知其然(know that)」变为「知其所以然(Know how)」来作出确诊。Thrun 运用的这类学习算法就触及运用「神经网络」这种核算战略,因为该神经网络的创意源于大脑运作的模型,所以其能完结这一学习进程。大脑中的神经突触经过重复激活而加强或削弱;这些数字体系旨在经过数学手法完结相似的意图,调整衔接的「权重」来向预期输出挨近。更强壮体系会与神经元层级相似,每个体系会处理输入的数据并将成果发送到下一层。因此,呈现了「深度学习」。
Thrun 将皮肤癌作为切入点,特别是角化细胞癌(美国最常见的一类癌症)和黑素瘤(最风险的皮肤癌)。能否操练机器经过扫描图片将皮肤癌与良性皮肤病(如痤疮、皮疹或痣)差异开呢?Thrun 推理道:「假如一名皮肤科医师做得到,那么机器应该也能够做到,而且或许会做得更好。」
一般来说,关于黑素瘤的皮肤病学教育会从根据规矩的体系开端,就像医学生的学习相同,配有一套快捷的助记符:ABCD。黑色素瘤一般是不对称的(「A」——asymmetrical),其边际(「B」——border)是不均匀的,而色彩(「C」——color)会变成斑块状且附有杂色,而且它们的直径(「D」——diameter)一般大于 6 毫米。但当 Thrun 在医学教科书和网络上查看黑素瘤标本时,却发现了不适用于这些规矩的破例。
Thrun 依然是斯坦福大学的兼职教授,找了两名学生 Andre Esteva 和 Brett Kuprel 协助他进行研讨作业。他们的首要使命是创立一个所谓的「教育集(teaching set)」:一个巨大的图画库,用来操练机器辨认恶性肿瘤。Esteva 和 Kuprel 经过网络查找发现了 18 个由皮肤病专家分类好了的皮肤损害图画库。其间包括了近 13 万张有关痤疮、皮疹、虫咬、过敏反响和皮肤癌等疾病的图片,皮肤病专家将它们分为近 2000 种疾病。值得留意的是,有一个包括 2000 个病变的调集现已由病理学家切片查看过了,因此它们简直是被确诊的了。
Esteva 和 Kuprel 开端操练他们的体系。他们没有拟定规矩;没有教它 ABCD 助记符。相反,他们是将图画和其确诊分类输入神经网络。我请 Thrun 描绘这个神经网络的作业内容。
「幻想用一个老式的程序去辨认一只狗,」他说。「软件工程师会写出 1000 行 if-then-else 句子:假如它有耳朵,和一个鼻子,并有头发,且不是一只老鼠等等,这样循环往复完结辨认使命。当然,这并不是一个孩子去学习辨认狗的方法。起先,孩子会经过查询以及大人的奉告来辨认狗。她或许会犯过错,但能纠正自己。当她以为狼是狗时,大人们会告知她狼归于一个完全不同的类别。所以她一点一点地改动了自己的知道:这是『狗』,那是『狼』。机器学习算法就像孩子相同,从一个已分类好的标示操练集抽取信息。如这是一只狗,那不是一只狗。然后,它从一组一组的操练会集提取出特征。接着,经过对成百上千张已分类图画进行自我测验,机器学习体系像孩子相同开端创立归于自己的方法来辨认狗。」它便是知道怎样去做(know how)。
2015 年 6 月,Thrun 的团队开端测验经过给机器一个「验证集(validation set)」的方法来了解它从图画主调会集学到了什么:一些经皮肤病专家确诊(尽管纷歧定是经过活检)的 14,000 张图画。该体系是否能够精确地将图画分为 3 个确诊类别——良性病变、恶性病变和非癌生长?这个体系的正确率为 70%。(该算法的实践输出不是「yes」或「no」,而是某个给定病变归于类别的概率。)两位得到委员会认证的皮肤病学家也在一旁做了测验,不过他们做得更糟:其正确率为 66%。
接着,Thrun、Esteva 和 Kuprel 又将研讨扩展到了 25 位皮肤病学家,而这一次他们运用了一个黄金规范——约 2000 张经由活安排检测证明的图画「测验集(test set)」。在简直每一个测验中,该机器都比这些专家愈加灵敏:它不太或许错失一个(恶性)黑素瘤。它也比专家们更为清晰:它不太或许将一个肿瘤错称为(恶性)黑素瘤。「在每一次测验中,该网络都要优于皮肤病学家,」该小组在《天然》杂志所宣布的一份陈述中总结到。
「还有一个有关网络的更深入的东西没有在该论文中得到充沛着重,」Thrun 告知我。在研讨的榜首版别中,他和团队开端运用的是一个完全的朴素(nave)神经网络。可是他们发现,假如是从一个已被操练成辨认一些不相关特征(比方狗和猫)的神经网络下手,它会学得更快更好。或许咱们的大脑功用也是这样。高中课程中那些令人脑筋麻痹的操练——因式分解、共轭动词、背元素周期表——或许会得到相反的成果:令人脑筋敏锐。
在教机器时,他们团队有必要得当心地处理这些图画。Thrun 期望人们有一天只需提交其令人担忧的病变手机相片就能够得到确诊,这意味着该体系有必要适用于多种视点和照明条件。可是,他回想道,「在某些图片中,(恶性)黑素瘤现已被黄圆盘标志符号过了。咱们有必要把它们裁剪出来——不然,咱们或许便是在教核算机将黄圆盘标志作为癌症标志给挑选出来。」
这是一个陈旧的难题:一个世纪前,德国民众被 Clever Hans 迷住了,听说这匹马能够进行加减运算,并能够经过敲击蹄子来将答案传递出来。实际证明,Clever Hans 实践上是在感触驯马者的情绪举动。当马蹄敲击数挨近正确答案时,驯马者的表情和姿态就会变得放松。动物的神经网络没有学过算术,却学会了检测人类肢体言语的改动。「这便是神经网络古怪的当地,」Thrun 说。「你不知道它们在运用什么信息。它们就像黑箱,其内部运作是奥秘的。」
「黑箱」问题是深度学习所特有的。该体系不受许多而清晰的医学常识和一系列确诊规矩的引导;经过进行许多的内部调整——相似于加强和削弱大脑中的突触衔接——它现已能够有用地教自己去差异痣与黑色素瘤。它终究是怎样将某一病变承以为黑色素瘤的呢?咱们无法知道,它也无法告知咱们。一切答应网络去学习的内部调整和处理都发生在咱们的查看才能之外。就像咱们自己的大脑相同。当你骑自行车渐渐转弯时,你会向相反的方向歪斜。我的女儿知道自己是这样做的,但这并不是她自己的挑选。该黑色素瘤机器有必要从图画中提取某些特征;假如它不能告知咱们所选的是哪一个特征,这会有什么影响吗?这就像是微笑着的常识之神。遇到这样一台机器,你能够窥见动物感知人类心灵的或许方法:一窍不通但却难以了解。
Thrun 轻快地设想了这样一个国际——咱们时刻处于确诊的监控之中。咱们的手机将剖析怎样把语音方法转化为老年痴呆症的确诊。一个方向盘会经过你小幅度的踌躇和震颤来检测出前期的帕金森氏症。当你在洗澡时,一个浴缸将经过无害的超声波或磁共振来履行次序扫描,以供认卵巢中是否呈现了新的需求查询的紊乱。大数据将会观看、记载和点评你:咱们将从一个攫取的算法中络绎到下一个。进入 Thrun 的这个浴缸和方向盘的国际便是进入了一个确诊镜大厅,每面镜子都敦促着更多的测验。
很难不被这种愿景所引诱。一个每天都在做图画对照、不断以细节————乃至或许是细胞——颗粒的方法对咱们进行扫描的医疗监狱,或许会使咱们在癌症的最前期确诊出它吗?它能供给癌症检测方面的什么打破吗?这听起来令人形象深入,但其间有一个圈套:许多癌症都注定是因人而异的。咱们是和它们一同死去,而不是因它们死去。假如这样一个感同身受的确诊引擎将导致数以百万计的不必要的活检呢?在医学上,前期确诊能够抢救或延伸生命。但也有一些状况是,你会忧虑更长的时刻,但不会活得更久。很难知道你想知道多少。
「我关于增强人类才能方面很感爱好,」当我问他这种体系对人体确诊的影响时,Thrun 这样提到。「看,工业耕耘消除了某种方法的耕耘吗?当然,不过它也扩展了咱们出产农产品的才能。并非一切这些都是好的,但它使咱们能够养活更多的人。工业革命增强了人类肌肉的力气。当你运用电话时,你增强了人类言语的力气。在纽约的你无法则加利福尼亚的人听到你的叫喊」——的确,其时 Thrun 和我的通话间隔便是这么长——「但你手上的这个矩形设备能够让人声传递到 3000 英里之外。电话替代了人声吗?没有,电话是增强设备。认知革命将答应核算机以相同的方法增强人类的思维才能。就像机器使人类肌肉增强了 1000 倍相同,机器也将令人类的大脑功用增强 1000 倍。」Thrun 坚持以为,这些深度学习设备不会替代皮肤病医师和放射科医师。它们将加强专业人士的才能,为他们供给专业常识和协助。
四
Geoffrey Hinton 是多伦多大学的核算机科学家,他以为学习机器将在临床医学中发挥出更大的效果。Hinton——乔治·布尔的玄孙,其布尔代数是数字核算的一个基本原理——有时被称为深度学习之父;这是他从 19 世纪 70 年代中期以来就开端研讨的一个主题,他的许多学生现在已成为该范畴的首要设计者。
「我以为,假如你是一名放射科医师,那么你就像是漫画中的 Wile E.Coyote(译注:先拼命地往山崖外跑,离了很远之后才发现自己现已踏空。),」Hinton 告知我。「你现已越过了山崖的边际,可是还没有朝山崖下看去。下面并没有地上。」用于乳房和心脏成像的深度学习体系已被商业化开发出来了。「这完全是清楚明了的,深度学习将在 5 年内胜过放射科医师,」他持续说道。「或许是 10 年。我在一个医院里说过这个。可是这一点并没有获得广泛的承受。」
Hinton 那次在医院的原话很直爽:「他们现在应该中止操练放射科医师了。」当我向 Angela Lignelli Dipple 提出这个应战时她指出,确诊医师并非仅仅是在做 yes-no 式的分类作业。他们不仅仅是在定位导致中风的栓塞。他们是在重视其它当地的小出血,这些小出血或许会令溶栓药物的运用形成灾难性的成果,他们是在寻觅一种意料之外的、或许依然处于无症状状况的肿瘤。
「很好。成果略微是可猜测的」
Hinton 现在有资历主张寻衅。他告知我:「放射科医师的人物将从做一些感知使命——受过高度操练的鸽子也或许能完结的这种使命——演变为做更多的认知作业」。他关于主动化医学未来结局的猜测是根据一个简略的准则:「假如你具有关于某老式分类问题的许多数据,那么就考虑去处理这个问题吧,深度学习将会做到这一点。那时会有数以千计的深度学习运用程序呈现。」他想运用学习算法来读取各式各样的 X 射线、CT 扫描和核磁共振——而这仅仅他所以为的近期远景。在未来,他说,「学习算法将会从事病理确诊」,它们或许会阅览 Pap 涂片、听心脏的声响或是猜测精神病患者复发的或许性。
咱们评论了黑箱问题。尽管核算机科学家们正在研讨它,可是 Hinton 供认,这些应战——翻开黑箱和企图找出终究这些强壮的学习体系知道些什么以及它们是怎样知道的——是「微乎其微的——不要信任任何人的话。「不过,这是一个他以为咱们能够学会去习惯的问题。他说:「幻想在某场竞赛中,一名棒球运动员与一名物理学家对立以供认球或许在哪着陆,」他说。「棒球运动员一次又一次地抛了一百万次球,他或许不了解任何方程式,可是他知道球终究会有多高、能抵达多大的速度以及它会降落到地上的方位。物理学家能够写方程式来判别同一件事物。可是二者终将异曲同工。」
我回忆了核算机长辈在钼靶查看中运用核算机辅佐检测和确诊的令人绝望的成果。Hinton 供认,任何新体系都需求经过严厉的临床试验进行点评。可是,他着重,新的智能体系是为了从其过错中吸取教训——然后能够跟着时刻的推移而改善。「咱们能够在一个会重视每个错失的确诊——终究患肺癌的患者——并将其反响到机器体系中来树立检测与确诊机制。咱们能够问,你错失了什么?你能细化确诊吗?没有针对人类放射科医师的这种体系。假如你遗漏了某件事,然后 5 年后你的一个患者患上了癌症,那么这就没有体系的例行程序来告知你怎样纠正自己。可是你能够在一个体系中树立这种机制来教核算机完结这一方针。」
一些最雄心壮志的确诊机器学习算法版别寻求将天然言语处理(让算法能够查看患者的医疗记载)与从教科书、期刊和医学数据库获得的医疗方面的百科常识整合起来。总部设立于马萨诸塞州剑桥市的 IBM Watson Health 和总部设在伦敦的 DeepMind 都期望树立这样的归纳体系。我看到一些这样的体系正处于试点演示运转中,但它们的许多功用——特别是深度学习组件仍在开展中。
Hinton 关于深度学习确诊的未来充溢热情,这部分是因为他自己的经历。当他正在开发这种算法时,他的妻子被发现患有晚期胰腺癌。他的儿子被确诊出患有恶性黑色素瘤,但随后活检显现该病变是一个基底细胞癌,是一种不太严峻的癌症。「这儿还有许多东西需求学习,」Hinton 说,轻轻地叹了一口气。「精确的前期确诊并不是一个简略的问题。咱们能够做得更好。为什么不让机器协助咱们呢?」
五
在一个严寒的三月的清晨,在我与 Thrun 和 Hinton 说话的几天之后,我去了坐落曼哈顿榜首大街 50 号的哥伦比亚大学的皮肤诊所。主治医师 Lindsey Bordone 那一天原定要看 49 个患者。可是到了十点钟,候诊室却里挤满了人。一个 60 岁左右藏着胡子的男人坐在角落里,用一条羊毛围巾把脖子上的皮疹掩盖起来。一对焦虑的配偶蜷缩着在看《年代》杂志。
Bordone 看着患者接二连三地赶来。在一个由荧光灯照明的里屋内,一个护理坐在一台核算机前说了一句话总结到:「50 岁,从前没有确诊史,皮肤上有新的可疑点」——然后 Bordone 冲进诊疗室,她金色的头发在风中飞扬着。
一个 30 多岁的年青人脸上有鳞屑红疹子。Bordone 打量着这个年青人,他的皮肤掉落了并从鼻子上掉下来。Bordone 把他拉入灯光下细心查看了他的皮肤,然后用手持皮肤镜对其进行查询。
「你的头发里有头皮屑吗?」她问。
这个男人看起来很困惑。「当然,」他说。
「嗯,这是面部皮屑,」Bordone 告知他。「这是一个特别糟糕的状况。但问题是它现在为什么会呈现而且状况变得越来越糟了。你在头发上运用过什么新产品吗?你有一些反常的家庭压力吗?「
「压力肯定是有一些的,」他说。他最近赋闲了,正在处理随之而来的财政问题。
「记日记,」她主张到。「咱们能够凭此供认二者之间是否有相关,」她开了一个类固醇霜的处方,并让他一个月后再来。
在近邻房间的是一个年青的律师助理,他的头皮上起了一片发痒的疙瘩。Bordone 摸他的疙瘩时他赶忙避开了。「脂溢性皮炎,」她提到,完毕了这个查看。
另一个房间的女性脱了衣服并穿上医院的病号服。她曩昔被确诊出患有黑色素瘤,而她做预防方法却很勤勉。Bordone 一个斑驳接着一个斑驳地查看了这个女性的皮肤。这花了她 20 分钟的时刻,但这种查看完全且全面,她用手指在一片痣与皮赘组成的景象中划过,一同说出确诊成果。有一些痣和角化病,但并没有黑色素瘤或许癌。「看起来一切都很好,」她兴致勃勃地说。女性宽慰地叹了口气。
所以乎便是:Bordone 来;她见;她确诊(译注:恺撒大帝描绘其成功时说,「我来;我见;我降服。」)。她不像 Hinton 是只草原狼,而好像像是一架有些张狂的越野车,企图用接二连三赶来的病例来跟上年代的脚步。她在里屋中写笔记时,我问她关于 Thrun 对确诊的愿景:一张 iPhone 相片被电邮给一个强壮的异地网络,召集了一群无可置疑但不可了解的专家点评。一位全职的皮肤科医师,比方 Bordone,会在她的一生中看到约 20 万个病例。斯坦福的机器算法在大约 3 个月内获取了近 13 万的病例。可是每位新晋的皮肤科医师都需求从零开端,可是 Thrun 的算法却一向都处于获取病例、生长和学习的进程中。
Bordone 耸了耸肩。「假如它能协助我作出更精确的决议,我会欢迎它,」她说。「我的一些患者在来找我之前会拍下他们的皮肤问题相片,这会添加我的诊所的确诊规模。」
这听起来像是一个合理的回复,而我还记得 Thrun 有关技能增强人类才能的安慰性言辞。可是,跟着机器学习得越来越多,人类会学习得越来越少吗?这是一些爸爸妈妈所长时刻焦虑的问题,他们的孩子能够运用手机中的拼写查看功用:假如孩子中止学习怎样去拼写怎样办?这种现象被称为「主动化成见(automation bias)」。当轿车获得主动驾驶辅佐时,司机或许变得不那么警惕了,而相似的作业也或许发生在医学范畴。或许 Bordone 是一个孤单的 John Henry(译注:他为了保住自己和黑人兄弟们的饭碗而站出来向机器应战,宁死不向机器屈从。),而实际中的蒸汽钻行将上线。但有一点是无法忽视的,即她自己的重视从未不坚定过、她对待手指划过的每一个皮赘和痣时是多么地细心。假如她与一台机器协作,那么她还会这样持续下去吗?
我留意到了 Bordone 与其患者之间的其它互动方法。一方面,他们终究简直总是会感觉更好。他们被接触并被细心地查看;一个说话就这样发生了。即使是对病变的命名——「痣」、「角化病」——也是一剂心灵润滑剂:心底里有一些对疾病确诊进程的欣喜。那个皮肤重现光泽和弹性的女性,她的焦虑也随之掉落。
还有许多。正如巴西研讨员或许现已猜到的,Bordone 会在一会儿辨认出确诊成果。她口中的「皮炎」或「湿疹」,就好像是在辨认一只犀牛:当她辨认出某一方法时,你简直能够看到她大脑后下方的神经元角锥状物所迸发出的火花。但确诊还没有完毕。Bordone 简直在每个事例中都会花许多的时刻查询病变原因。为什么会呈现这些症状?是压力吗?一种新的洗发水?有人改动了游水池里的氯吗?为什么是现在?
我知道到,在这些临床实践中的最有力的要素,不是了解它或是知道怎样去把握事例的实际状况,或辨认出医师们所构建的方法。而是存在于常识的第三个范畴中:了解原因。
六
因为解说可浅可深。如你的手指上有一个赤色的水泡,因为你碰到了一块热铁;你的手指上有一个赤色的水泡,因为烧伤激发了前列腺素和细胞因子的一个炎症级联反响,而其间的调控进程依然不能被咱们完美地解读出来。了解原因、发问为什么,是咱们通向各种解说的桥梁,而解说正越来越多地成为掌控医学前进的东西。当 Hinton 谈到棒球运动员和物理学家时,人工或实在人类的确诊医师,将会成为棒球运动员,他们娴熟但黑箱。医学研讨者将成为医学范畴的物理学家,正如来自棒球范畴的理论学家相同,但他们有知道「为什么」的巴望。这是一个便利的责任分工,但这是否或许也意味着丢失?
「深度学习体系没有任何解说才能,」Hinton 开门见山地提到。黑箱不能查询原因。实际上,他说:「深度学习体系变得越强壮,它就越迷糊。因为更多的特征被提取了出来,确诊本身变得越来越精确。可是为什么这些特征会从数以百万计的其它特征中被提取出来,这依然是一个无法回答的问题。」算法能够处理一个事例,但它不能创立一个事例。
可是我在自己的范畴(肿瘤学)中不由留意到,往往是那些娴熟的从业者,他们一般也是喜欢研究的研讨人员在获得研讨进展。实际上在曩昔的几十年里,有志向的医师从前尽力想成为棒球运动员和物理学家:他们企图用确诊的灵敏度来了解疾病的病理生理学。
为什么一个皮肤病变的不对称边际会猜测出黑色素瘤?为什么有些黑色素瘤会天然衰退,以及为什么在其间的一些病例中会呈现白色斑块?偶然的是,确诊专家在临床中所查询到的这些现象,终究与现在临床上所运用的一些最有用的免疫药物的创造联络在一同。(皮肤美白原来是免疫反响的成果,该反响一同也会对立黑色素瘤)该发现链能够始于临床。假如越来越多的临床实践被黑箱的学习机所替代,假如常识的内隐和显性方法之间日常和自发的亲密关系(即知道是什么、为什么、怎样样)开端褪色,那么咱们是否会变成这样一种状况:把能做的做得更好,但关于从头审视咱们所应该做的作业、去跳出黑箱进行考虑却体现得越来越无能?
我与哥伦比亚大学皮肤病学科的一把手 David Bickers 交流过咱们的主动化未来。「信任我,我现已试着去了解 Thrun 论文的一切分支常识,」他说。「我不了解这些算法背面的数学原理,但我的确知道这样的算法或许会改动皮肤科范畴的开展实践。皮肤科医师会赋闲吗?我不这么以为,但我以为咱们有必要细心考虑怎样把这些技能融入咱们的实践中。咱们运用机器的价值是什么?假如机器做出了过错的猜测,那么其法律责任是什么?假如依托这样的算法,那么,这是否会削弱咱们的实践,或许作为确诊专家的本身形象?终究,是否会操练一批技能人员而不再是医师?「
他看了下时刻。一个患者正等着见他,他要脱离了。「我这辈子都是以确诊学家和科学家为业,」他说。我知道患者多么依靠我的分辩恶性病变和良性病变的专业。我也知道医学常识来自于确诊。」
他提示我,「确诊」这个词来源于希腊语「了解知道差异(knowing apart.)。」机器学习算法只会愈加擅于知道这类差异:比方,分隔(partitioning)、区分痣和黑色素瘤。可是不管从哪个视点说,就知道(knowing)来说,都会逾越那些专心于处理具体使命的算法。在医学范畴,或许终究的报答来自于了解全体(knowing together)。
原文链接:http://www.newyorker.com/magazine/2017/04/03/ai-versus-md?mbid=social_twitter