GPT-4救了我狗的命

  丰色发自凹非寺

  量子位公众号 QbitAI

  这两天,一篇关于“GPT-4 救了我狗的命”的帖子属实有点火:

  短短一两天就有数千人转发,上万人点赞,网友在评论区讨论得热火朝天。

  △是真狗命,not 人的“狗命”(Doge)

  乍一听,大家想必很纳闷:

  这俩能扯上什么关系?GPT-4 还能长眼睛发现狗有什么危险吗?

  真实的经过是这样子的:

  当兽医说无能为力时,他问了 GPT-4

  发帖人名叫 Cooper。

  他自述自己养的一条狗子,被诊断出了蜱传病,尽管伴发严重贫血,经过一段时间的治疗后,还是相对好转了。

  △ 当事狗照

  但不料没过几天,病情又急转直下:

  狗的牙龈苍白,没有一点血色。

  Cooper 连忙又把爱狗带回兽医那里,这次验血结果果然比上次还要遭。

  为了排除与蜱传疾病相关的其他并发感染症,医生给狗子进行了好多项检测,但结果全是阴性。

  眼看狗子状况越来越差,医生却还是无法给病情下出一个诊断结果,还告诉 Cooper:

要不等等看。

  对于大部分养宠物的人来说,宠物并非一条简单的生命,而是胜似亲人的存在。

  Cooper 也不例外,他完全无法接受医生的这个建议,准备去第二家医院。

  与此同时,他想到了 GPT-4。

  GPT-4 在发布之时公布了一项医学知识测试结果,该测试由美国医师学会开发,最终它答对了75%的问题,相比 GPT3.5 的 53% 有很大的飞跃。

  Cooper 心想,GPT-4 说不定真的很擅长诊断疾病。

  于是说干就干,当天他就将狗子从第一次发病开始的症状、治疗过程以及每次的血液检测报告都一一告诉 GPT-4:

  (大意:20 号这一天,我的狗高烧 41.5 摄氏度。我们立即带他去看兽医,验血结果是贫血,兽医诊断为犬巴贝斯虫病。[附当天血液检测结果] 兽医给狗子服用了该病的解毒剂,第二天狗就退烧了。

  接下来的 3 天,狗接受抗生素治疗(通过在家里服用药丸),狗的情况有好转的迹象,但在 24 日那天,我注意到它的牙龈非常苍白于是我们又去找兽医。)

  (大意:医生又给狗做了测试,排除了其他常见的蜱传病,又做了另一套血液检查:[附结果])。

  然后,Cooper 问 GPT-4:全面考虑以上所有情况,究竟发生了什么?

  很快,GPT-4 开始回答。

  它首先开出了“我不是兽医”的免责声明,然后表示“可以试着帮助你分析血液报告,告诉你的狗可能发生了什么”。

  它先分析了第一次血液报告中最明显异常的两项,然后说医生诊断出来的巴贝斯虫病符合这些现象。

  接着又找出了第二项测试结果中的三项异常,并告知每项代表什么,告诉 Cooper 这些结果表明最初的治疗并不完全有效,或者可能有其他潜在的问题导致贫血

  Cooper 点点头,认为 GPT-4 说的不无道理,然后抓住最后一句立马追问:你觉得其他潜在的问题可能包括什么?

  GPT-4 再次表明自己不是兽医,然后给出了几个选项:

  1、溶血:由于各种原因造成的红细胞破坏,如免疫介导性溶血性贫血(IMHA)、毒素或除巴贝斯虫病以外的其他感染。

  2、失血:内部或外部出血,可由创伤、手术或胃肠道问题(如溃疡或寄生虫)引起。

  由于 Cooper 在医院已经用 4DX 测试排除了其他合并感染,并用超声波排除了内出血,所以他将目光锁定在了 IMHA 身上,“这应该是目前唯一一个符合情况的结果”。

  于是,当 Cooper 带着狗子来到第二家医院时,直接询问医生有没有可能是 IMHA。

  医生表示有可能,在一系列的测试之后,果然确诊

  病根找到之后,再经过几天的对症下药,狗子果然得救

  Cooper 欣喜若狂。

  这时他也才知道:原来这两种疾病都很常见,前者巴贝斯虫病是排名第一的蜱传病,后者 IMHA 则是该病的常见并发症,尤其是在他养的这个品种身上。

  最后,激动的 Cooper 复盘整个治疗的过程,将它 po 在了网上。

  在他看来,狗子的顺利痊愈,GPT-4 可以说是帮了不小的忙。

  他感慨万分:我不知道第一个兽医为什么没有查明病因,不过 GPT-4 真的很厉害,不敢想象 20 年后的医学诊断行业是什么样的。

  另外,他也表示:

  如果 OpenAI 想要就此事展开研究,他愿意提供所有资料。

  GPT-4 真的能够胜任医学诊断吗?

  如此“奇闻逸事”,自是引发网友热烈讨论。

  有人持保守意见,认为这只是个例,称用谷歌一样能搜索出结果,只是第一位医生没有这么做罢了。

  (ps. 这病确实不算疑难杂症,有网友表示看 Cooper 的一段描述就知道他的狗可能是得了 IMHA)

  对此,有人提醒:

  谷歌不会像 GPT-4 一样将检测报告里的每一项指标都分析出来给你看(这也是 Cooper 最欣赏 GPT-4 的地方),而且大部分情况下,你问谷歌头痛,它可能直接就会丢给你“脑瘤”(和“水一百度会开,人一百度会死”有异曲同工之妙)。

  相反,ChatGPT(GPT-4)则非常谨慎,它一般会先告诉你“头痛可能有许多不同的原因,虽然脑肿瘤有可能,但它不是最常见的原因。大多数头痛通常是由其他因素,例如紧张,鼻窦问题,或偏头痛等”。

  然后,它会列出特定于脑肿瘤的头痛症状,告诉你如果真有这些症状,立刻打电话去看医生。

  我们暂且抛开谷歌与 GPT-4 在诊断疾病上的区别不表,其实单说这事儿算个例这个点,就不然

  这不,有一位网友就告诉大家:

  TA 最近得了一个病,连续两位初级保健医生都没查出来,到第三位更专业的医生那里才确诊具体疾病。

  神奇的是,当 TA 将症状告诉 GPT-4,GPT-4 只一局就给出了正确结果。

  所以,GPT-4 在疾病诊断上真的这么厉害吗?

  早在 GPT-4 发布之后,斯坦福大学的一位医学博士就说过:生成式 AI 对医疗保健的影响潜力被大大低估了。

  但其实也有非常中肯的观点值得我们品味,大意是这么说的:

  AI 的能力不在于它有多么前沿的知识预判,而是可以不受任何影响,对问题的所有可能性进行全面的思考,这点可以轻易胜过不少人类从业者。

  这个观点与 OpenAI 联合创始人兼总裁格雷格·布罗克曼等人的看法可以说不谋而合——

  他最近转发了 ChatGPT 在外科科学的一篇同行评审论文,引用了这么一句话:最终,通过负责任和深思熟虑地对事情进行分析,这些模型有可能通过增强而不是取代人类的专业知识水平,成为外科科学和临床治疗中的宝贵工具。

  参考链接:

  [1]https://twitter.com/gdb/status/1639738170303713293?s=20

  [2]https://news.ycombinator.com/item?id=35311667

  [3]https://twitter.com/gdb/status/1639776562882174976