国思软件 - 咳嗽几声，Google 的 AI 就知道我有没有病？

　　AI 的特点在于超强的学习能力，聊天、绘画、写作、作曲，就没有它不会的。

　　你为 AI 焦虑到头秃，Google 倒希望 AI 帮你照顾好自己的身体。

　　这次，AI 的学习材料变成了咳嗽声。

　　基于 YouTube 等平台无版权的公开视频，Google 收集了 3 亿条 2 秒左右的音频数据，包括咳嗽、抽鼻子、打喷嚏和呼吸困难的声音，然后训练了一个 AI 基础模型：HeAR。

　　HeAR 可以通过你的声音，了解你的健康状况，甚至能在疾病的早期给出诊断。

　　Google 没有让 HeAR 在实验室束之高阁，已经和印度 AI 医疗初创公司 Salcit Technologies 展开合作。

　　Salcit 有自己的 AI 模型 Swaasa（梵语里意为「呼吸」）以及 app，在一些情况下可以替代传统的肺活量测试，用户提交 10 秒的咳嗽样本，就能检测某些呼吸道疾病。

　　HeAR 拓展了 Swaasa 的技能，又延续了 Swaasa 的精神。两者的强强联合，首先用在基于咳嗽声的结核病早期检测。

　　为什么是结核病？首先，HeAR 有这个能力，训练材料里，咳嗽声就占了大概 1 亿条。

　　其次，结核病的情况比较特殊，可以治愈，但每年有数百万病例未被诊断，耽误了病情，原因无非是医疗落后，患者没有条件。如果不治疗，结核病的死亡率高于 50%。

　　这就能体现 AI「听诊」的好处了——与血液测试、成像等相比，声音是更容易获得、成本也更低的信息，可以直接通过智能手机上的麦克风和 AI 软件收集、分析。

　　不过，在更广泛地落地前，HeAR 还有一些问题需要解决，包括音频样本的背景噪音过多。

　　除了 Google，还有一些大厂和初创公司，也在尝试让 AI「听见」疾病。

　　2021 年，301 医院、北京大学第一医院等联合发起呼吸健康研究，华为在其中扮演了重要角色。

　　拥有华为 WATCH 4 系列、WATCH GT 4 等智能手表的用户，可以在华为创新研究 app 选择加入呼吸健康研究，录制咳嗽音，采集生理数据，实现肺部感染风险筛查。

　　「咳几声」，怎么就能知道肺部有没有感染？肺部感染的患者，咳嗽的爆发音、频谱衰减和其他人不同，所以能被区分开来。

　　背后默默提供支持的，是海量专业的模型数据，以及环境音识别、高精度咳嗽识别和呼吸健康筛查评估三重算法。

　　另外，AI 也正在通过我们说话的声音，深入我们的内心世界。声音会因为精神健康而改变，有研究可循。

　　抑郁症患者讲话通常更单调、更平淡、更柔和，音高范围和音量较小，有更多停顿，也会更频繁地停下来。焦虑症患者则会因为身体紧张，往往说得更快，呼吸更加困难。

　　基于微软云服务 Microsoft Azure 的美国初创公司 Canary Speech，可以捕捉并处理 40 秒的对话语音，追踪压力、情绪等，从而检测健康状况。

　　人类可能会自欺欺人地说「我很好」，但算法不会骗人，而是观察你的表达方式，根据语气词、停顿等，做出客观的评估。AI 不仅关注你说什么，更关注你怎么说。

　　美国国立卫生研究院的愿景则更为广阔，有些「兼济天下」的意思。

　　研究人员计划到 2026 年，创建一个大型的开源语音数据库，训练 AI 诊断疾病，最终开发一个 app，帮助全科医生将患者转诊给专家，将服务辐射到农村等医疗欠缺的地区。

　　他们知道声音里有大量的信息——说话低声、缓慢的人可能患有帕金森病，口齿不清是中风的征兆，抑郁症也能在声音中找到端倪。

　　不过，收集的语音还是有优先级，包括五种疾病：神经系统疾病、声音障碍、情绪障碍、呼吸系统疾病、自闭症和言语迟缓等儿科疾病。

　　某种程度上，从手表、手环、戒指等可穿戴设备到 AI「听诊」，技术都是在将人类的感官数字化，并且功能越发丰富，更加关注身体的综合状况。

　　你做冥想了吗，你的心血管如何了，月经周期怎么样，运动圆环合上了吗……

　　首款 Apple Watch 于 2015 年发布，距今已有 10 年，我们渐渐习惯，让身边的智能设备，随时、安静、非侵入性地检测身体。

　　而语音是一个更日常的场景，用我们的手机就可以实现交互。不过，语音数据的偏见性、准确性、隐私问题，以及算法的黑盒本质，也让很多研究人员担心语音检测的负面影响。

　　可能未来的某一天，Siri、小爱同学等语音助理，会这样提醒我们：亲，今天咳嗽了几次，心情跌到谷底几次，呼吸急促了几次…… 这是科技的进步，还是现实版的《美丽新世界》？

咳嗽几声，Google 的 AI 就知道我有没有病？