尽管大型语言模型(LLM)的复杂度日益提升,但它们仍面临一个严峻挑战——“幻觉”问题,即提供不准确甚至虚假的信息。在医疗领域,这种错误信息可能导致严重的后果。为了应对这一挑战,美国梅奥诊所(Mayo Clinic)采用了一种创新技术,成功克服了检索增强生成(RAG)模型的局限性。
RAG是一种通过从特定数据源中提取信息来增强语言模型的技术,但其存在局限性,可能检索到不相关、低质量的信息,或者输出格式不符合要求。为了解决这个问题,梅奥诊所采用了一种“反向RAG”方法。在信息提取后,他们将每一个数据点链接回其原始来源,从而消除了大多数基于数据检索的幻觉问题。
为了进一步提高数据的准确性和相关性,梅奥诊所将“代表性聚类算法”(CURE)与LLM和向量数据库结合使用。CURE算法通过层次化方法对数据进行分组,帮助模型识别“异常值”,确保数据的相关性和准确性。通过这种方法,梅奥的LLM能够将生成的总结与源文档中的信息匹配,并由第二个LLM进行评分,以确保数据的准确性。
这一技术已经在梅奥诊所的临床实践中得到广泛应用,特别是在处理病人出院总结时。AI能够快速提取并分类整理信息,极大地减轻了医生的时间负担。此外,梅奥诊所还与Cerebras Systems合作开发了预测关节炎治疗的基因组模型,并与微软合作开发图像编码器,进一步推动了医疗AI的应用。
尽管在诊断领域仍面临一些挑战,但梅奥诊所坚信,AI具有巨大的潜力,能够转变患者护理和诊断的方式,为患者提供更加个性化和以患者为中心的治疗方案。