2023-07-14 14:48:54 互联网
网站流量监测服务商Similarweb的数据显示,今年以来,ChatGPT访问量1月份的环比增长率为131.6%,此后逐月下降。到6月份,ChatGPT的全球流量出现首次下降。可见,大模型的发展逐渐驶入深水区。而大模型的产业化落地,将成为下一阶段思考的重点。
近日,医渡云首席数据科学家彭滔博士在世界生命科学大会“2023AI大模型医疗场景应用论坛”上发表了主题演讲,分享了AI大模型在医疗行业的技术和模式创新。他指出,通用大模型不能彻底解决用户的所有问题,未来大模型市场是基础大模型、行业大模型以及细分场景模型并存的格局。尤其是医疗领域,其严肃性、敏感性、专业性等特殊性,决定了医疗行业需要高质量的专业垂类大模型。
彭滔将大模型的应用生动地比喻为“雇佣新员工”,公司会关注其教育背景,也会对员工进行培训从而更好地适配业务。两者的不同之处在于,教育更侧重于理论知识的传授和推理能力的培养,培训则更倾向于实践性的技能传授以及技能应用的演练。在大模型落地应用中,教育和培训都是必不可少的环节。
目前,医渡科技正在研发医疗垂直领域的大语言模型。在模型“教育”阶段,医渡科技基于其丰富的医疗专业知识储备、行业know-how及特有的算法和技术,使医疗垂类大模型相对于通用大模型能够更好地理解医疗行业需求,提供更精准、专业的回答。
彭滔表示,经过“教育”的大模型已经可以在知识检索查询、医疗过程中不良事件的提取和判断等医疗场景中进行应用。举例来说,在药物或医疗器械研发中,安全性是基本要求。因此,对于不良事件的提取和评估至关重要,需要从临床病例中提取信息,例如事件发生时间、结束时间、具体使用的药物、事件的严重程度以及与研究药物的关联性等,大模型技术在这个过程中展现出了强大的理解、特征提取和推理能力。(如下图所示)
但医疗垂类大模型的潜力远不止于此,彭滔表示,从医院到药企、保险以及患者等各个医疗场景中,都可以受益于医疗垂类大模型的能力,“几乎所有的医疗产品或路径,都可以用医疗垂类大模型去重新梳理一遍,去真正发挥它的价值”。可泛化可循证的CDSS、可以给出科研灵感的科研工具、可以溯源及开放的大数据平台等,医渡科技正在重新思考和构建这些场景下的大模型应用。
但要想真正打通大模型落地医疗的“最后一公里”,让其在更多场景中发挥更大价值,还需要对医疗垂类大模型进行“培训”,这一过程更多依赖的是场景经验与反馈。医渡科技在医疗智能领域深耕多年,医疗场景实践经验丰富,并且内部人才团队80%以上都具备医学或AI、大数据技术背景,在“培训”方面具备充足的资源支持。
彭滔以识别和录入电子病历数据的场景为例,在临床试验中的很多场景中,由于合规、隐私等因素,医院无法提供电子文本,临床研究协调员(CRC)这一角色就需要将医学检验单上的数据手动录入系统,完成类似打字员的转录工作。彭滔指出,很多客户和合作伙伴期待能使用OCR技术解决这个问题,但由于图像质量问题,以及每家医院具有特殊规则和方法的原因,传统OCR的通用性在不同医院受到了极大限制。
为了解决类似的具体场景问题,医渡科技尝试通过场景专家与工程师沟通,再训练AI模型的方式,然而这种方式也存在成本较高的缺陷。针对此,彭滔在论坛上提出了一种新机制,即让一线人员通过自然语言直接与大模型交互,让他们能够向模型传达现场经验的规则。“自然语言有非常强大的表达能力,通过场景专家与AI的交流,可以解决不同场地繁杂的差异,当然它也存在天然的歧义和不精确性。展望未来,每个行业都会发展出与AI协作的语言。”彭滔畅想道。
此外,AI大模型在医疗场景应用也需要考虑更多的伦理与安全合规问题。彭滔呼吁监管的调整和行业共识的形成,以使AI的应用符合伦理和合规要求,并指出随着时间的推移,各行业都将面临这个问题,未来人类社会或将逐渐向人机共存的方向转变。
新一轮AI浪潮已至,医渡科技积极拥抱智能时代的新机遇,期待通过推动医疗垂类大模型的创新与应用,为医疗健康领域带来更高效、精准和安全的人工智能解决方案,促进医疗产业的高质量发展,最终让更多患者受益。