研究比较了ChatGPT和放射科医生在肌肉骨骼成像中的诊断准确性
新德里,8月22日(IANS):在不断发展的放射学领域,专业知识对于解释各种疾病的诊断成像至关重要,生成式人工智能模型(如聊天生成预训练变压器(ChatGPT))的最新进展显示出作为诊断工具的潜力。
然而,它们的准确性需要彻底的评估,以获得最佳的未来使用。
大阪城市大学医学院的Daisuke Horiuchi博士和副教授Daiju Ueda领导了一个研究小组,将ChatGPT的诊断准确性与放射科医生的诊断准确性进行了比较。
该研究涉及106例肌肉骨骼放射学病例,包括患者病史、图像和影像学结果。
在这项研究中,病例信息被输入到两个版本的人工智能模型中,即GPT-4和GPT-4 with vision (GPT-4V),以生成诊断。同样的病例被提交给放射科住院医师和委员会认证的放射科医生,他们的任务是确定诊断。
结果显示,GPT-4优于GPT-4V,与放射科住院医师的诊断准确性相匹配。然而,ChatGPT的诊断准确性被发现低于委员会认证的放射科医生。
堀内博士对研究结果发表评论说:“虽然这项研究的结果表明ChatGPT可能对诊断成像有用,但其准确性无法与委员会认证的放射科医生相比。此外,这项研究表明,在使用它作为诊断工具之前,必须充分了解它的性能。”
他还强调了生成式人工智能的快速发展,并指出它有望在不久的将来成为诊断成像的辅助工具。
该研究结果发表在《欧洲放射学》杂志上,强调了生成式人工智能在医疗诊断中的潜力和局限性,并强调在广泛临床应用之前需要进一步研究,尽管它在这个迅速发展的技术时代很好地发挥了作用。