研究:人工智能在认知障碍测试中表现不佳

小微 2024年12月21日 阅读:51970

研究:人工智能在认知障碍测试中表现不佳
图片来源于网络,如有侵权,请联系删除

  新华社北京12月21日电 《英国医学杂志》最新发表的一项研究显示,在广泛用于检测阿尔茨海默病早期症状的测试中,大部分参与测试的人工智能大语言模型都表现出相当于人类轻度认知障碍的迹象。尽管这只是一项基于观察的研究,但新发现挑战了人工智能将很快取代人类医生的假设。

  过去几年,人工智能尤其是大语言模型生成能力取得了巨大进步。在医学领域,这些发展引发了猜测:这些大语言模型能在医疗任务上超越人类医生吗?尽管先前的多项研究表明,大语言模型在一系列医学诊断任务上表现非常出色,但它们的认知能力变化还需要进一步验证。

  为填补这一知识空白,以色列哈达萨医疗中心等机构的研究人员使用“蒙特利尔认知评估量表”测试了多个领先和公开的大语言模型的认知能力。这些大语言模型包括由美国开放人工智能研究中心(OpenAI)开发的GPT-4和GPT-4o、由美国Anthropic公司开发的“克劳德3.5”以及由美国谷歌公司开发的“双子座1.0”和“双子座1.5”。

  “蒙特利尔认知评估量表”广泛用于检测认知障碍和阿尔茨海默病的早期迹象,通常用于老年人。通过一系列简短的任务和问题,该测试可以评估注意力、记忆力、语言、视觉空间技能和执行功能等能力。得分最高为30分,通常得分26分及以上被视为认知正常。

  测试结果显示,GPT-4o得分最高——26分,“双子座1.0”得分最低——16分。所有大语言模型都能很好地完成命名、注意力、语言和抽象等方面的任务,但在视觉空间技能和执行功能测试中都表现不佳。在进一步的视觉空间测试中,大部分大语言模型无法准确解释复杂的视觉场景。

  研究人员表示,在需要视觉抽象和执行功能的任务中,大语言模型几乎“全军覆没”,这表明人工智能在临床环境中的使用可能会有困难。因此他们开玩笑说,神经科医生不仅不太可能很快被大语言模型取代,而且他们可能会发现自己将迎来新的“虚拟患者”——表现出轻度认知障碍的人工智能模型。

【责任编辑:王佳宁】
    阅读下一篇:
              热门文章
              • 2024年中国情趣用品电商行业市场发展现状及投资风险分析_人保服务,人保财险

                2024年中国情趣用品电商行业市场发展现状及投资风险分析_人保服务,人保财险
                图片来源于网络,如有侵权,请联系删除2024年中国情趣用品电商行业市场发展现状及投资风险分析 2024年6月28日 来源:互联网 753 45 北京用户提问:市场竞争激烈,外来强手加大布局,国内主题公园如何突围? 上海用户提问:智能船舶发展行动计划发布,船舶制造企业的机 江苏用户提问:研发水平落后,低端产品比例大,医药企业如何实现转型...
              • 义乌万里扬苏溪变独立储能项目正式并网投产

                义乌万里扬苏溪变独立储能项目正式并网投产
                证券时报e公司讯,近日,随着并网试验最后一项防孤功能检测项目合格,义乌万里扬苏溪变独立储能项目的所有并网试验项目全部完成,标志着该项目正式并网投产。据了解,项目位于浙江省义乌市苏溪镇,紧邻220kV苏溪变电站,是浙江省“十四五”第一批新型储能示范项目之一,本次并网投产的装机规模为100MW/200MWh。...
              • 注意!开山股份将于7月16日召开股东大会

                注意!开山股份将于7月16日召开股东大会
                图片来源于网络,如有侵权,请联系删除每经AI快讯,开山股份(SZ 300257,最新价:10.26元)6月28日发布公告称,2024年7月16日(星期二)下午14:00,公司将在中国(上海)自由贸易试验区临港新片区飞渡路851号一号楼三楼培训室召开2024年第一次临时股东大会。本次股东大会将审议《关于子公司拟发行境外债券的议案》,2024年7月10日收市后登记在册的股东可现场参会投票,或通过交易所投票系统行使表决权。 道达号(daoda1997)“个股趋势”提醒:1. 开山...
              • AI诊断乳腺癌准确率近100%

                AI诊断乳腺癌准确率近100%
                图片来源于网络,如有侵权,请联系删除   美国东北大学团队成功开发出一款基于网络的新型人工智能(AI)系统。该系统在检测乳腺癌方面的准确率高达99.72%。相关研究论文已发表于最新一期《癌症》杂志。图片来源于网络,如有侵权,请联系删除  团队创建了一个集成式深度学习模型,能够整合利用其他各种不同模型来提高诊断的准确性并减少误差,然后利用公开的数据库,包含癌症组织病理学数据库(BCHD)储存的恶性和良性乳腺组织的图像,对这些模型进行训练。  团队表示,他们新开发的AI...
              • 印尼药监局代表团来访康希诺生物

                印尼药监局代表团来访康希诺生物
                证券时报e公司讯,近日,印尼药监局局长Lucia Rizka Andalucia一行到访康希诺生物,双方就吸入用结核病疫苗、四价流脑结合疫苗等产品合作展开深入交流,达成建设性共识。此前,康希诺生物新冠疫苗克威莎®获得印度尼西亚乌拉玛委员会食品、药品及化妆品评估机构授予的清真(Halal)认证。依托疫苗技术平台,公司的四价流脑结合疫苗等产品均有符合清真认证的潜力,有助于快速推进公司国际化进程。...