不会数学了！GPT-4“智力”大幅下降

投稿用户 • 2024年4月20日下午12:09 • 科研百科 • 阅读 34

参考消息网7月22日报道 据美国《财富》杂志网站7月20日报道，斯坦福大学的一项研究发现，广受关注的聊天机器人ChatGPT在6月份执行某些任务的表现比3月份的时候变得更糟了。

该研究对由开放人工智能研究中心(OpenAI)创造的这款聊天机器人数月时间内在执行4项“差异化”任务——解数学题、回答敏感问题、编写软件代码、视觉推理——的表现进行了比较。

研究人员发现这项技术执行某些任务的能力存在巨大波动——即“漂移”。该研究考察了OpenAI技术在这一时间段的两个版本：GPT-3.5和GPT-4。最值得注意的结果来自对GPT-4解答数学题能力的研究。在研究过程中，研究人员发现，在3月份时GPT-4能够在97.6%的答题时间里正确识别出数字17077为质数。但是仅仅3个月后，其答题的正确率却骤降至极低的2.4%。与此同时，GPT-3.5的表现轨迹则几乎相反，其在3月时回答同一问题的正确率仅为7.4%，而在6月时的回答大多是正确的，答题正确率达86.8%。

当研究人员要求这两个版本编写代码和接受视觉推理测试——即要求该技术预测某个图案中的下一个形象——时，出现了类似的差异化结果。

研究报告的作者之一、斯坦福大学计算机科学教授詹姆斯·邹(音)说，“如此巨大的差异程度”对于“尖端的ChatGPT”而言是意想不到的。

詹姆斯·邹说：“当我们在对大型语言模式进行调整，以改善其在某些任务中的表现时，这样做实际上可能会有许多意想不到的后果，它们或许会影响这个模型在处理其他任务时的表现。在人工智能模型如何回答问题方面，存在各式各样耐人寻味的相互依赖，它们可能在一定程度上导致我们所观察到的这些每况愈下的表现。”

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

赞 (0)

投稿用户

全省党校（行政学院）系统创立优秀教学科研咨询成果评审机制（全国党校系统优秀科研成果）

上一篇 2024年4月20日下午12:03

哪些项目可以使用竞争性磋商服务？（哪些项目可以使用竞争性磋商服务项目）

下一篇 2024年4月20日下午12:15

“执法宝典”让行政执法人员执法有底气（让行政执法有力度更有温度）

法治日报讯记者赵婕司法部行政执法协调监督局4月13日召开全面推行行政执法案例指导制度座谈会,各省(区、市)司法厅局的有关同志线上参加会议。会上,宣布了全国行政执法指导案例获奖名…

科研百科 2023年8月9日
1290
课题验收会议讲话

尊敬的各位老师，各位评审专家，各位同学：大家好！今天，我们欢聚一堂，召开课题验收会议，共同验收我们研究的课题。我代表课题组，向全体老师和同学们表示热烈的欢迎和衷心的感谢！本次研…

科研百科 2024年11月16日
20
HKOffice安全云办公系统

HKOffice安全云办公系统：提升工作效率，保障数据安全随着数字化时代的到来，云办公已经成为企业日常办公的主流方式。HKOffice安全云办公系统则是在此基础上发展起来的一种新…

科研百科 2024年11月6日
00
低代码平台的优缺点有哪些？（低代码平台的优缺点有哪些）

低代码平台是在传统软件开发模型基础上推出的一种新型开发模式，它的主要优势包括以下几点： 1. 提高开发效率：低代码平台提供了大量预设的界面组件和数据处理模块，使得开发工作变得简单快…

科研百科 2024年7月8日
300
各级纪检监察机关紧盯关键环节监督推动财政资金更好发挥效益（加强资金监管,切实提高财政资金使用效益）

监督保障流向明确、使用规范、进度可控推动财政资金更好发挥效益近期，各地陆续公开年中财政运行情况。从公布数据看，相关职能部门强化运用政府专项资金支持重大项目建设，同时确保具备条件…

科研百科 2022年9月23日
1750
全国优秀共产党员、全国优秀党务工作者和全国先进基层党组织名单

一、全国优秀共产党员（400名）北京吴良镛清华大学建筑学院教授（离休），中国科学院院士、中国工程院院士童朝晖首都医科大学附属北京朝阳医院党委常委、副院长，北京市呼吸疾病研究…

科研百科 2024年6月26日
300
今天给大家介绍几款比较实用的软件（今天给大家介绍几款比较实用的软件呢）

今天给大家介绍几款比较实用的软件（今天给大家介绍几款比较实用的软件呢）软件一：Snap Edit Snap Edit是一款免费且易于使用的在线润饰工具，可一键删除图片中的多余对象…

科研百科 2024年3月29日
700
上市公司定向增发案例分析

上市公司定向增发案例分析近年来，随着资本市场的不断发展和优化，上市公司定向增发作为一种重要的融资方式逐渐得到了广泛的应用。在定向增发中，上市公司可以通过融资来扩大生产规模、提升市…

科研百科 2024年11月12日
00
crm客户关系管理信息系统有哪些(crm客户关系管理信息系统)

CRM客户关系管理信息系统：提升客户满意度的利器 CRM(Customer Relationship Management)客户关系管理信息系统是一种用于管理客户关系的软件系统，可…

科研百科 2024年6月2日
510
nc项目管理系统有哪些(nc项目管理系统)

nc项目管理系统nc项目管理系统教师的职责:根据校长的要求,根据学校办学经费的需求,合理安排教职员工的工作,维护学校的团结。1. 职责:(1)保证教育教学质量,掌握学生的心理状况,…

科研百科 2024年5月17日
690