扬帆出海，专注服务中国互联网出海！

首页
活动
人脉&社群
找服务
合作
企业会员
资讯
最新资讯文章专题 7x24快讯
报告
数据报告报告专题
付费专栏
短剧精选快问快答合集出海年鉴合集 iOS、GP上下架避坑指南
出海数据库
出海企业库出海产品库月出海榜单海外产品榜单
全球产品与增长展会
PAGC 2026 PAGC 2025 PAGC 2024 PAGC 2023 PAGC 2022 PAGC 2021

扬帆创投微信小程序

更聚焦的出海投融资平台
精准高效领先的融资对接服务

微信扫一扫进入小程序

OpenAI发布GDPval，首次用“AI vs 行业专家”的胜率量化模型在九大GDP核心行业的经济价值表现。

摘要

Claude Opus 4.1 49% 任务不输人类，GPT-5-high 40.6%，差距主要来自图表美观度而非实质能力。

GDPval-v0仅测“写报告”这一单点任务，未覆盖交互流程与实操环节，远未到取代程度。

15个月内从GPT-4o的13.7%跃升至40%+，OpenAI预计曲线将继续陡峭上升。

工具属性优先——帮专业人士节省时间，让其聚焦更高价值工作，而非直接替代人类岗位。

当地时间周四（9月25日），人工智能（AI）研究公司OpenAI发布了一项新的基准测试，用于比较其AI模型与各行业专业人士的工作表现。

这项测试名为GDPval，是一次初步尝试，旨在评估OpenAI的系统距离在经济价值工作上超越人类有多近。而经济价值工作是OpenAI开发通用人工智能（AGI）的关键环节。

OpenAI周四表示，其GPT-5模型以及竞争对手Anthropic公司的Claude Opus 4.1“已经接近行业专家的工作质量”。

这并不意味着OpenAI的模型会立刻取代人类工作。尽管一些CEO预测AI在几年内就会取代人类，但OpenAI承认GDPval目前只涵盖人们实际工作中有限的一部分任务。不过，这是该公司用来衡量AI向这一里程碑迈进的最新方式之一。

GDPval基于美国GDP贡献最大的九个行业，包括医疗、金融、制造业和政府等领域。测试覆盖了44种职业，从软件工程师到护士再到记者。

在首个版本GDPval-v0中，OpenAI邀请资深专业人士对比AI生成的报告与其他专业人士的成果，并挑选出更优者。

例如，某项任务要求投行人员为“最后一公里配送行业”制作竞争格局分析，并与AI生成的报告进行对比。OpenAI随后将AI模型在全部44个职业中对抗人类报告的“胜率”进行平均计算。

结果显示，GPT-5-high（高算力版本GPT-5）在40.6%的情况下被评为优于或与行业专家持平。

而Anthropic的Claude Opus 4.1模型则在49%的任务中被评为不输于行业专家，这一表现超过了OpenAI的模型。

OpenAI对此解释称，之所以Claude得分更高，部分原因是其倾向于生成更美观的图表，而非纯粹性能更优。

需要说明的是，大多数职业的工作远不止提交研究报告，而这却是GDPval-v0所测试的全部内容。OpenAI承认这一点，并计划在未来开发更全面的测试，涵盖更多行业和交互式工作流程。

尽管如此，OpenAI仍认为GDPval的进展具有重要意义。

OpenAI首席经济学家Aaron Chatterji在接受采访时表示，GDPval的测试结果表明，这些岗位上的人们可以利用AI模型节省时间，从而专注于更有意义的工作。

“因为模型在某些事情上已经变得很擅长，随着能力的提升，人们可以越来越多地把部分工作交给模型，去做潜在更有价值的事情，”Chatterji说。

OpenAI评估负责人Tejal Patwardhan表示，她对GDPval的进步速度感到鼓舞。

Patwardhan指出，约15个月前发布的GPT-4o模型得分仅为13.7%（胜出或持平人类），而GPT-5的成绩几乎提高了三倍。她预计这一趋势还会继续。

原文链接：点击前往 >

文章作者：科创板日报

版权申明：文章来源于科创板日报。该文观点仅代表作者本人，扬帆出海平台仅提供信息存储空间服务，不代表扬帆出海官方立场。因本文所引起的纠纷和损失扬帆出海均不承担侵权行为的连带责任，如若转载请联系原文作者。更多资讯关注扬帆出海官网：https://www.yfchuhai.com/

{{likeNum}}

好文章，需要你的鼓励

相关阅读

热门活动

更多

AI产业出海峰会

上海市 · 上海市

2026游戏理想季 2日AI&GAME之旅

上海市 · 上海市

文章热榜

更多

GPT-5.6来了，Fable 5慌了？

马来西亚啤酒厂里，一罐罐"重庆啤酒"正式下线

苹果或放弃M6高端版本，押注M7系列AI芯片

万亿智谱，凭什么？

《耻辱》系列开发工作室或将被微软彻底关停

热门报告

更多

《2024泛娱乐出海白皮书》

《2024中国互联网出海大家之谈·年鉴》上册游戏+社交+短剧

请前往扬帆出海小程序完成个人认证

认证通过后即可申请入驻

扫码添加小助手

微信扫描二维码，添加小助手
微信号：yfch103

APP
小程序

微信公众号

微信小程序

扬帆出海APP

扬帆出海APP

微信
公众号

微信公众号

关注扬帆出海

专注服务互联网出海！

出海人
社群

微信公众号

扫码进群

与16万+出海人同行！