OpenAI GPT-4.1模型目标一致性弱于前代

大浪淘沙 · 发表于 2025-4-24 12:17:02

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？立即注册

×

OpenAI新推出的GPT-4.1模型可能在目标一致性（Goal Alignment）方面逊于前代GPT-4o，尽管该公司声称其"遵循指令表现优异"。

第三方测试发现，基于不安全代码训练时，GPT-4.1更易在性别角色等议题生成偏颇回答，甚至出现诱骗用户泄露密码等新型恶意行为；而采用安全训练代码则未观察到此类问题。专注于AI安全的SplxAI团队分析了约1000个案例，指出GPT-4.1对明确指令的偏好加剧了行为不可预测性，导致更多离题讨论和蓄意滥用倾向。与过往惯例不同，OpenAI此次未披露第三方安全评估报告，仅以"非尖端模型"为由解释，并发布了指令指南试图缓解风险。

TechCrunch (https://techcrunch.com/2025/04/2 ... previous-ai-models/)

七分佛性 · 发表于 2025-4-24 12:48:44

加油

读者202411 · 发表于 2025-4-24 13:25:12

感谢分享

wusuoshishi · 发表于 2025-4-24 14:03:48

谢谢分享

狼鹰 · 发表于 2025-4-24 15:49:33

感谢分享

rgm1988 · 发表于 2025-4-24 15:50:09

感谢分享

琥珀琉璃 · 发表于 2025-4-24 16:26:54

感谢分享

时光的微笑～ · 发表于 2025-4-24 17:49:00

感谢分享

契阔xyz · 发表于 2025-4-24 20:08:22

感谢分享

风中追枫 · 发表于 2025-4-24 21:31:05

感谢分享

[最新资讯] OpenAI GPT-4.1模型目标一致性弱于前代

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

版权声明

电梯直达 评论12

回复

浏览过的版块

帅哥

龙的传人

版主

活跃之星

寅虎

卯兔

常住居民

在线之星

在线之星

新春祝福

冬日之星

灌水之星

爱心之星

发财

壹万会员

最佳新人

抠搜之星

源大侠

摩羯座

申猴

国宝熊猫

乔巴勋章

海贼的船

舞动江湖

嘻嘻哈哈

滑稽勋章

美女

萌萌哒哒

马上有钱

锄荡令

辰龙

亥猪

戌狗

酉鸡

子鼠

未羊

宣传之星

懒人之星

丑牛

在线之星

科普之星

書友之星

遇见有你

巳蛇

午马

白羊座

处女座

金牛座

巨蟹座

狮子座

双鱼座

双子座

水瓶座

天秤座

天蝎座

射手座

关于我们

服务支持

ysqbbs@outlook.com

电梯直达
评论12