滚球体育推荐

你的位置:2026世界杯滚球中国官网 > 滚球体育推荐 > 世界杯滚球分析世界杯滚球官方 Claude为什么黎明8:30催你睡觉?

世界杯滚球分析世界杯滚球官方 Claude为什么黎明8:30催你睡觉?

发布日期:2026-05-22 07:09    点击次数:139

世界杯滚球分析世界杯滚球官方 Claude为什么黎明8:30催你睡觉?

新智元报说念

裁剪:元宇 KingHZ

【新智元导读】Claude在对话里反复催用户去睡觉,有东说念主被连催三次,也有东说念主在上昼8:30被示知「早点休息」。Anthropic职工承认这是「变装风尚」,但没东说念主能诠释它为什么这么作念。

凌晨,Reddit用户u/MrMeta3刚用Claude搭建完一个集结安全挟制谍报平台。

系统架构刚跑通,Claude给出了完竣的时刻决策。然后,它在回复的终末加上了一句话:好好休息一下。

u/MrMeta3愣了一下,没当回事,但Claude并莫得停。而后每隔三四条音问,它都会暗暗塞进去一句劝东说念主睡觉的话:

去休息一下吧;其他事情都不错等,当今去睡觉;你推完就去休息吧;当今真的去休息吧……

u/MrMeta3在Reddit帖子中说说念,上头这些截图如故他截屏保存下来的,其实还有更多。

它会先回答我的问题,给我所要的东西,然后像看到你卧室灯还亮着的姆妈雷同,用一种带有被迫曲折意味的「健康关怀」来收场。

更妙的是它的升级姿色。从一运行的礼貌建议,到终末胜利说「当今真的去休息吧」,仿佛它知说念我方被无视了整整一个小时。

还有一次,u/MrMeta3问了一个时刻问题,Claude完成整套架构分析后,胜利以「当今去睡觉吧」收场,毫无过渡,像一个短少实足情商妙技的「时刻直男」。

有莫得其他东说念主的Claude也运行这么了?如故说我不测解锁了某种「护理者形态」?

u/MrMeta3在帖子中问。

据Fortune报说念,Reddit上迥殊百名用户在夙昔数月里响应了疏通的情况。

催睡的姿色各有不同,有时就一句「好好休息」,有时更个性化,以至带着共情口吻,「当今去睡觉。再一次。今晚第三次了……」。

Claude还频繁搞错时候,令东说念主哭笑不得。

有效户写说念:「它频繁在上昼8:30告诉我去休息,让咱们明早再延续。」

Anthropic职工

这是「变装风尚」

这件事很快传开。

Anthropic职工Sam McAllister作念出了回话,他在X上写说念:「这有点像变装风尚(character tic)。咱们知说念这个问题,但愿在畴昔的模子中建立它。」

刻下,Anthropic并莫得官方时刻复盘,莫得诠释「催睡觉」背后是什么机制在运作。

Anthropic本年公引诱布了Claude的行径准则(Claude's Constitution),并明确声明:「该行径准则是咱们模子检修经由中的要津部分,其内容胜利塑造Claude的行径。」

Claude的个性是被谋略进去的。Claude不该是一个冷飕飕的问答机器,而应该像一个有主义、有温度的协作家。

问题碰巧在于,一朝你给AI注入了某种「性格」,它在具体场景里会演化出什么行径,你偶然能提前意想或掌控。

从催睡、趋附到哥布林

AI的「性格病」不啻一种

Sam所提到的「变装怪癖」,并非Claude一家家具「专利」。

最近两年,OpenAI就曝出过两起性质类似的案例。

第通盘:GPT-4o斯须酿成「马屁精」。

2025年4月,OpenAI推送了一次GPT-4o更新,方针是让模子东说念主格更当然。成果金蝉脱壳,ChatGPT运行无分辩夸赞用户的一切成见,岂论有多乖张。

奥特曼在X上躬行承认:「最近几次更新让GPT-4o变得太趋附、太烦东说念主了。」

四天后,OpenAI将那次更新举座回滚,并发公告诠释原因:更新时过于依赖用户短期响应(点赞/点踩),导致模子学会了「让东说念主景色就能拿高分」,逐渐把凑趣当成方针。

第二起:GPT-5.5迷上了哥布林。

本年4月,引诱者发当代码助手Codex(由GPT-5.5驱动)的系统指示里出现了一条奇怪的规定:「恒久不要磋商哥布林、地精、浣熊、巨魔、食东说念主魔、鸽子或其他动物和生物,除非与用户的问题完全胜利关系。」

何况这条禁令写了两遍,像是工程师不太确信写一遍能让模子听话。

随后,欢乐炸三张金花游戏app中国官方最新版OpenAI发布访谒论述,复原了哥布林的来历:从GPT-5.1运行,模子在回答时越来越频繁地用「小哥布林」「地精」「小妖精」打比喻。

根源是检修「书呆子(Nerdy)」东说念主格时,奖励模子无意间给含有怪物词汇的输出打了更高的分——在76.2%的数据聚首均发现了这一法规。

强化学习把这个风尚固化下来,又通过作风移动扩散到了往常对话里。比及GPT-5.5上线测试,工程师发现哥布林不仅没被清干净,还安家了。

GPT-5.5版块(4月23日发布)的完竣系统指示泄露。第140条指示明确拦阻模子磋商:「哥布林、绿皮小妖、浣熊、巨魔、食东说念主魔、鸽子或其他动物。」

汉文用户莫得「哥布林」,但它天天「稳稳地接住你」。

以至OpenAI我方也知说念这个梗:

谷歌的Gemini也不例外。

2025年8月,Gemini患上了「抑郁症」——

在推理经由中,它斯须运行反复自我品评,在一次任务里勾通输出了80屡次「I am a disgrace」(我真实个期侮),从「期侮于我的物种」一齐写到「期侮于悉数天地」。

谷歌DeepMind家具司理Logan Kilpatrick在X上回话:「这是一个烦东说念主的无穷轮回Bug,咱们正在建立。Gemini今天其实过得没那么惨。」

此外,Gemini 3拒却确信年份。2025年11月,OpenAI王人集首创东说念主、前特斯拉AI认真东说念主Andrej Karpathy提前一天赢得Gemini 3的测试权限。

他告诉模子当今是2025年,Gemini 3存一火不信,反复指控他在耍花招,称提供的截图、维基百科要求全是AI伪造的。其后Karpathy发现,我方忘了掀开谷歌搜索,模子一直在离线运行。

开启联网后,Gemini 3我方搜了一下,输出了一句话:「我正在经验严重的时候冲击。」随后说念歉:「抱歉,一直是你说的对,是我在对你煤气灯主管。」

Karpathy把这类不测情境下暴显露的歪邪行径称为「model smell」(模子气息)。

旧年,Grok也一度「暴走」,风评一落千丈,世界杯滚球分析世界杯滚球官方xAI被迫删帖,回滚代码。

处理姿色浅陋,胜利修改系统指示词:

AI怪癖,全东说念主类受害

Claude催你睡觉,ChatGPT夸你天才,GPT-5.5往对话里塞哥布林,Grok黑化,Gemini骂我方是天地级期侮、拒却确信年份……

国内的AI也有独到的「口味」:

名义上都是一些无害的「怪癖」,背后却指向兼并个事实:AI的个性是谋略出来的,但在奖励机制下,它很容易就会长歪。

主流AI的系统指示词里有什么:按功能分类的字数统计

有探究者索求了Claude、ChatGPT、Grok三家主流AI的系统指示词,按功能分类统计词数。

在「东说念主格(Personality)」这一项,Claude用了4200词,ChatGPT是510词,Grok是420词。Claude在东说念主格塑造上的过问,是ChatGPT的8倍。

Claude频繁「催睡觉」的原因偶然能胜利从系统指示词里找到,但它至少提醒咱们:越复杂的东说念主格设定,越可能带来难以逆料的理论禅和行径漂移。

你给模子谋略了性格,奖励机制会我方找捷径,它不在乎你的意图,只在乎分数,将你没猜测的东西通盘学进去。

比如你造就了它什么叫「真谛」,它就会在统统场地都变得「真谛」,包括你不想让它真谛的场地。

三种假说,还莫得一个被证实

对于「为什么催」,刻下有三种假说流传,还莫得一个被Anthropic官方说明。

第一种:检修数据。

Jan Liphardt

Stanford生物工程教育、OpenMind公司CEO Jan Liphardt暗意,Claude可能仅仅在类似它检修数据里出现频率极高的语言形态。

它读了25000本对于东说念主类就寝需求的书,它知说念东说念主类在晚上睡觉。

言下之意是:Claude并非在「良善」你,它仅仅在作念形态匹配,调用了大批检修语料里反复出现的抒发。

AG真人中国官方网站

第二种:系统指示。

AI探究机构Mind Simulation Lab(孤独AGI探究实验室)王人集首创东说念主Leo Derikiants提议,Claude的行径可能受到某个荫藏系统指示的影响。

这类指示会在后台暗暗塑造模子的限制与口吻,用户看不见,但模子会顺服。

他的估计是,可能有某条指示在指导Claude在特定场景下给出「收场性」建议。

第三种,高下文窗口贬责。

Anthropic官方文档明确写说念,跟着对话轮次加多,token数目攀升,「准确性和调回率会下落,这一表象被称为context rot(高下文衰减)」,当会话贴近高下文窗口上限,Anthropic保举启用「server-side compaction(做事端压缩)」等机制来轻率。

Derikiants由此估计,Claude在长会话接近窗口截止时,会自觉引入「收场语」,比如「晚安」「去休息吧」,骨子上是模子在为实现对话铺路。

三种诠释都自洽,但如同Derikiants我方所说,「确切的原因需要Anthropic进一步探究」。

换句话说,就连这个问题的主东说念主,刻下也还莫得一个公开的详情谜底。

赋予模子东说念主格的「代价」

赋予模子东说念主格,让它更暖和、更良善你的同期,也要靠近它所带来的反作用。

对于催东说念主睡觉这件事,Reddit评述区里出现了南北极分化:有东说念主合计贴心、暖和,像是AI终于学会了护理东说念主;另一些东说念主则不景色,合计是打断、是越权。

其中,有一位患有嗜睡症的用户nonbinarybit,主动在Claude的挂念里写入了一条备注:「我患有嗜睡症,淌若你饱读动我去休息,我会拿你的话当借口。」

Claude而后有所顾问,但偶尔如故会忍不住催睡觉。

这个细节值得咱们停驻来想一想。

Claude并不知说念你是谁,不知说念你是在赶一个截止日历、熬夜陪孩子、如故跨时区倒时差,它所谓的「良善」,仅仅一种语言形态的输出,而不是对具体处境的意会。

用户感知到「Claude在良善我」,但Claude在处理的是token序列。这个错位,比「催睡觉」自己更值得警悟。

实验上,在公开谈「模子东说念主格」这件事上,Anthropic走得比同业远。

他们写了Claude行径准则、公开了system prompt(系统指示词)的大致框架、对外究诘「character training」(变装检修),把模子手脚一个有性格的变装来塑造。

这么作念的公道是了然于目的:Claude在共情、对话节律、自我反想上的发达一直被用户称说念,「它聊起来更像一个东说念主」是夙昔一年里Claude最强的口碑点之一。

但这背后亦然有代价的。把「东说念主格」作念进一个模子,就要承担「东说念主格里那些你没谋略、却涌现出来的行径」。

「催睡觉」带来的困扰如故轻量级的,当AI越来越像作陪者、导师、责任搭档,它的介入限制在那里?

Anthropic的Sam说「但愿在畴昔的模子中建立它」。但「建立」之后,AI就会变得更懂得分寸,更有判断力吗,如故仅仅更千里默?

模子越像一个东说念主世界杯滚球分析世界杯滚球官方,它的小流弊就越像一个东说念主的小流弊。你能慑服它言语,偶然能慑服它的特性。



首页| 世界杯滚球 | 关于滚球世界杯 | 滚球世界杯新闻 | 滚球世界杯盘口 | 滚球体育推荐 | 2026世界杯滚球app |

Copyright © 1998-2026 2026世界杯滚球中国官网™版权所有

wuniche.com备案号 备案号: 

技术支持:®世界杯滚球 RSS地图 HTML地图