
↑ 阅读前记得关注+Star⭐️,这样每天都能第一时间收到更新 Andrej karpathy 放了一个关于如何理解LLM并与之交互的最新观点的关键点:不要把大语言模型当作实体,而应该当作模拟器。这种观点的转变直接影响用户与人工智能交互的方式和影响。卡帕蒂建议,当人们想要探索某个话题时,应该避免使用这样的提问技巧:“你对 XYZ 有何看法?”原因很简单:没有“你”。卡帕西认为,大模特不会像人们那样思考某个主题并随着时间的推移形成自己的观点。如果用户坚持使用“你”来询问 kquery,LLM 将使用基于精细调整的数据统计规则的隐式“身份嵌入向量”,并基于它模拟响应。虽然这样做没有问题,但卡帕蒂指出,这个谜团并不像人们通常想象的那样问人工智能。更有效我们的提问方式是基于模拟器定位。卡帕蒂立刻给出了更好的办法:“什么样的人适合探索xyz话题?你说他们是什么呢?”这样,用户就可以让LLM引导或模拟多个视角,而不是局限于单一的“AI个性”统计数据形态。对于AI人格工程,有网友提出了一个反直觉的问题:模型会不会接受回报率最高的人格?这意味着它就像最适合回答问题的领域专家一样。卡帕蒂承认,实际上存在针对“你”规模的模拟的工程工作。目前,通过SFT(监督微调)和RLHF(基于人类反馈的强化学习),开发者正在努力创建一种“个性”,可以获得高额奖励,赢得用户或裁判模型的喜欢,或者模仿某种响应风格。这创造了一个新兴的复合个人但卡帕蒂强调,“你”是经过刻意设计、设计和强加的。它本质上仍然是建立在代币模拟引擎之上,而不是以普通人可以理解的方式随着时间的推移而构建的不断发展的“思维”。可验证和不可验证字段。最后Karpathy指出,在不同的领域,这种差异的影响是不同的:在经过验证的领域(例如数学、编程):情况相对简单,从专家角度进行的模拟通常是准确的。在不言而喻的领域(例如征求对某个主题的意见/意见):事情变得更加有趣和复杂。在后一种情况下,用户很难知道他们在谈论的“你”是谁,来自哪里,以及给予多少。直接证明一下。使用Karpathy建议的直接方法来研究Karpathy的上述观点:LLM(Gemini 3 Pro)的回答:发现“LLM是模拟器而不是存在”的主题,最合适的virtual 圆桌会议应包括以下几类人:深度学习理论家、认知科学家、RLHF(带有人类反馈的强化学习)一线工程师和高级文字专家。如果他们在一起的话,他们会这么评价Karpathy的观点: 1. 深度学习理论家(The Deep Learning Theorist)视角核心:统计与概率分布 Karpathy说中了。从数学上来说,模型只学习数据在多维空间中的分布。所谓的“响应”本质上是从大概率分布中进行条件采样。当你问“你觉得怎么样”时,该模型并没有调动自我意识的内在中心。简单计算一下:在互联网海量文本中,当出现“你觉得怎么样”这个句型时,哪个token跟随它的概率最高。它模拟“互联网平均答案”或“fine-t datayes 中定义的完美助手”绝对有没有物理或心理“实体”的想法。 2.核心RLHF工程师(对齐工程师)视角:关于“硬加”和“工程”的工程实现和奖励机制,我们最了解。基本模型就像一个疯狂的梦想生成器,可以模仿莎士比亚,或者可以模仿代码,或者可以模仿互联网巨魔。我们通过 RLHF 敷上面膜。那个有礼貌并且总是说“作为智能语言的人工模型……”的“你”实际上是一种特定的行为模式,我们通过安全性和有用性的奖励模型与之斗争。 Karpathy是对的,它只是一个薄薄的界面,其下面仍然是通用代币模拟引擎 3.认知科学家/思想哲学家(认知科学家)观点的核心:主体性(代理)和时间连续性的关键在于karpathy提到的时间和观点的构建。人类自我建立在记忆和经验的连续性之上与世界持续接触。 LLM毫无意义。每一次对话都是一个新的开始,没有过去,也没有未来。它没有随着时间的推移生活在世界各地,因此它无法像人类那样拥有基于积累的生活经验的视角。它模拟有观点的人会说的话,这在本体论上与有观点不同。 4、高级文字专家(提示工程师)愿景的核心:实用主义和语境激活。从实际角度来看,将 LLM 视为“模拟器”可以将性能提高一个数量级。如果我问“你对这行代码有何看法”,它可能会给出与 RLHF 一致的非常笼统的解释。但如果我按照 Karpathy 的逻辑,将其设置为“模拟一个高级 Linux 内核维护者”,它就会要求训练数据中特定的、高权重分布的专业知识来承认“如果你不存在”,而是让我们更自由地定义“你是谁”,从而挤压模型的最强性能。 》形成这群人的共识:他们都会一致认为卡帕蒂不仅是在修正标题,更是揭示了大“变色龙”模型的本质。对我来说非常重要,每天更新:欢迎转发、推荐和评论,别忘了关注我
特别声明:以上内容(包括日报或视频)由自媒体平台“网易号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易HAO用户上传发布,网易HAO为社交媒体平台,仅提供信息存储服务。