{
  "title": "上下文图谱究竟是什么?",
  "excerpt": "围绕上下文图谱的讨论已经爆发,但这个术语本身已经成为一个罗夏墨迹测试。这不是为你的智能体添加记忆那么简单——而是要重新思考我们对数据、时间和组织知识的假设。双时钟问题揭示了为什么我们在企业系统中遗失了时间的一半,以及为什么这本质上是一个表示问题,而非数据库问题。",
  "content_html": "<p>上周,我写了一篇关于 Jaya Gupta 关于上下文图谱的病毒式帖子的反应文章 [1]。\"决策记录系统\"这个想法引起了深刻共鸣,它勾勒出了智能体基础设施从工具到技能再到记忆的演进。但自那以后,讨论已经爆发,很明显\"上下文图谱\"这个术语本身有点像罗夏墨迹测试。每个人看到的都不同。</p>\n\n<p>PlayerZero 的创始人 Animesh Koratana 撰写了一系列后续文章,拨开迷雾,直击上下文图谱的本质,以及为什么它在结构上如此难以构建 [2] [3]。他的见解对于任何认真构建企业智能体 AI 的人来说都至关重要。这不是关于\"为你的智能体添加记忆\"或连接图数据库。而是要重新思考我们关于数据、时间和组织知识本质的假设。</p>\n\n<h2>双时钟问题:为什么我们遗失了时间的一半</h2>\n\n<p>Koratana 最有力的见解是他所说的<strong>双时钟问题</strong>。我们为<strong>状态时钟</strong>构建了价值万亿美元的基础设施:现在什么是真的。你的 CRM 存储最终交易价值。你的工单系统存储\"已解决\"。你的代码库存储当前状态。</p>\n\n<p>但我们几乎没有<strong>事件时钟</strong>的基础设施:发生了什么,以什么顺序,以及基于什么推理。git blame 显示<em>谁</em>将超时从 5 秒改为 30 秒,但<em>为什么</em>已经消失了。CRM 显示\"关闭输单\",但它不会说你是第二选择,赢家有一个你下季度将发布的功能。正如 Koratana 所说:</p>\n\n<blockquote>\n<p>\"我们已经为现在什么是真的构建了万亿美元的基础设施。但几乎没有为它为什么变成真的构建任何东西。\"</p>\n</blockquote>\n\n<p>这就是问题的核心。我们要求智能体在没有先例的情况下行使判断。我们在没有判例法的情况下用判决训练律师。上下文图谱是事件时钟的基础设施。它是企业的判例法。</p>\n\n<h2>五坐标系问题:为什么这不是数据库问题</h2>\n\n<p>那么为什么我们不能只是构建一个更好的数据库呢?因为上下文图谱需要跨五个不同的坐标系进行连接,而这些坐标系没有共享键:</p>\n\n<ol>\n<li><strong>事件</strong>:发生了什么?</li>\n<li><strong>时间线</strong>:何时发生的?</li>\n<li><strong>语义</strong>:它意味着什么?</li>\n<li><strong>归属</strong>:谁拥有它?</li>\n<li><strong>结果</strong>:它导致了什么?</li>\n</ol>\n\n<p>每一个都有不同的几何结构。时间线是线性的。事件是顺序的。语义存在于向量空间中。归属是图结构的。结果是因果 DAG。而且键是流动的。电子邮件中的\"Jaya Gupta\",合同中的\"J. Gupta\",以及 Slack 中的\"@JayaGup10\"是同一个实体,却没有共享标识符。</p>\n\n<p>传统数据库是为单个坐标系内稳定键的连接而构建的。上下文图谱需要同时跨所有五个坐标系进行概率连接。这不是数据库问题;这是一个表示问题。</p>\n\n<h2>作为知情行走者的智能体:我们如何解决表示问题</h2>\n\n<p>如果每个组织的本体都不同且不断变化,我们怎么能指望对其建模呢?Koratana 的答案是我们不必这样做。智能体为我们做这件事。</p>\n\n<p>当智能体处理一个问题时,它的轨迹是通过组织状态空间的跟踪。它是本体的隐式映射,通过使用发现而不是预先指定。这是来自图表示学习(node2vec)的关键见解:你不需要知道图的结构就能学习它的表示。你只需要行走它。</p>\n\n<p>智能体是<strong>知情行走者</strong>。它们的轨迹不是随机的;它们是问题导向的。通过积累足够多的这些轨迹,我们可以学习编码组织结构的嵌入。我们可以了解到两个从未互动的工程师在结构上是等价的,因为他们在不同子图中扮演相同角色。我们可以了解到某个事件序列是客户流失的前兆,即使这些事件从未被明确关联。</p>\n\n<h2>这对构建者实际意味着什么</h2>\n\n<p>那么,上下文图谱究竟是什么?它不是图数据库。它不是向量存储。它是<strong>从解决问题的智能体轨迹中衍生的组织推理的学习表示</strong>。</p>\n\n<p>这对我们如何构建智能体系统具有深远的影响:</p>\n\n<ol>\n<li><strong>智能体不是在构建上下文图谱;它们在解决值得解决的问题。</strong>上下文图谱是它们工作的涌现属性。重点应该放在将智能体部署到真实工作流中,而不是预先构建完美的本体。</li>\n<li><strong>价值在于轨迹,而不是状态。</strong>我们需要将重点从存储最终状态转移到捕获如何达到该状态的完整可重放历史。</li>\n<li><strong>这是一个机器学习问题,而不是数据工程问题。</strong>目标不是构建完美的数据模型,而是学习一个对推理有用的表示。</li>\n</ol>\n\n<p>构建上下文图谱不是购买一款新软件。它是关于我们如何在智能体时代思考数据、时间和工作本质的根本转变。它是关于认识到我们拥有的最有价值的资产不是我们的数据,而是我们每天做出决策的累积智慧。它是关于构建基础设施来最终捕获这种智慧并将其付诸实践。</p>\n\n<p><strong>参考文献:</strong></p>\n\n<p>[1] <a href=\"https://x.com/JayaGup10/status/2003525933534179480\">Gupta, J. (2025, December 23). <em>AI's trillion-dollar opportunity: Context graphs</em>. X.</a></p>\n\n<p>[2] <a href=\"https://www.linkedin.com/pulse/why-context-graphs-rare-wild-animesh-koratana-3wzte/\">Koratana, A. (2026, January 1). <em>Why context graphs are rare in the wild</em>. LinkedIn.</a></p>\n\n<p>[3] <a href=\"https://www.linkedin.com/pulse/how-build-context-graph-animesh-koratana-6abve\">Koratana, A. (2025, December 28). <em>How to build a context graph</em>. LinkedIn.</a></p>",
  "source_hash": "sha256:c9f8cb57d671053bc8f97aa3c11eeb86305f270ab5994d742a815877626e63fb",
  "model": "claude-sonnet-4-5-20250929",
  "generated_at": "2026-01-02T02:09:31.559255+00:00"
}