上下文工程权威报告:构建下一代智能系统

执行摘要

本报告对“上下文工程”(Context Engineering)这一新兴领域进行了全面而深入的分析。报告的核心论点是,上下文工程并非对“提示工程”(Prompt Engineering)的渐进式改进,而是一种根本性的范式转变。为了将人工智能(AI)从实验性的演示阶段推向可用于生产环境、执行关键任务的企业级系统,这种转变至关重要。报告的主要结论是:在人工智能时代,源自企业专有数据和流程的上下文,是构建持久竞争优势的最核心要素。本报告将详细阐述上下文工程的定义、技术架构、企业实施路径以及其在各行业的应用实例,旨在为技术领导者、架构师和业务决策者提供一个清晰的战略蓝图。


第一部分:上下文革命:从提示到工程

本部分旨在建立上下文工程的基础概念,明确其定义,解释其至关重要的原因,并追溯其思想渊源,以提供历史深度和理论可信度。

1.1. 定义新范式:一个系统,而非一个字符串

上下文工程可以被正式定义为:“一门设计和构建动态系统的学科,旨在为大型语言模型(LLM)在正确的时间、以正确的格式提供正确的信息和工具,从而使其具备完成任务所需的一切要素” 1。这一定义强调了从业者关注点的转变:不再是精心制作一个静态的文本字符串(即提示),而是构建一个能够在运行时动态组装上下文的复杂系统 1

这一领域的思想领袖们也从不同角度强化了这一定义。前特斯拉AI总监、OpenAI创始成员Andrej Karpathy将其描述为“在每一步中,用恰到好处的信息填充上下文窗口的精妙艺术和科学” 4。Shopify的CEO Tobi Lutke则认为,上下文工程的核心是提供“使LLM能够合理解决心任务所需的全部上下文” 5。AI专家Phil Schmid总结道,其精髓在于“在正确的时间、以正确的格式,提供正确的信息和工具” 6

为了更清晰地区分这两个概念,下表进行了详细对比。提示工程关注的是“如何提出正确的问题”,而上下文工程则关注“如何确保AI拥有回答该问题所需的正确知识和环境” 3

表1:提示工程 vs. 上下文工程

维度 提示工程 (Prompt Engineering) 上下文工程 (Context Engineering)
核心隐喻 提出一个问题 准备一份简报文件
范围 单个输入字符串或模板 1 供给模型的整个信息生态系统 6
方法论 手工制作、语言优化、迭代试错 7 系统设计、数据集成、API管理、信息架构 4
性质 静态的、通常是硬编码的 1 动态的、运行时组装的、不断演化的 1
主要技能 创意写作、领域知识、理解模型特性 7 软件工程、数据架构、系统集成、业务流程分析 4
组织角色 通常是个人技能或小型专业团队 8 跨职能的工程学科(涉及产品经理、数据科学家、工程师) 1
目标 在单轮交互中引出特定的、高质量的输出 7 为复杂的、多步骤任务或自主代理实现稳健、可靠和可扩展的性能 6

从“提示工程”到“上下文工程”的术语转变,并不仅仅是语义上的演进,它背后蕴含着深刻的战略意图。这一转变由Andrej Karpathy等在工业界拥有深厚背景的领袖推动 3,其根本目的在于将与LLM交互的实践从一种难以规模化、依赖个人技巧的“软技能”,提升为一门可预测、可管理、可治理的“硬学科”。“提示工程师”听起来像一门艺术,而企业更倾向于投资那些可复制、可扩展的“工程”学科。通过重新定义问题,即从“如何与AI对话”转变为“如何为AI构建信息供应链”,企业能够利用其现有的IT和数据管理能力来系统性地解决这个问题,从而为大规模投资和团队建设提供了合理的依据和清晰的路径。

1.2. 为何上下文是现代AI的基石

大型语言模型的一个根本局限在于,它们是“无状态的文本预测器”,它们“不会读心术,只会读取令牌(tokens)” 3。这意味着模型的输出质量完全取决于输入上下文的质量。一个设计精良的上下文系统能够解决AI应用中的多个核心痛点:

  • 减少幻觉:通过将模型“锚定”在真实、相关的外部信息中,上下文工程可以显著减少模型产生看似合理但实际上完全错误的“幻觉”信息的倾向 9
  • 提升相关性和准确性:上下文能够引导模型生成不仅连贯,而且完全针对当前任务、用户和情境的输出,从而确保其高度相关和准确 10
  • 确保一致性和可靠性:在多轮对话或复杂的业务流程中,一个管理良好的上下文能够确保AI维持状态的一致性,避免前后矛盾。这对于构建企业级的可靠应用至关重要 6
  • 实现个性化:关于用户的历史记录、偏好和过往交互的上下文信息,是从提供通用回答转向实现真正个性化体验的关键 12

1.3. 思想前驱:上下文感知计算的历史传承

上下文工程并非凭空出现,它是计算机科学领域一个长期挑战在当代的最新体现。其思想根源可以追溯到几十年前。

该领域的奠基性愿景来自Mark Weiser提出的普适计算(Ubiquitous Computing)。他预见到计算机将无缝地融入日常生活,这要求计算设备必须易于使用并能感知其所处的环境 14

20世纪90年代,施乐帕洛阿尔托研究中心(Xerox PARC)的Bill Schilit、Norman Adams和Roy Want等人的开创性工作,为这一领域奠定了基础 15。他们首次提出了“上下文感知”(context-aware)这一术语,并在早期的移动设备PARCTAB上开发了原型应用 15。他们对上下文的经典定义——

“你在哪里,你和谁在一起,以及你附近有哪些资源” 16——与现代AI代理的需求惊人地契合。“你在哪里”对应着用户位置或会话数据,“你和谁在一起”对应着协作场景下的上下文共享,而“附近有哪些资源”则直接对应着AI代理可用的工具、API和数据源。

此外,Dey和Abowd的工作对上下文感知应用进行了分类(如信息呈现、服务自动执行、信息标记以供后续检索),这与现代上下文工程系统的功能(如信息增强、工具调用、记忆管理)形成了直接的对应关系 15

从更哲学的层面看,信息科学家Michael Buckland提出的“作为物的信息”(Information as Thing)理论也与此相关 19。他呼吁厘清“信息”这一被过度使用的术语,这与上下文工程试图为“给AI一个提示”这一模糊概念带来结构和清晰度的努力异曲同工。

回顾历史可以发现,上下文感知计算在90年代面临的核心挑战(如管理动态上下文、确保相关性、触发相应动作)由于硬件、软件和数据的限制,从未在主流市场得到完全解决。而大型语言模型,凭借其巨大的上下文窗口和强大的通用推理能力,恰恰成为了那个缺失的“引擎”。它首次使得大规模消费和处理复杂上下文成为可能,从而让Weiser和Schilit的最初愿景在今天得以实现。然而,历史同样警示我们,当年困扰研究者的隐私和用户接受度等问题 18,在今天依然至关重要,必须被认真对待,以避免重蹈覆辙。


第二部分:上下文工程系统的剖析

本部分将深入剖析上下文工程的技术架构,从抽象概念转向开发者和架构师必须构建和管理的具体组件。

2.1. AI上下文的三大支柱

一个完整的上下文工程系统,其最终提供给LLM的“上下文”是由三种主要形式的数据精心组合而成的 20

  • 特征(结构化上下文)
    • 定义:结构化的、通常是数值或分类的信号,提供关于当前世界或用户状态的、精确的实时或批量处理信息 20
    • 示例:客户的账户状态、最近的交易金额、当前的库存水平、商家的风险评分等 20
    • 功能:它们将LLM的推理过程“锚定”在具体、可衡量的现实世界事实之上,使其能够进行精确的、由数据驱动的决策。
  • 嵌入(语义上下文)
    • 定义:非结构化或半结构化数据(如文本、图像、音频)的密集向量表示,能够捕捉其语义含义 21
    • 机制:嵌入技术将高维度的非数值数据转换为机器学习模型可以处理的数学格式,从而可以比较对象之间的相似性和相关性 21。这与效率较低的独热编码(one-hot encoding)等方法形成鲜明对比 21
    • 示例:产品描述、支持文档、用户评论或整个对话记录的嵌入向量 23
    • 功能:它们使LLM能够理解庞大知识库中信息的含义关系,从而实现对非结构化信息的语义搜索和相关内容检索。
  • 提示(编排上下文)
    • 定义:在推理时,负责组装和构建上述特征与检索到的嵌入的动态指令 7
    • 功能:提示是连接整个系统的“胶水”。它远不止用户的查询本身,而是一个复杂的模板,其中可能包含系统指令、少量示例(few-shot examples)、检索到的特征和嵌入,以及输出格式指南 1。最终的提示编排了LLM应如何利用所有提供的上下文来生成响应。

当前广受欢迎的“检索增强生成”(Retrieval-Augmented Generation, RAG)概念,实际上只是更宏大的上下文工程架构中的一个特定组件,即负责语义搜索和检索的部分 9。许多讨论将RAG等同于为LLM提供外部知识的全部,但这是一种过度简化。一个完整的企业级上下文工程系统,不仅需要通过RAG处理非结构化的语义上下文(例如从知识库中检索文档片段),还必须能够实时获取结构化的

特征(例如用户的当前账户余额),这些特征通常不存储在向量数据库中。此外,最终的提示本身也是一个被精心设计的工程产物,它负责将这些异构的数据类型(结构化特征 + 检索到的非结构化文本)编排成LLM能够高效理解的格式。因此,上下文工程是一个更全面的学科,它将RAG、实时特征获取和动态提示管理整合为一个协同工作的整体。

2.2. 上下文处理层:系统的引擎室

为了实现上下文的动态组装和交付,需要一个强大的基础设施层,即上下文处理层。它由以下关键组件构成 4

  • 数据集成与ETL管道:用于从多样化的内外部数据源(如数据库、API、文件系统)访问和转换数据的系统 4
  • 嵌入与向量数据库:专门用于存储和高效查询非结构化数据嵌入向量的数据库,如Pinecone、Weaviate等 4
  • 语义搜索与检索:实现RAG核心功能的算法,通常利用向量相似度搜索来查找与查询最相关的文档或数据块,并将其注入到上下文中 4
  • 记忆管理基础设施:用于维护短期记忆(如当前对话历史)和长期记忆(如用户偏好、持久化事实)的系统。这对于需要保持状态的连续交互至关重要 1
  • 上下文压缩与摘要:在保留关键信息的同时,将大量信息进行压缩或摘要,以适应模型有限的上下文窗口的技术 6

在架构设计中,一个核心的决策是如何界定哪些信息应作为“特征”处理,哪些应作为“嵌入”处理。这直接影响到系统的性能、成本和延迟。结构化特征(如 is_premium_user: true)精确、处理成本低且无歧义。而通过嵌入来表示用户的高级会员身份,则不够精确,需要昂贵的检索步骤(向量搜索),并占用更多的上下文窗口令牌。然而,试图将所有信息都“特征化”是脆弱且不可扩展的。因此,架构师的关键挑战是识别那些信号最强、维度最低的关键数据点,并将其工程化为特征;而将那些庞大的、信号相对较弱但包含丰富背景知识的信息,通过嵌入和检索来处理。这个决策边界直接决定了系统的成本、速度和可靠性。

2.3. 核心原则的实践

前述的架构组件共同实现了上下文工程的核心原则:

  • 动态与演化的上下文:通过上下文处理层在运行时动态获取信息,而非依赖静态、硬编码的提示,系统实现了上下文的动态性 1
  • 完整的上下文覆盖:整个系统的目标是提供模型可能需要的一切信息——包括系统指令、用户查询、检索到的数据、工具调用结果和对话历史 2
  • 多代理系统中的上下文共享:对于涉及多个AI代理的复杂任务,架构上必须支持一个统一的上下文(如共享记忆或公共知识库),以防止目标不一致,确保协作的连贯性 3。这正是像CrewAI这样的框架所要解决的核心问题 28

第三部分:上下文工程的企业实践手册

本部分为企业提供一个可操作的框架,用于采纳和实施上下文工程,涵盖技术和组织两个层面。

3.1. 四阶段实施路线图

为了系统地构建上下文工程能力,企业可以遵循一个分阶段的实施路径。该路线图改编自Shelly Palmer提出的实用框架 4

表2:企业上下文工程实施路线图

阶段 关键行动 主要交付成果 关键利益相关者
第一阶段:上下文盘点 识别整个企业的潜在上下文来源。明确决策所需信息、其位置、可靠性和时效性。 一份全面的“上下文地图”,详细说明数据源、所有者、更新频率和业务关键性。 业务分析师、领域专家、数据架构师、IT部门
第二阶段:集成架构设计 设计访问、处理和治理已识别上下文来源所需的技术基础设施,包括API、数据管道和安全框架。 支持动态上下文组装并具备相应治理控制的技术蓝图。 数据架构师、软件工程师、安全团队、基础设施团队
第三阶段:上下文编排 构建智能层,以决定针对不同查询应检索哪些上下文。这涉及创建语义映射、相关性算法和性能优化策略。 一个能够动态向LLM提供相关上下文的功能性编排引擎。 AI/ML工程师、软件工程师、数据科学家
第四阶段:持续优化 建立监控上下文质量、收集用户反馈以及持续改进和扩展上下文来源的流程。 一个用于维护和发展上下文工程系统的卓越运营框架。 产品经理、数据分析师、运营团队、治理委员会

这个路线图将上下文工程从一个抽象理念转化为一个具体的、可管理的项目。它提供了一个共享的词汇和结构,使业务、技术和治理团队能够有效协作,清晰地回答了“我们该从何处着手?”这一关键问题。

3.2. 弥合业务与技术的鸿沟

有效的上下文工程要求业务部门和技术团队之间进行深度协作 4。这是一个组织层面的挑战,需要明确各自的职责:

  • 业务部门的职责
    • 识别对决策至关重要的上下文来源。
    • 为不同类型的信息定义质量标准和可接受的延迟。
    • 为敏感信息建立治理规则。
  • 技术团队的职责
    • 构建稳健且可扩展的集成架构。
    • 确保实时数据同步和精细的访问控制。
    • 在成本、性能和可靠性之间进行优化。
  • 共同的职责
    • 将业务流程映射到上下文需求。
    • 设计用于持续改进的反馈循环。
    • 建立衡量上下文质量和完整性的指标。

上下文工程并非要购买一个全新的、孤立的技术平台,而是对企业现有能力进行“AI原生”的编排。企业在数据管理、系统集成、API治理和数据安全方面已经投入了数十年 4。上下文工程并不取代这些系统,而是在它们之上构建一个新的智能编排层,利用现有的数据管道、API和治理框架,使其服务于AI模型,而非传统的人机界面。因此,企业面临的挑战更多是架构和战略上的转变,而非简单的采购决策。

3.3. 上下文的来源:内部与外部生态系统

一个强大的上下文工程系统需要从广泛的来源获取信息。这些来源可以分为内部和外部两类 4

  • 内部来源
    • 企业数据仓库和数据湖
    • CRM和ERP系统(如Salesforce, SAP)
    • 文档管理平台(如SharePoint)
    • 内部知识库和Wiki
    • 通信档案(电子邮件、Slack等)
  • 外部来源
    • 实时市场数据源(如Bloomberg)
    • 监管数据库
    • 行业情报平台
    • 新闻和社交媒体API
    • 天气和物流数据
    • 第三方API

路线图中的第一阶段——“上下文盘点”——是整个过程中最关键也最容易被忽视的一步。它本质上是一个战略性的梳理过程,迫使企业将其隐性的、碎片化的运营智慧进行编码和文档化。由此产生的“上下文地图”本身就是一项宝贵的企业资产,因为它记录了业务实际运作的方式,其价值甚至超越了任何具体的AI实施项目。


第四部分:上下文工程实践:跨行业案例研究

本部分将通过真实的商业案例,展示上下文工程如何在不同行业中创造切实的业务价值。

4.1. 电子商务:亚马逊的动态定价引擎

  • 问题:在一个高度动态的在线市场中,如何为数百万种商品进行有竞争力且有利可图的定价。
  • 上下文来源:实时竞争对手价格、历史销售数据、需求量、库存水平、商品页面访问次数、一天中的时段/季节性,甚至包括客户的个人行为 29
  • 工程方法:一个自动化的、基于算法的定价系统,它使用机器学习实时分析这些多维度的上下文。价格每天可能调整数百万次,以在赢得销售(通常通过匹配或略低于竞争对手的价格)和最大化利润率之间找到最佳平衡点 30。该系统还利用了诱饵定价(decoy pricing)等策略来影响消费者的价格感知 33
  • 影响:维持了市场主导地位,实现了收入最大化,并能以最少的人力干预管理庞大而复杂的库存。这个系统是上下文工程在大规模、核心业务运营中驱动价值的典范。

4.2. 媒体与出版:《纽约时报》的个性化推荐

  • 问题:如何帮助用户从海量且不断增长的内容库(如菜谱、新闻)中发现相关内容,超越简单的基于流行度的推荐。
  • 上下文来源
    • 用户上下文:用户的过往互动历史、保存的菜谱/文章、从保存项目中推断出的隐含饮食偏好 24
    • 内容上下文:文章/菜谱本身的文本(标题、描述、配料) 24
    • 系统上下文:项目的近期流行度(页面浏览量) 24
  • 工程方法:一个结合了多种技术的混合系统。
    1. 文本嵌入:使用句子转换器模型(sentence transformer model)将菜谱文本转换为向量嵌入,从而可以计算语义相似度(余弦相似度) 24。这为“相似菜谱”等功能提供了动力。
    2. 用户向量:通过平均用户保存的所有菜谱的嵌入向量,为每个用户创建一个“品味画像” 24
    3. 上下文老虎机(Contextual Bandits):一个多臂老虎机算法被用来驱动大多数推荐栏目。它将候选菜谱与用户向量的相似度作为一个关键的“上下文特征”,来预测点击的可能性,从而在“探索”(exploration)和“利用”(exploitation)之间取得平衡 24
  • 影响:提升了用户参与度,提供了更多样化和个性化的推荐,并使系统能够从“长尾”内容中发掘相关项目,而不仅仅是推荐最热门的内容。

4.3. 客户服务:具备上下文感知能力的智能聊天机器人

  • 问题:传统的聊天机器人因缺乏记忆和对用户情境的理解而常常令人沮丧,导致响应通用、解决率低 34
  • 上下文来源:与后端系统,尤其是客户关系管理(CRM)平台的集成。这使得机器人能够访问客户的购买历史、过往的支持请求、账户状态和个人偏好 13
  • 工程方法:聊天机器人不再是一个孤立的系统,而是CRM的一个智能前端。当用户发起对话时,系统首先从CRM中检索该用户的完整上下文。然后,这个上下文与用户的查询一起被包含在发送给LLM的提示中。例如,LLM看到的不再仅仅是“我的订单在哪里?”,而是一个包含如下信息的丰富提示:用户:张三,账户ID:12345。最近订单:#6789 (状态:已发货)。查询:“我的订单在哪里?” 35
  • 影响:首次联系解决率大幅提高,客户满意度(CSAT)显著提升,并减轻了人工客服的工作负担。案例研究表明,这种方法可以将客户失约率降低35%(Infratint案例) 37,并实现高达90%的问题解决率(丝芙兰案例) 38

4.4. 软件开发:GitHub Copilot企业版与私有代码库

  • 问题:通用的AI编程助手是在公共代码上训练的,缺乏对公司私有代码库、内部库、编码规范和架构模式的了解 39
  • 上下文来源:企业内部的私有GitHub代码库,以及这些代码库中的Markdown文档 40
  • 工程方法:Copilot企业版实现了一种特定形式的上下文工程。它首先对企业指定的代码库进行索引,构建一个可搜索的知识图谱。当开发者使用Copilot聊天功能时,系统会在此私有索引上执行检索操作,以查找相关的代码片段和文档。这些检索到的上下文,连同开发者编辑器中的当前代码,一同被注入到发送给LLM的提示中 41。这使得一个通用模型转变为一个具备“内部知识”的专家。
  • 影响:提供更贴切、更相关的代码建议,这些建议遵循公司的编码标准;加速新开发人员的上手过程,因为他们可以“向代码库提问”;更高效地重构和理解复杂的专有系统。

这些跨行业的案例揭示了一个共同的模式:持久的竞争优势并非源于AI模型本身(模型正日益商品化),而是源于将模型应用于企业专有的、高质量的、实时的上下文。无论是亚马逊的市场数据、纽约时报的内容和用户数据,还是企业的CRM数据和私有代码,上下文都是那条最坚固的“护城河”。而上下文工程,正是释放这些专有上下文价值的关键学科。


第五部分:为上下文而构建:团队、角色与协作

本部分将焦点从技术转向成功构建和维护上下文工程系统所需的人员和流程。

5.1. 现代AI团队:角色与职责

一个以上下文为驱动的AI团队需要明确定义的角色分工,以确保高效协作。以下是根据行业实践总结的核心角色及其职责 43

表3:上下文驱动的AI团队中的角色

角色 主要关注点 关键职责 核心技能 常用工具/语言
AI产品经理 “为什么”“做什么” 定义产品战略和路线图;识别用户痛点和商业机会;定义成功指标(OKRs);管理利益相关者沟通。 用户同理心、战略思维、影响力、沟通能力、理解技术可行性。 JIRA, Figma, Amplitude, Confluence
数据科学家 “哪个”“多有价值” 探索和分析潜在的上下文来源;构建模型评估不同上下文信号的预测能力;确保数据质量和统计有效性。 探索性数据分析(EDA)、统计建模、机器学习、数据可视化。 Python (Pandas, Scikit-learn), SQL, R, Tableau
AI/数据工程师 “如何做” 构建、测试和维护稳健、可扩展、低延迟的数据管道和基础设施(即上下文处理层);部署和扩展模型。 数据架构、ETL、系统设计、软件工程、DevOps。 Python, Java, SQL, Docker, Kubernetes, AWS/GCP/Azure

这张表格明确了在AI项目中常常模糊不清的“数据所有权”问题。产品经理拥有上下文的业务价值所有权,数据科学家拥有其分析有效性所有权,而工程师则拥有其生产交付所有权。这种明确的职责划分是高效执行的关键。

5.2. 跨职能协作框架

这些角色需要在一个结构化的流程中紧密协作。以下是一个基于敏捷原则的典型工作流 48

  1. 发现(产品经理主导):产品经理识别出一个用户痛点(例如,“我们的聊天机器人不够智能”)。
  2. 假设(产品经理与数据科学家):他们共同提出一个假设:“如果聊天机器人能访问用户的订单历史,它就能提供更有帮助的回答。”
  3. 验证(数据科学家主导):数据科学家通过离线分析支持日志和订单数据,来验证订单历史是否确实是解决问题的强信号。
  4. 原型(数据科学家与工程师):他们构建一个小型原型,在小范围用户中测试该假设。
  5. 生产化(工程师主导):一旦假设被验证,工程师将构建生产级的管道,以高可靠性和低延迟的方式将上下文从CRM交付给聊天机器人API。
  6. 衡量与迭代(产品经理主导):产品经理跟踪成功指标(如解决率、客户满意度),并识别下一个最有价值的上下文来源,从而启动新一轮的循环。

在这种模式下,上下文管道本身也成为了一个核心产品。它需要像其他软件产品一样被管理、版本控制和优化。这要求团队将产品化思维应用于数据工程,而不仅仅是将其视为一次性的后端任务。


第六部分:上下文工程的未来

本部分将展望未来,分析将塑造该领域发展的关键趋势。

6.1. 代理式AI的兴起

从被动的生成式AI转向主动的、自主的AI代理,是当前AI领域最重要的发展方向之一。而复杂的上下文管理是实现这一转变的唯一最重要的使能技术 5。一个AI代理感知环境、制定计划并执行动作的能力,完全依赖于它能否接收并基于一个丰富的、动态的上下文进行推理。这个上下文必须包含其目标、可用工具、历史状态以及实时的环境数据。上下文工程为这些代理式系统提供了坚实的架构基础。

6.2. 迈向多模态与自动化上下文

  • 多模态上下文:下一个前沿是将非文本的上下文,如图像、音频、视频和传感器数据,无缝地集成到一个统一的上下文框架中 8。这将使AI系统能够理解并在物理世界中操作,而不仅仅局限于数字世界。
  • 自动化上下文工程:该领域的终极演进是开发能够自我优化上下文管理的系统 8。这涉及到使用元学习(meta-learning)技术,来自动识别哪些上下文来源对特定任务最有价值,动态调整检索策略,并优化上下文的格式以最大化模型性能。这将大大减少人工工程的负担,催生出更高效、更强大的AI系统。

随着上下文工程变得更加自动化,人类工程师的角色也将发生转变。他们的主要工作将从构建特定的数据管道,转向为自动化上下文工程系统本身设计目标函数和奖励机制。新的挑战将是教会元系统如何判断什么才是对业务有价值的“好上下文”——这是一个远比当前任务更抽象、更具战略性的挑战。


结论:上下文作为持久的竞争优势

本报告的分析最终指向一个核心结论:在一个基础AI模型日益强大且易于获取的时代,唯一持久的竞争差异化来源,是企业所拥有的独特的、专有的数据。上下文工程正是将这些原始数据转化为运营智能的关键学科,它为构建高性能、具有防御壁垒的AI应用提供了燃料。掌握了上下文,就掌握了在AI时代的未来。


附录:上下文工程的关键开源项目

本附录为希望实践本报告所述概念的开发者和架构师提供了一些实用的开源项目资源。

  • LangChain
    • 简介:一个用于开发由LLM驱动的应用程序的开源框架。它提供模块化的组件和“链”(Chains),用于将LLM与其他数据源和API连接起来 2
    • 上下文管理功能:提供了管理提示的工具、一个连接各种数据源的中心化接口(文档加载器),以及将多个调用链接在一起的方法,从而在步骤之间隐式地传递上下文。其最新的演进LangGraph为代理式循环提供了明确的、细粒度的控制,这对于复杂的上下文管理至关重要 2
    • 链接https://github.com/langchain-ai/langchain
  • LlamaIndex
    • 简介:一个专门为使用私有或领域特定数据增强LLM而设计的数据框架。它在上下文工程的“摄取和查询”阶段表现出色 52
    • 上下文管理功能:提供了一套全面的数据连接器,用于从API、PDF、SQL等多种来源摄取数据。它专注于将这些数据结构化为各种优化的索引类型(如向量索引、关键词表索引),以适应不同的检索策略。它提供了一个强大的查询引擎,负责在将上下文传递给LLM之前处理检索和整合工作 52
    • 链接https://github.com/run-llama/llama_index
  • CrewAI
    • 简介:一个用于编排角色扮演的、自主的AI代理进行协同工作的框架 28
    • 上下文管理功能:促进了多代理系统中的上下文共享。它允许定义具有特定目标和工具的独特代理角色。该框架管理代理之间的通信和任务委派,确保上下文(例如,一个代理任务的输出)能够被传递给工作流中的下一个代理。它为任务之间提供了稳定的状态管理,这是一种显式的上下文管理形式 28
    • 链接https://github.com/joaomdmoura/crewAI

引用的著作

  1. The New Skill in AI is Not Prompting, It’s Context Engineering, 访问时间为 七月 3, 2025, https://www.philschmid.de/context-engineering
  2. The rise of “context engineering” - LangChain Blog, 访问时间为 七月 3, 2025, https://blog.langchain.com/the-rise-of-context-engineering/
  3. Context Engineering: Elevating AI Strategy from Prompt Crafting to Enterprise Competence | by Adnan Masood, PhD. | Jun, 2025 | Medium, 访问时间为 七月 3, 2025, https://medium.com/@adnanmasood/context-engineering-elevating-ai-strategy-from-prompt-crafting-to-enterprise-competence-b036d3f7f76f
  4. Context Engineering: A Framework for Enterprise AI Operations …, 访问时间为 七月 3, 2025, https://shellypalmer.com/2025/06/context-engineering-a-framework-for-enterprise-ai-operations/
  5. Tech Platforms Archives - Veltris, 访问时间为 七月 3, 2025, https://www.veltris.com/guide-industry/tech-platforms/
  6. Context Engineering: The Future of AI Prompting Explained - AI-Pro.org, 访问时间为 七月 3, 2025, https://ai-pro.org/learn-ai/articles/why-context-engineering-is-redefining-how-we-build-ai-systems/
  7. Prompt Engineering in AI: A Comprehensive Report | by ByteBridge - Medium, 访问时间为 七月 3, 2025, https://bytebridge.medium.com/prompt-engineering-in-artificial-intelligence-a-comprehensive-report-e6737c8f9098
  8. Context is Everything: The Massive Shift Making AI Actually Work in the Real World, 访问时间为 七月 3, 2025, https://www.philmora.com/the-big-picture/context-is-everything-the-massive-shift-making-ai-actually-work-in-the-real-world
  9. Why Context is Crucial for Effective Generative AI - qBotica, 访问时间为 七月 3, 2025, https://qbotica.com/why-context-is-the-key-to-better-generative-ai/
  10. Optimizing AI Functionality: The Importance of Contextual Prompt Engineering - Arsturn, 访问时间为 七月 3, 2025, https://www.arsturn.com/blog/optimizing-ai-functionality-contextual-prompt-engineering
  11. How Context Can Enhance the Performance of Generative AI - Codiant, 访问时间为 七月 3, 2025, https://codiant.com/blog/how-context-can-enhance-the-performance-of-generative-ai/
  12. Why Context Matters in Artificial Intelligence - testRigor AI-Based Automated Testing Tool, 访问时间为 七月 3, 2025, https://testrigor.com/blog/ai-context/
  13. Revolutionize Your CRM with Intelligent Conversational Automation - agileful, 访问时间为 七月 3, 2025, https://agileful.com/revolutionize-your-crm-with-intelligent-conversational-automation/
    1. Context-Aware Computing - The Interaction Design Foundation, 访问时间为 七月 3, 2025, https://www.interaction-design.org/literature/book/the-encyclopedia-of-human-computer-interaction-2nd-ed/context-aware-computing-context-awareness-context-aware-user-interfaces-and-implicit-interaction
  14. (PDF) Context-Aware Computing Applications - ResearchGate, 访问时间为 七月 3, 2025, https://www.researchgate.net/publication/4374664_Context-Aware_Computing_Applications
  15. Context-Aware Computing Applications, 访问时间为 七月 3, 2025, http://www.cs.columbia.edu/~coms6998-11/papers/schilit-mcsa94.pdf
  16. Context-Aware Computing Applications, 访问时间为 七月 3, 2025, https://www.kostakos.org/courses/ubicomp10S/papers/context/schilit-94.pdf
  17. Introduction to the special issue on Context-Aware Computing. - Paul Dourish, 访问时间为 七月 3, 2025, https://dourish.com/publications/2001/hci-cxt-aware-intro.pdf
  18. Reframing Information: From “Information as Thing” to “Everything as Document” to the Identity of iSchools — Conversations with Michael Buckland, 访问时间为 七月 3, 2025, https://informationmatters.org/2025/05/reframing-information-from-information-as-thing-to-everything-as-document-to-the-identity-of-ischools-conversations-with-michael-buckland/
  19. Why AI Needs Better Context - Tecton, 访问时间为 七月 3, 2025, https://www.tecton.ai/blog/why-ai-needs-better-context/
  20. Vector Embedding Tutorial & Example - Nexla, 访问时间为 七月 3, 2025, https://nexla.com/ai-infrastructure/vector-embedding/
  21. Understanding Vector Embeddings in AI - SimplAI, 访问时间为 七月 3, 2025, https://simplai.ai/docs/User-guide/vector-embedding
  22. What is Embedding? | IBM, 访问时间为 七月 3, 2025, https://www.ibm.com/think/topics/embedding
  23. How The New York Times Cooking Team Makes Personalized …, 访问时间为 七月 3, 2025, https://medium.com/@timesopen/how-the-new-york-times-cooking-team-makes-personalized-recipe-recommendations-669c26aa4825
  24. What is a context window in AI? Understanding its importance in LLMs - Nebius, 访问时间为 七月 3, 2025, https://nebius.com/blog/posts/context-window-in-ai
  25. From Prompts to Embeddings and Vector Stores - How to use OpenAI in real-life scenarios, 访问时间为 七月 3, 2025, https://techcommunity.microsoft.com/blog/startupsatmicrosoftblog/from-prompts-to-embeddings-and-vector-stores---how-to-use-openai-in-real-life-sc/3887755
  26. What’s Context Engineering and How Does it Apply Here? : r/ArtificialSentience - Reddit, 访问时间为 七月 3, 2025, https://www.reddit.com/r/ArtificialSentience/comments/1lnxrl0/whats_context_engineering_and_how_does_it_apply/
  27. crewAIInc/crewAI: Framework for orchestrating role-playing … - GitHub, 访问时间为 七月 3, 2025, https://github.com/joaomdmoura/crewAI
  28. 6 Successful Dynamic Pricing Examples To Follow in 2025 - Mailmodo, 访问时间为 七月 3, 2025, https://www.mailmodo.com/guides/dynamic-pricing-examples/
  29. Make the Amazon Dynamic Pricing Strategy Work for You - AMZ Advisers, 访问时间为 七月 3, 2025, https://www.amzadvisers.com/amazon-dynamic-pricing-strategy/
  30. The Ultimate Guide to Amazon Dynamic Pricing - Trellis, 访问时间为 七月 3, 2025, https://gotrellis.com/resources/blog/amazon-dynamic-pricing-guide/
  31. Amazon Pricing Strategy: Ultimate Guide - Sellbery, 访问时间为 七月 3, 2025, https://sellbery.com/blog/amazon-pricing-strategy-ultimate-guide/
  32. Amazon Pricing Strategy 2023: The Ultimate Pricing Guide for eCommerce Businesses on Amazon - Symson, 访问时间为 七月 3, 2025, https://www.symson.com/blog/amazon-pricing-strategy-2023-the-ultimate-pricing-guide-for-ecommerce-businesses-on-amazon
  33. AI Chatbot Development Mistakes That Reduce User Engagement - AMELA Technology, 访问时间为 七月 3, 2025, https://amela.tech/ai-chatbot-development-mistakes-that-reduce-user-engagement/
  34. How AI Customer Experience Supports Personalized Service | Denser.ai, 访问时间为 七月 3, 2025, https://denser.ai/blog/ai-customer-experience/
  35. Omnichannel AI in Customer Service: Meaning and Tools, 访问时间为 七月 3, 2025, https://www.crescendo.ai/blog/omnichannel-ai-customer-service
  36. Case Study: Enhancing Infratint’s Operations with Respond.io - Zeta Media, 访问时间为 七月 3, 2025, https://www.zetamedialabs.com/2025/04/27/case-study-infratint-enhances-daily-installations-with-whatsapp-crm-automation/
  37. How AI Chatbot for Customer Service Is Revolutionizing Support in 2025, 访问时间为 七月 3, 2025, https://www.tenupsoft.com/blog/ai-chatbot-for-customer-service-is-revolutionizing-customer-support.html
  38. Is GitHub Copilot worth it? ROI & productivity data | LinearB Blog, 访问时间为 七月 3, 2025, https://linearb.io/blog/is-github-copilot-worth-it
  39. Understanding GitHub Copilot Enterprise for team code collaboration - Graphite, 访问时间为 七月 3, 2025, https://graphite.dev/guides/github-copilot-enterprise-team-collaboration
  40. GitHub Copilot Enterprise: Pricing, Features & Getting Started - Swimm, 访问时间为 七月 3, 2025, https://swimm.io/learn/github-copilot/github-copilot-enterprise-pricing-features-and-how-to-get-started
  41. GitHub Copilot · Your AI pair programmer, 访问时间为 七月 3, 2025, https://github.com/features/copilot
  42. Product Manager vs. AI Scientist: Which Career Path Should You Choose in 2025?, 访问时间为 七月 3, 2025, https://productsbywomen.com/blogs/news/product-manager-vs-ai-scientist-which-career-path-should-you-choose-in-2025
  43. AI Engineer vs. Data Scientist: Key Differences and Career Paths - Upwork, 访问时间为 七月 3, 2025, https://www.upwork.com/resources/ai-engineer-vs-data-scientist
  44. Data Scientist vs. AI Engineer – Which Path Should I Take? - Reddit, 访问时间为 七月 3, 2025, https://www.reddit.com/r/learnmachinelearning/comments/1e44l8a/data_scientist_vs_ai_engineer_which_path_should_i/
  45. Data Scientist vs Data Engineer | What’s the Difference? - DataCamp, 访问时间为 七月 3, 2025, https://www.datacamp.com/blog/data-scientist-vs-data-engineer
  46. From Data Scientist to ML / AI Product Manager | by Anna Via | TDS Archive - Medium, 访问时间为 七月 3, 2025, https://medium.com/data-science/from-data-scientist-to-ml-ai-product-manager-39359bd44512
  47. 5 AI Strategies for Cross-Functional Teams - Magai, 访问时间为 七月 3, 2025, https://magai.co/5-ai-strategies-for-cross-functional-teams/
  48. Using AI to Empower Cross-Functional Teams - Agile Business Consortium, 访问时间为 七月 3, 2025, https://www.agilebusiness.org/resource/using-ai-to-empower-cross-functional-teams.html
  49. Agentic AI Explained: Guide to Autonomous AI Systems for Modern Business - Veltris, 访问时间为 七月 3, 2025, https://www.veltris.com/guides/agentic-ai-explained-introductory-guide-to-autonomous-ai-systems/
  50. I made a GitHub repo for (beginner) Python devs using LangChain for LLM projects - Reddit, 访问时间为 七月 3, 2025, https://www.reddit.com/r/LangChain/comments/1bw0dke/i_made_a_github_repo_for_beginner_python_devs/
  51. run-llama/llama_index: LlamaIndex is the leading … - GitHub, 访问时间为 七月 3, 2025, https://github.com/run-llama/llama_index
  52. llama_index/llama-index-integrations/llms/llama-index-llms-vertex/llama_index/llms/vertex/base.py at main · run-llama/llama_index - GitHub, 访问时间为 七月 3, 2025, https://github.com/run-llama/llama_index/blob/main/llama-index-integrations/llms/llama-index-llms-vertex/llama_index/llms/vertex/base.py