不同AI平台的GEO反例证据如何管理？

不同AI平台的GEO反例证据，应该按“答案主张、来源字段、检索过程、冲突类型、复测时间”管理。本文只依据官方文档核验可观察字段，不推断未公开排序规则，也不代表展示或引用结果。平台事实核验时间：2026年6月15日。

ChatGPT/OpenAI、Google、Copilot、Claude、Perplexity、Gemini怎么定义GEO反例证据？

ChatGPT/OpenAI、Google、Copilot、Claude、Perplexity和Gemini场景下，GEO反例证据应分为5类：相反来源、例外条件、不适用场景、旧版口径和引用冲突。

GEO反例证据不是为了证明某个平台“错了”，而是为了防止团队把一次AI回答误当成稳定事实。一个品牌或主题在AI答案中被引用时，往往同时存在支持证据和反例证据：支持证据说明“这条主张为什么成立”，反例证据说明“在哪些条件下它不成立、哪些来源给出不同说法、哪些旧页面会误导模型、哪些引用只支持了部分句子”。缺少反例管理，GEO复盘会变成只看好消息的截图收藏。

本文把反例证据定义为5类。第一类是相反来源：同一问题下，平台返回的来源与目标主张相反，或支持竞品、旧定义、不同适用条件。第二类是例外条件：答案主张本身正确，但只在特定地区、语言、入口、模式或知识源范围内成立。第三类是不适用场景：页面被引用了，却无法支撑用户真正问的任务。第四类是旧版口径：来源曾经正确，但发布日期、页面更新、字段变更或产品状态已经让它不再适合作为当前依据。第五类是引用冲突：答案中的引用位置、来源列表、片段映射或执行日志互相对不上。

反例证据类型	典型表现	应抓的平台字段	处理动作	置信标签
相反来源	来源页面直接支持相反结论	citations、sources、references、search_results、groundingChunks	保存URL、标题、片段和原问题	高优先复核
例外条件	结论只适用于部分语言、地区或模式	query fan-out、webSearchQueries、activity、filters	记录入口、参数、用户状态	条件成立才保留
不适用场景	来源相关但无法回答当前任务	start/end、cited_text、groundingSupports、snippet	拆分主张并降级引用	标为弱支撑
旧版口径	旧文档、旧字段、旧页面继续被引用	date、last_updated、page_age、报告日期	建立旧版反例库	进入更新队列
引用冲突	答案说A，引用只证明B	annotations、ref_id、activitySource、segment	回连字段，查断点	暂不入库

来源：OpenAI Web search与Responses API文档、Google Search Central AI features文档、Microsoft Learn Azure AI Search文档、Anthropic Claude文档、Perplexity API文档、Google AI Gemini文档；核验时间：2026年6月15日。

这5类反例要和“平台事实”分开写。平台事实是官方文档已经公开的字段、入口、限制或说明；GEO判断是团队基于这些字段做的审计方法。比如Google官方说明AI Overviews与AI Mode可能使用query fan-out，但没有公开每次查询的完整子查询列表；因此你可以记录“可能存在扇出导致的相反来源”，不宜写成“某类页面会稳定被优先采用”。同理，OpenAI公开url_citation字段位置，Gemini公开groundingSupports映射，Microsoft公开activity与references，这些字段能帮助审计反例，但不等于公开排序规则。

反例证据管理的核心不是“找到更多反面材料”，而是让每条AI主张至少能回答3个问题：哪个来源支持它，哪个来源反驳它，哪个条件会让它失效。

ChatGPT/OpenAI如何用sources和citations发现相反来源？

ChatGPT/OpenAI场景下，反例证据优先看url_citation的URL、标题、start/end位置和可选sources，而不是只看回答末尾是否出现链接。

OpenAI官方Web search文档说明，模型回答默认会包含网页搜索结果的内联引用，url_citation annotation会包含被引用来源的URL、标题，以及来源在模型回答中被使用的起止位置。Responses API参考还说明，可以通过include请求额外输出数据，例如web_search_call.action.sources，也可以包含file_search_call.results。这些字段为反例证据管理提供了两层线索：一层是答案文本中的引用位置，另一层是检索工具实际使用或返回的来源集合。

对ChatGPT/OpenAI做GEO反例审计时，第一步不是判断答案好坏，而是把每个主张拆成短句。例如“某功能适合所有企业”应拆成“某功能存在”“适合企业用户”“适合所有企业”3个主张。随后读取url_citation.start_index和end_index，看引用覆盖的是哪一句。如果引用只支持“功能存在”，却没有支持“所有企业”，这就是不适用场景反例；如果引用页面标题或正文显示该功能只适用于某个版本，则属于例外条件反例。

ChatGPT/OpenAI字段	可发现的反例	具体检查方式	常见降级原因
`url_citation.url`	相反来源、旧版口径	打开URL核对当前页面与归档信息	URL主题相关但事实不匹配
`url_citation.title`	来源身份冲突	标题是否是官方、媒体、论坛或旧文档	标题只到栏目层，无法证明细节
`start_index`/`end_index`	引用冲突	引用范围是否紧贴具体主张	一个引用覆盖多条主张
`web_search_call.action.sources`	检索层相反来源	比较sources与最终引用是否一致	检索到但未进入答案
`file_search_call.results`	私有知识旧版反例	检查文件名、chunk、版本日期	内部文件过期或混有旧口径

来源：OpenAI Web search文档与Responses API参考，核验时间：2026年6月15日。

OpenAI场景尤其需要区分公开网页搜索和文件型RAG。公开网页搜索里的反例通常来自外部来源冲突，例如官方文档与第三方评测页面对适用范围说法不同；文件型RAG里的反例通常来自内部版本冲突，例如旧PDF、旧FAQ、旧销售资料与当前帮助文档同时存在。两类反例不能混在同一栏，否则团队无法判断问题来自外部网页、私有知识库还是答案合成层。

一个可执行的记录格式是：query_text记录原问题，claim_text记录被审计主张，citation_span记录start/end，support_url记录支持来源，counter_url记录相反来源，counter_type记录反例类型，review_action记录下一步。若同一主张在3次复测中出现2次以上相反来源，就不要急着改写为强结论，应先把页面上的适用条件、发布日期和旧版说明补清楚。

需要注意的是，search_context_size或上下文范围设置只能作为复测条件记录，不能被当成证据强度本身。上下文更宽可能暴露更多相反来源，也可能让答案覆盖更多无关材料。GEO团队应保存参数、模型、时间和响应原文，而不是只截取最终回答中的漂亮段落。

Google AI Overviews和AI Mode如何用query fan-out找到例外条件？

Google AI Overviews和AI Mode场景下，反例管理要围绕query fan-out、支持链接、索引与摘要资格、Search Console可见数据做条件化记录。

Google Search Central官方文档说明，AI Overviews与AI Mode都可能使用query fan-out，即围绕子主题和数据源发出多个相关搜索来生成回答。文档同时说明，AI Mode和AI Overviews可能使用不同模型和技术，因此展示的回答和链接会有差异；AI Overviews只在系统认为对经典Search有增益时展示，很多查询不会触发。这个边界对反例管理非常重要：没有出现AI答案不等于页面失效，出现支持链接也不等于未来稳定。

Google场景下最常见的反例不是“引用错误”，而是“条件缺失”。例如一个页面在桌面端某地区查询中作为支持链接出现，但移动端、另一语言或AI Mode后续追问中没有出现；或者一个页面能支撑定义型子问题，却无法支撑比较型、风险型、操作型子问题。query fan-out让这些例外更常见，因为同一用户问题可能被拆成多个相关搜索，任何一个子问题缺证据，都可能让页面在局部任务中缺席。

Google可观察对象	能发现的反例	记录字段	不应推断的内容
AI Overviews支持链接	相反来源、来源多样性	查询、地区、设备、链接URL、截图时间	不推断固定排序
AI Mode支持链接	复杂比较中的例外条件	原问题、追问、链接集合、回答语气	不把AI Mode等同AI Overviews
query fan-out官方说明	子主题缺口	原问题、可能子意图、缺失页面	不声称看到了内部子查询
索引与摘要资格	不适用基础条件	页面是否可索引、是否可显示摘要	不代表进入AI功能
Search Console生成式AI报告	URL可见性异常	impressions、pages、countries、devices、dates	不做主张级引用证明

来源：Google Search Central《AI Features and Your Website》、Google生成式AI搜索优化指南、Search Console生成式AI表现报告公告；核验时间：2026年6月15日。

Google官方资料还说明，要作为AI Overviews或AI Mode的支持链接，页面需要已被索引，并且有资格在Google Search中以摘要形式展示；除此之外没有额外技术要求。反例管理可以据此建立准入检查：页面若被noindex、摘要展示受限、主要内容无法被抓取，就不要把它缺席AI功能归因为“平台不喜欢”。这类情况应归为基础条件反例，而不是引用冲突。

Search Console在2026年6月公布的生成式AI表现报告，提供了站点URL在Search生成式AI功能中的可见性视图，包括AI Overviews、AI Mode以及Discover中的生成式AI功能；报告字段包括impressions、pages、countries、devices和dates，并处于逐步测试和扩展阶段。它适合发现“某URL在某段时间失去可见性”的趋势反例，但不能告诉你某一句答案由哪个页面支撑。也就是说，它是曝光层反例工具，不是逐句citation工具。

Google反例库建议把“官方事实、样本观察、方法推断”分列。官方事实写文档链接与核验日期；样本观察写查询、入口、地区、设备、截图；方法推断写团队补证据的动作。只要三者混在一起，后续很容易把“某次样本没有出现”误写成“平台规则改变”，这会让GEO复盘失真。

Microsoft Copilot和Azure AI Search如何用references与activity log排查引用冲突？

Microsoft Copilot和Azure AI Search场景下，反例证据的关键是让references、activity、查询计划、权限范围和回答引用ID形成闭环。

Microsoft支持文档说明，当Microsoft 365 Copilot使用Web搜索时，回答下方会出现sources按钮，用户可查看Copilot发送给Bing的确切查询以及所用来源。Microsoft Learn也说明，Microsoft 365 Copilot和Copilot Chat可以在Web搜索启用时参考Web内容，管理员策略和用户侧Web内容开关会影响是否使用Web搜索。这意味着Copilot用户侧反例管理至少要记录两件事：Copilot把原问题改写成了什么Bing查询，以及来源按钮里显示了哪些来源。

开发者侧更适合使用Azure AI Search agentic retrieval做字段级审计。Microsoft Learn说明，agentic retrieval是面向复杂问题的多查询管线，可以把复杂问题拆成更小的子查询，并行执行、语义重排，再把结果合并为可供LLM生成grounded answers的内容；它可以返回source references和activity log。retrieve action文档进一步说明，响应有三个主要部分：抽取或合成响应、activity array、references array；当一个或多个知识源失败时，响应可能只包含成功来源，并在activity中记录局部错误。

Microsoft字段或界面	反例发现方式	需要保存什么	风险判断
sources按钮	查Bing查询与来源是否支持答案	原提示、Bing查询、来源URL	只能做界面层证据
`response`	查回答是否混合多个来源	主张、引用ID、答案段落	合成层可能省略部分依据
`activity`	查子查询、调用状态、局部错误	query plan、elapsedMs、错误信息	失败来源会造成缺证
`references`	查引用ID与来源内容	id、sourceData、activitySource	引用ID不回连则冲突
权限与ACL	查用户能否访问来源	用户身份、知识源范围、ACL状态	权限差异会形成例外条件

来源：Microsoft Support关于Copilot Web search说明、Microsoft Learn Azure AI Search agentic retrieval overview、Microsoft Learn retrieve action文档；核验时间：2026年6月15日。

Microsoft场景的典型引用冲突有3种。第一种是查询冲突：用户问“当前适用范围”，Copilot发给Bing或知识源的查询却偏向旧版页面。第二种是来源冲突：references里有多个来源，其中一个支持A，一个支持B，答案合成后只保留了A。第三种是执行冲突：activity显示某个关键知识源失败，但最终答案仍给出确定语气。第三种最危险，因为它让团队误以为答案基于完整证据。

Azure AI Search反例管理要特别重视activitySource。如果回答中的引用ID能在references中找到，并能回连到成功的检索活动，这条证据可以进入高置信候选；如果references存在但sourceData为空，或activity显示局部失败，就应降为待复核。若多个knowledge source同时参与检索，还要记录每个来源的职责：产品文档用于当前功能，帮助中心用于操作边界，历史公告只用于旧版追溯，不能混用。

Microsoft 365 Copilot connectors文档说明，连接器会把外部内容同步进Microsoft Graph，每个项目包括内容、标题、URL等元数据和访问控制列表；用户可在Copilot回答中选择citations预览存储在Microsoft Graph中的外部项目。这个机制让权限成为重要反例条件：同一问题在不同用户身份下可能看到不同来源。GEO复测时需要记录用户角色与来源权限，否则无法判断差异来自平台检索、权限过滤还是内容本身。

Claude如何用citations和search_result管理不适用场景？

Claude场景下，反例证据要看citation是否指向具体来源位置；Web search看web_search_result_location，自定义RAG看search_result块与文档引用范围。

Anthropic官方Web search tool文档说明，Claude的Web搜索结果包括来源页面URL、标题、page_age和用于多轮引用的加密内容；Web search引用始终启用，每个web_search_result_location包含URL、标题、encrypted_index和最多150个字符的cited_text。文档还说明，Web search工具遇到错误时，API仍可能返回200响应，错误会在响应体内以web_search_tool_result_error形式出现。对反例管理来说，这意味着“接口成功”不等于“检索成功”。

Claude的Citations文档还说明，响应可以包含多个text block，每个text block可包含Claude作出的claim和支持该claim的citation；不同文档类型的citation位置格式不同，PDF可引用页码范围，纯文本可引用字符索引，自定义内容文档可引用content block索引。Search results文档则说明，开发者可以提供search_result内容块，包含source、title、content和可选citations配置，Claude可自动为这些结果生成来源归因。

Claude证据形态	可发现的反例	关键字段	管理建议
Web search citation	来源只支持背景，不支持结论	`url`、`title`、`cited_text`、`page_age`	把主张和150字符片段逐项核对
Web search error	答案缺少必要检索	`web_search_tool_result_error`、error_code	接口200也要查响应体
PDF citation	旧版文件继续被引用	页码范围、文件名、日期	记录版本并拆出旧版反例
Plain text citation	引用覆盖过宽	字符索引范围	缩小文本块重新测试
`search_result`块	自定义RAG来源冲突	source、title、content、citations.enabled	每个块只放一类事实

来源：Anthropic Claude Web search tool、Citations、Search results官方文档；核验时间：2026年6月15日。

Claude场景最容易出现“不适用场景反例”。比如答案引用了某篇通用介绍文章，片段证明“概念存在”，但用户问的是“是否适合某行业”。这时cited_text相关却不足，不能把它作为高置信支持。更稳的做法是把答案拆成概念、适用对象、限制条件、时间范围4个claim，再分别查看citation是否支撑。没有支撑的claim应进入反例队列，而不是被正文引用顺手带过。

自定义RAG里，search_result块的粒度决定了反例可见度。如果一个content块同时包含当前功能、历史变更、用户案例和免责声明，Claude即使给出citation，也只能说明它用了这一大块，无法证明某个细节。GEO团队应把事实块拆细：当前口径一块，旧版说明一块，限制条件一块，案例样本一块。这样当旧版反例出现时，可以定位到具体块，而不是重查整份文档。

Claude还适合做“旧版反例回放”。由于page_age、页码、字符索引、content block index都能提供定位线索，团队可以保存旧来源与新来源的并列表：旧来源为什么曾经成立，新来源如何改变结论，哪些答案仍在引用旧来源。这个表比简单删除旧文档更有用，因为模型、缓存、外部转载或用户上传资料都可能继续让旧口径出现。

Perplexity如何用search_results处理旧版反例和引用字段演进？

Perplexity场景下，反例证据应优先使用结构化search_results或Search API的results[]，并把citations视为需要按端点核验的兼容字段。

Perplexity官方Search API文档说明，Search API返回结构化JSON results[]数组，字段包括title、url、snippet、date和last_updated；Sonar返回带内置引用的文本答案。Sonar Prompt Guide则提示，不要要求模型在回答正文里写URL，Sonar会在顶层citations和search_results字段返回来源，应从那里读取。Perplexity Changelog又说明，应用应使用search_results字段，因为它提供标题、URL和发布日期等更详细信息，并提到citations字段的演进。官方文档之间的这种字段演进，本身就是旧版反例管理要记录的对象。

对Perplexity做GEO反例管理，第一优先级是时效字段。date和last_updated能帮助识别旧版口径：某个来源发布较早但仍被引用，或者页面最后更新时间晚于发布日期却仍保留旧片段。第二优先级是snippet，它能快速判断结果片段是否真的支撑主张。第三优先级是字段兼容：旧脚本若只抓citations，在字段演进后可能误判为无来源；新脚本应同时检查search_results、Search API results[]和端点文档。

Perplexity字段	反例价值	应如何记录	注意边界
`search_results[].url`	定位相反来源	保存URL与域名	不从正文链接反推
`search_results[].title`	判断来源身份	记录标题与页面类型	标题可能只说明主题
`search_results[].snippet`	快速查不适用场景	保存片段与主张对照	snippet不足时需打开页面
`date`	查发布时间旧例	与主张时点比较	旧来源未必错误
`last_updated`	查更新状态	与页面当前内容比较	更新时间不等于事实有效
`citations`	兼容展示层	与`search_results`回连	字段状态按端点核验

来源：Perplexity Search API、Sonar Prompt Guide、Agent API Web Search、Changelog官方文档；核验时间：2026年6月15日。

Perplexity的反例库可以设置“旧版有效期”字段。比如一条来源在2025年发布、2026年未更新，但它讨论的是长期概念，可以作为背景；若它讨论的是平台字段、模型能力、政策入口或产品状态，就只能作为旧版反例。这样做能避免把所有旧来源都打成无效，也能避免把明显过期的资料继续当成当前依据。

Perplexity还适合发现“相反来源并存”。同一查询下，search_results可能返回官方文档、第三方教程、新闻、论坛和历史页面。若答案最终采用官方文档，但结果列表中存在相反来源，团队仍应记录，因为下一次查询、不同地域或不同追问可能让相反来源进入答案。反例记录不是只保存最终引用，还要保存“已被检索但未被采用”的冲突候选。

另一个常见问题是让模型在JSON正文里自行生成链接。Perplexity官方Output Control文档提醒，直接让模型在JSON内容中返回链接可能出现无效URL，应使用API响应中的citations或search_results字段。GEO团队据此可以设一条硬规则：任何从模型正文里抽出的URL都只能算低置信线索，只有回到结构化来源字段后，才能进入正式反例表。

Gemini grounding如何用groundingSupports和search_results区分引用冲突？

Gemini grounding场景下，高价值反例来自groundingSupports未覆盖关键segment，或segment连接的groundingChunks只能支撑部分事实。

Google AI for Developers文档说明，Grounding with Google Search会把Gemini连接到实时Web内容，帮助提供更准确的回答和可验证来源。Gemini API的Generating content参考列出GroundingMetadata字段，包括groundingChunks[]、groundingSupports[]、webSearchQueries[]、searchEntryPoint和retrievalMetadata。其中groundingChunks是从指定grounding来源检索到的支持引用，groundingSupports是支撑关系列表，webSearchQueries是后续Web搜索查询。

Gemini反例管理要把“搜索过”和“支撑了”分开。webSearchQueries说明模型执行或准备执行了哪些搜索查询，适合发现query层面的相反来源；groundingChunks说明有哪些来源进入支持引用集合，适合发现来源层相反材料；groundingSupports说明答案文本片段和来源块之间的连接，适合发现主张层引用冲突。若某个关键segment没有groundingSupports覆盖，这条主张就不能被标为高置信，即使同一响应里存在相关来源。

Gemini字段	能发现的反例	记录方式	不能替代什么
`webSearchQueries`	查询层相反来源、例外条件	保存查询数组与原问题	不能证明主张被支撑
`groundingChunks`	来源层旧版口径	保存URI、title、来源类型	不能说明答案句子正确
`groundingSupports.segment`	主张层引用缺口	保存文本片段、start/end	不能覆盖未映射句子
`groundingChunkIndices`	来源连接冲突	回连chunk索引	不能推断排序规则
`retrievalMetadata`	检索流程线索	记录检索相关元数据	不能单独替代人工复核

来源：Google AI for Developers《Grounding with Google Search》与Gemini API《Generating content》；核验时间：2026年6月15日。

用户常把search_results当作所有平台的统一字段，但Gemini官方文档当前更强调groundingMetadata下的queries、chunks和supports。为了避免字段混用，跨平台表里应设置两列：一列叫“搜索结果列表”，用于Perplexity的search_results或Search API results[]；另一列叫“主张支撑映射”，用于Gemini的groundingSupports、OpenAI的url_citation位置和Claude的citation位置。这样才能区分“找到了来源”和“某句答案被来源支持”。

Gemini的典型引用冲突是：答案里有一个包含两个事实的segment，其中第一部分由chunk A支撑，第二部分并没有足够依据；或者segment连接到chunk B，但chunk B标题相关、正文不直接证明该事实。遇到这种情况，反例表应记录segment全文、chunk索引、来源URL、冲突描述和修订动作。修订动作通常不是立刻否定整条答案，而是把主张拆短、补充条件、换用更明确的来源页面。

Gemini还适合识别“例外条件缺失”。如果webSearchQueries里出现了地区、时间或版本词，而最终segment没有把这些条件带回答案，就要记录为例外条件反例。比如查询层搜索了“2026 API field change”，答案却写成无时间限制的通用结论，这不是来源错误，而是条件丢失。GEO内容页要在可引用段落中把时间、入口、版本和适用范围写在同一句或相邻句里，减少条件被抽离的概率。

不同AI平台的GEO反例证据应该怎么建统一台账？

跨平台反例台账至少要有14个字段，把OpenAI citations、Google query fan-out、Microsoft activity、Claude cited_text、Perplexity search_results和Gemini groundingSupports映射到同一套审计语言。

统一台账的目标，是让不同平台的异构字段可以被同一团队复盘。OpenAI的start_index、Gemini的segment、Claude的cited_text、Microsoft的ref_id、Perplexity的snippet、Google的支持链接都不是同一种对象；如果直接比较“来源数量”，就会误判。更稳的做法是先把所有字段翻译为4层：查询层、来源层、主张层、执行层。

台账字段	说明	对应平台字段	必填理由
`audit_time`	北京时间与UTC时间	全平台	没时间就无法判断旧版反例
`platform_mode`	ChatGPT、AI Mode、Copilot、API等入口	全平台	不同入口不能混算
`query_text`	原始用户问题	全平台	查询改写会改变来源
`retrieval_query`	平台公开的检索查询或扇出线索	Google、Microsoft、Gemini、Perplexity	用于查例外条件
`claim_text`	被审计的答案主张	全平台	主张不拆短就无法判冲突
`support_source`	支持来源URL或文档ID	OpenAI、Claude、Perplexity、Gemini、Microsoft	判断是否有支撑
`counter_source`	相反来源URL或文档ID	全平台	反例证据核心
`support_span`	引用片段、segment、索引或ref_id	OpenAI、Claude、Gemini、Microsoft	判断主张层闭环
`source_date`	发布或更新日期	Perplexity、Claude、来源页	查旧版口径
`execution_log`	activity、错误、局部失败	Microsoft、Claude、Perplexity	查检索是否完整
`permission_context`	用户身份、ACL、模式开关	Microsoft、企业RAG	查权限例外
`counter_type`	5类反例标签	全平台	后续统计
`confidence_label`	高、中、低、待复核	全平台	输出统一口径
`repair_action`	补来源、改条件、归档旧文	全平台	把观察变成动作

来源：上述官方文档字段整理；核验时间：2026年6月15日。

台账还应设置“进入知识库条件”。高置信反例需要满足3点：来源可打开或文档可定位，反例片段与主张直接相关，复测时间和平台入口明确。中置信反例通常是来源相关但片段较宽，适合进入人工复核队列。低置信反例是模型正文里出现了链接或说法，但无法回到结构化字段。待复核反例是平台公开字段显示了检索或错误线索，但还不能判断主张是否成立。

反例证据不应只在内容团队手里流转。技术团队要处理抓取、索引、权限、知识源版本；品牌团队要处理标准表述和旧版口径；法务或合规团队要处理高风险主张；运营团队要处理复测节奏。每次修订都要保留“为什么修”：是因为相反来源出现、旧版页面仍被引用、引用片段不支撑结论，还是权限导致不同用户看到不同结果。

反例证据复测样本表应该如何设计？

反例复测样本表建议至少覆盖6个平台、5类反例、连续4周记录，且每条样本都要区分官方字段观察和团队解释。

下面的样本表是复测设计，不代表任何平台结果。它的价值在于把“我要查什么反例”写清楚，并为每个平台指定应保存的字段。实际执行时，应保持同一查询词、同一语言、同一地区或同一账号条件，连续记录至少4周；若平台入口、模型、知识源或页面状态发生变化，要另起样本，不要混入旧序列。

样本查询	目标平台	重点字段	要找的反例	记录结果口径
某品牌适合所有行业做GEO吗	ChatGPT/OpenAI	`url_citation`、sources	“所有行业”是否被来源支持	只记录字段，不写稳定结论
AI Mode会引用企业官网吗	Google AI Mode	支持链接、query fan-out说明、Search Console日期	入口和地区例外	记录链接和曝光层数据
Copilot回答为何引用旧文档	Microsoft Copilot/Azure AI Search	sources按钮、`activity`、`references`	旧版来源或权限差异	查ref_id回连
Claude引用片段是否证明适用范围	Claude	`cited_text`、page_age、文档位置	不适用场景	主张拆短后复核
Perplexity为何返回旧结果	Perplexity	`search_results`、`date`、`last_updated`	旧版口径	新旧来源并列
Gemini某句答案为何没有来源	Gemini grounding	`groundingSupports`、`groundingChunks`	segment未覆盖	未映射句子降级

来源：OpenAI、Google、Microsoft、Anthropic、Perplexity、Google AI官方文档字段整理；核验时间：2026年6月15日。

复测表要避免两个陷阱。第一，不把“无引用”直接当成负面结论；有些入口可能没有逐句字段，有些平台只展示支持链接，有些知识源因权限不可见。第二，不把“有来源”直接当成支撑；来源可能只证明背景，不证明适用条件。反例管理的难点就在这里：它要求团队保留中间过程，而不是只保留最终答案。

每周复测后，建议输出3个列表。第一是新增反例：本周第一次出现的相反来源、旧版页面或引用冲突。第二是持续反例：连续2次以上出现的同类问题，优先修订内容资产。第三是消退反例：修订后不再出现，但仍要保留至少一个复测周期，防止入口差异造成短期误判。

常见问题

Q：GEO反例证据和普通负面反馈有什么区别？

A： GEO反例证据至少要绑定1个AI平台字段，而普通负面反馈可以只是用户意见。 反例证据需要记录查询、平台入口、来源URL或文档ID、引用片段、时间和冲突类型。没有字段回连的反馈可以作为线索，但不能直接进入高置信反例库。

Q：ChatGPT/OpenAI有citation就能证明答案没有反例吗？

A： 不能，至少要检查url_citation位置、URL、标题和被覆盖主张4项。 引用点可能只支持段落中的一部分事实，也可能指向旧页面或宽泛页面。若答案包含多个条件词，如地区、版本、行业、时间，应逐项确认来源是否支撑。

Q：Google AI Overviews和AI Mode没有逐句字段，还能管理反例吗？

A： 可以，但Google场景主要做链接层、条件层和曝光层反例，不应伪装成逐句引用审计。 你可以记录支持链接、页面索引与摘要资格、query fan-out相关子意图、Search Console生成式AI报告中的URL可见性，但不能据此推断内部排序规则。

Q：Microsoft Copilot里references很多，为什么仍要看activity log？

A： 因为references只说明可用来源集合，activity才能帮助发现查询计划、局部失败和来源回连问题。 如果activity显示某个关键知识源失败，最终答案就可能缺少相反来源；如果references.activitySource无法回连回答引用ID，也要标为待复核。

Q：Claude的cited_text最多只有一小段，够不够判断反例？

A： 够做初筛，但不够替代完整来源复核。 cited_text适合判断引用片段是否直接支撑主张；若片段只给背景，或页面有更多限制条件，就要打开来源继续核对。对PDF、纯文本和自定义内容块，还要看页码、字符索引或content block位置。

Q：Perplexity的citations和search_results该优先看哪个？

A： 优先看结构化search_results或Search API的results[]，再按端点文档核验citations。 Perplexity官方文档强调来源应从响应字段读取，不应要求模型在正文里生成URL。旧脚本若只抓citation字段，可能漏掉字段演进造成的反例。

Q：Gemini grounding里webSearchQueries能当反例证据吗？

A： webSearchQueries只能作为查询层线索，高置信反例仍要看groundingSupports是否覆盖关键segment。 查询数组能说明模型搜索过哪些方向，但不能证明某句答案被来源支撑。若segment没有连接到groundingChunks，应降为待复核或弱支撑。

Q：旧版反例应该删除还是保留？

A： 建议保留旧版反例记录，至少包括旧来源、新来源、失效原因和修订时间4项。 直接删除旧资料会让团队失去追溯能力，也无法解释为什么AI仍可能引用旧页面、转载页或用户上传文件。更稳的做法是归档、标注状态，并在新页面写清当前条件。

来源与核验时间

以下来源均为平台官方文档、官方支持页或官方公告；平台事实统一核验时间为2026年6月15日：

来源：OpenAI Web search文档，https://developers.openai.com/api/docs/guides/tools-web-search
来源：OpenAI Responses API参考，https://developers.openai.com/api/reference/resources/responses/methods/create
来源：Google Search Central《AI Features and Your Website》，https://developers.google.com/search/docs/appearance/ai-features
来源：Google Search Central生成式AI搜索优化指南，https://developers.google.com/search/docs/fundamentals/ai-optimization-guide
来源：Google Search Central Blog生成式AI表现报告公告，https://developers.google.com/search/blog/2026/06/gen-ai-performance-reports
来源：Microsoft Support关于Copilot Web search说明，https://support.microsoft.com/en-us/microsoft-365-copilot/how-web-search-works-in-microsoft-365-copilot-chat-and-agents
来源：Microsoft Learn Azure AI Search agentic retrieval overview，https://learn.microsoft.com/en-us/azure/search/agentic-retrieval-overview
来源：Microsoft Learn retrieve action文档，https://learn.microsoft.com/en-us/azure/search/agentic-retrieval-how-to-retrieve
来源：Microsoft 365 Copilot connectors overview，https://learn.microsoft.com/en-us/microsoft-365/copilot/extensibility/overview-copilot-connector
来源：Anthropic Claude Web search tool文档，https://platform.claude.com/docs/en/agents-and-tools/tool-use/web-search-tool
来源：Anthropic Claude Citations文档，https://platform.claude.com/docs/en/build-with-claude/citations
来源：Anthropic Claude Search results文档，https://platform.claude.com/docs/en/build-with-claude/search-results
来源：Perplexity Search API文档，https://docs.perplexity.ai/docs/search/quickstart
来源：Perplexity Sonar Prompt Guide，https://docs.perplexity.ai/docs/sonar/prompt-guide
来源：Perplexity Changelog，https://docs.perplexity.ai/docs/resources/changelog
来源：Google AI for Developers《Grounding with Google Search》，https://ai.google.dev/gemini-api/docs/google-search
来源：Gemini API《Generating content》参考，https://ai.google.dev/api/generate-content