不同AI平台的GEO反例证据如何管理?

affiliate-management

不同AI平台的GEO反例证据,应该按“答案主张、来源字段、检索过程、冲突类型、复测时间”管理。本文只依据官方文档核验可观察字段,不推断未公开排序规则,也不代表展示或引用结果。平台事实核验时间:2026年6月15日。


ChatGPT/OpenAI、Google、Copilot、Claude、Perplexity、Gemini怎么定义GEO反例证据?

ChatGPT/OpenAI、Google、Copilot、Claude、Perplexity和Gemini场景下,GEO反例证据应分为5类:相反来源、例外条件、不适用场景、旧版口径和引用冲突。

GEO反例证据不是为了证明某个平台“错了”,而是为了防止团队把一次AI回答误当成稳定事实。一个品牌或主题在AI答案中被引用时,往往同时存在支持证据和反例证据:支持证据说明“这条主张为什么成立”,反例证据说明“在哪些条件下它不成立、哪些来源给出不同说法、哪些旧页面会误导模型、哪些引用只支持了部分句子”。缺少反例管理,GEO复盘会变成只看好消息的截图收藏。

本文把反例证据定义为5类。第一类是相反来源:同一问题下,平台返回的来源与目标主张相反,或支持竞品、旧定义、不同适用条件。第二类是例外条件:答案主张本身正确,但只在特定地区、语言、入口、模式或知识源范围内成立。第三类是不适用场景:页面被引用了,却无法支撑用户真正问的任务。第四类是旧版口径:来源曾经正确,但发布日期、页面更新、字段变更或产品状态已经让它不再适合作为当前依据。第五类是引用冲突:答案中的引用位置、来源列表、片段映射或执行日志互相对不上。

反例证据类型 典型表现 应抓的平台字段 处理动作 置信标签
相反来源 来源页面直接支持相反结论 citations、sources、references、search_results、groundingChunks 保存URL、标题、片段和原问题 高优先复核
例外条件 结论只适用于部分语言、地区或模式 query fan-out、webSearchQueries、activity、filters 记录入口、参数、用户状态 条件成立才保留
不适用场景 来源相关但无法回答当前任务 start/end、cited_text、groundingSupports、snippet 拆分主张并降级引用 标为弱支撑
旧版口径 旧文档、旧字段、旧页面继续被引用 date、last_updated、page_age、报告日期 建立旧版反例库 进入更新队列
引用冲突 答案说A,引用只证明B annotations、ref_id、activitySource、segment 回连字段,查断点 暂不入库

来源:OpenAI Web search与Responses API文档、Google Search Central AI features文档、Microsoft Learn Azure AI Search文档、Anthropic Claude文档、Perplexity API文档、Google AI Gemini文档;核验时间:2026年6月15日。

这5类反例要和“平台事实”分开写。平台事实是官方文档已经公开的字段、入口、限制或说明;GEO判断是团队基于这些字段做的审计方法。比如Google官方说明AI Overviews与AI Mode可能使用query fan-out,但没有公开每次查询的完整子查询列表;因此你可以记录“可能存在扇出导致的相反来源”,不宜写成“某类页面会稳定被优先采用”。同理,OpenAI公开url_citation字段位置,Gemini公开groundingSupports映射,Microsoft公开activityreferences,这些字段能帮助审计反例,但不等于公开排序规则。

反例证据管理的核心不是“找到更多反面材料”,而是让每条AI主张至少能回答3个问题:哪个来源支持它,哪个来源反驳它,哪个条件会让它失效。


ChatGPT/OpenAI如何用sources和citations发现相反来源?

ChatGPT/OpenAI场景下,反例证据优先看url_citation的URL、标题、start/end位置和可选sources,而不是只看回答末尾是否出现链接。

OpenAI官方Web search文档说明,模型回答默认会包含网页搜索结果的内联引用,url_citation annotation会包含被引用来源的URL、标题,以及来源在模型回答中被使用的起止位置。Responses API参考还说明,可以通过include请求额外输出数据,例如web_search_call.action.sources,也可以包含file_search_call.results。这些字段为反例证据管理提供了两层线索:一层是答案文本中的引用位置,另一层是检索工具实际使用或返回的来源集合。

对ChatGPT/OpenAI做GEO反例审计时,第一步不是判断答案好坏,而是把每个主张拆成短句。例如“某功能适合所有企业”应拆成“某功能存在”“适合企业用户”“适合所有企业”3个主张。随后读取url_citation.start_indexend_index,看引用覆盖的是哪一句。如果引用只支持“功能存在”,却没有支持“所有企业”,这就是不适用场景反例;如果引用页面标题或正文显示该功能只适用于某个版本,则属于例外条件反例。

ChatGPT/OpenAI字段 可发现的反例 具体检查方式 常见降级原因
url_citation.url 相反来源、旧版口径 打开URL核对当前页面与归档信息 URL主题相关但事实不匹配
url_citation.title 来源身份冲突 标题是否是官方、媒体、论坛或旧文档 标题只到栏目层,无法证明细节
start_index/end_index 引用冲突 引用范围是否紧贴具体主张 一个引用覆盖多条主张
web_search_call.action.sources 检索层相反来源 比较sources与最终引用是否一致 检索到但未进入答案
file_search_call.results 私有知识旧版反例 检查文件名、chunk、版本日期 内部文件过期或混有旧口径

来源:OpenAI Web search文档与Responses API参考,核验时间:2026年6月15日。

OpenAI场景尤其需要区分公开网页搜索和文件型RAG。公开网页搜索里的反例通常来自外部来源冲突,例如官方文档与第三方评测页面对适用范围说法不同;文件型RAG里的反例通常来自内部版本冲突,例如旧PDF、旧FAQ、旧销售资料与当前帮助文档同时存在。两类反例不能混在同一栏,否则团队无法判断问题来自外部网页、私有知识库还是答案合成层。

一个可执行的记录格式是:query_text记录原问题,claim_text记录被审计主张,citation_span记录start/end,support_url记录支持来源,counter_url记录相反来源,counter_type记录反例类型,review_action记录下一步。若同一主张在3次复测中出现2次以上相反来源,就不要急着改写为强结论,应先把页面上的适用条件、发布日期和旧版说明补清楚。

需要注意的是,search_context_size或上下文范围设置只能作为复测条件记录,不能被当成证据强度本身。上下文更宽可能暴露更多相反来源,也可能让答案覆盖更多无关材料。GEO团队应保存参数、模型、时间和响应原文,而不是只截取最终回答中的漂亮段落。


Google AI Overviews和AI Mode如何用query fan-out找到例外条件?

Google AI Overviews和AI Mode场景下,反例管理要围绕query fan-out、支持链接、索引与摘要资格、Search Console可见数据做条件化记录。

Google Search Central官方文档说明,AI Overviews与AI Mode都可能使用query fan-out,即围绕子主题和数据源发出多个相关搜索来生成回答。文档同时说明,AI Mode和AI Overviews可能使用不同模型和技术,因此展示的回答和链接会有差异;AI Overviews只在系统认为对经典Search有增益时展示,很多查询不会触发。这个边界对反例管理非常重要:没有出现AI答案不等于页面失效,出现支持链接也不等于未来稳定。

Google场景下最常见的反例不是“引用错误”,而是“条件缺失”。例如一个页面在桌面端某地区查询中作为支持链接出现,但移动端、另一语言或AI Mode后续追问中没有出现;或者一个页面能支撑定义型子问题,却无法支撑比较型、风险型、操作型子问题。query fan-out让这些例外更常见,因为同一用户问题可能被拆成多个相关搜索,任何一个子问题缺证据,都可能让页面在局部任务中缺席。

Google可观察对象 能发现的反例 记录字段 不应推断的内容
AI Overviews支持链接 相反来源、来源多样性 查询、地区、设备、链接URL、截图时间 不推断固定排序
AI Mode支持链接 复杂比较中的例外条件 原问题、追问、链接集合、回答语气 不把AI Mode等同AI Overviews
query fan-out官方说明 子主题缺口 原问题、可能子意图、缺失页面 不声称看到了内部子查询
索引与摘要资格 不适用基础条件 页面是否可索引、是否可显示摘要 不代表进入AI功能
Search Console生成式AI报告 URL可见性异常 impressions、pages、countries、devices、dates 不做主张级引用证明

来源:Google Search Central《AI Features and Your Website》、Google生成式AI搜索优化指南、Search Console生成式AI表现报告公告;核验时间:2026年6月15日。

Google官方资料还说明,要作为AI Overviews或AI Mode的支持链接,页面需要已被索引,并且有资格在Google Search中以摘要形式展示;除此之外没有额外技术要求。反例管理可以据此建立准入检查:页面若被noindex、摘要展示受限、主要内容无法被抓取,就不要把它缺席AI功能归因为“平台不喜欢”。这类情况应归为基础条件反例,而不是引用冲突。

Search Console在2026年6月公布的生成式AI表现报告,提供了站点URL在Search生成式AI功能中的可见性视图,包括AI Overviews、AI Mode以及Discover中的生成式AI功能;报告字段包括impressions、pages、countries、devices和dates,并处于逐步测试和扩展阶段。它适合发现“某URL在某段时间失去可见性”的趋势反例,但不能告诉你某一句答案由哪个页面支撑。也就是说,它是曝光层反例工具,不是逐句citation工具。

Google反例库建议把“官方事实、样本观察、方法推断”分列。官方事实写文档链接与核验日期;样本观察写查询、入口、地区、设备、截图;方法推断写团队补证据的动作。只要三者混在一起,后续很容易把“某次样本没有出现”误写成“平台规则改变”,这会让GEO复盘失真。


Microsoft Copilot和Azure AI Search如何用references与activity log排查引用冲突?

Microsoft Copilot和Azure AI Search场景下,反例证据的关键是让referencesactivity、查询计划、权限范围和回答引用ID形成闭环。

Microsoft支持文档说明,当Microsoft 365 Copilot使用Web搜索时,回答下方会出现sources按钮,用户可查看Copilot发送给Bing的确切查询以及所用来源。Microsoft Learn也说明,Microsoft 365 Copilot和Copilot Chat可以在Web搜索启用时参考Web内容,管理员策略和用户侧Web内容开关会影响是否使用Web搜索。这意味着Copilot用户侧反例管理至少要记录两件事:Copilot把原问题改写成了什么Bing查询,以及来源按钮里显示了哪些来源。

开发者侧更适合使用Azure AI Search agentic retrieval做字段级审计。Microsoft Learn说明,agentic retrieval是面向复杂问题的多查询管线,可以把复杂问题拆成更小的子查询,并行执行、语义重排,再把结果合并为可供LLM生成grounded answers的内容;它可以返回source references和activity log。retrieve action文档进一步说明,响应有三个主要部分:抽取或合成响应、activity array、references array;当一个或多个知识源失败时,响应可能只包含成功来源,并在activity中记录局部错误。

Microsoft字段或界面 反例发现方式 需要保存什么 风险判断
sources按钮 查Bing查询与来源是否支持答案 原提示、Bing查询、来源URL 只能做界面层证据
response 查回答是否混合多个来源 主张、引用ID、答案段落 合成层可能省略部分依据
activity 查子查询、调用状态、局部错误 query plan、elapsedMs、错误信息 失败来源会造成缺证
references 查引用ID与来源内容 id、sourceData、activitySource 引用ID不回连则冲突
权限与ACL 查用户能否访问来源 用户身份、知识源范围、ACL状态 权限差异会形成例外条件

来源:Microsoft Support关于Copilot Web search说明、Microsoft Learn Azure AI Search agentic retrieval overview、Microsoft Learn retrieve action文档;核验时间:2026年6月15日。

Microsoft场景的典型引用冲突有3种。第一种是查询冲突:用户问“当前适用范围”,Copilot发给Bing或知识源的查询却偏向旧版页面。第二种是来源冲突:references里有多个来源,其中一个支持A,一个支持B,答案合成后只保留了A。第三种是执行冲突:activity显示某个关键知识源失败,但最终答案仍给出确定语气。第三种最危险,因为它让团队误以为答案基于完整证据。

Azure AI Search反例管理要特别重视activitySource。如果回答中的引用ID能在references中找到,并能回连到成功的检索活动,这条证据可以进入高置信候选;如果references存在但sourceData为空,或activity显示局部失败,就应降为待复核。若多个knowledge source同时参与检索,还要记录每个来源的职责:产品文档用于当前功能,帮助中心用于操作边界,历史公告只用于旧版追溯,不能混用。

Microsoft 365 Copilot connectors文档说明,连接器会把外部内容同步进Microsoft Graph,每个项目包括内容、标题、URL等元数据和访问控制列表;用户可在Copilot回答中选择citations预览存储在Microsoft Graph中的外部项目。这个机制让权限成为重要反例条件:同一问题在不同用户身份下可能看到不同来源。GEO复测时需要记录用户角色与来源权限,否则无法判断差异来自平台检索、权限过滤还是内容本身。


Claude如何用citations和search_result管理不适用场景?

Claude场景下,反例证据要看citation是否指向具体来源位置;Web search看web_search_result_location,自定义RAG看search_result块与文档引用范围。

Anthropic官方Web search tool文档说明,Claude的Web搜索结果包括来源页面URL、标题、page_age和用于多轮引用的加密内容;Web search引用始终启用,每个web_search_result_location包含URL、标题、encrypted_index和最多150个字符的cited_text。文档还说明,Web search工具遇到错误时,API仍可能返回200响应,错误会在响应体内以web_search_tool_result_error形式出现。对反例管理来说,这意味着“接口成功”不等于“检索成功”。

Claude的Citations文档还说明,响应可以包含多个text block,每个text block可包含Claude作出的claim和支持该claim的citation;不同文档类型的citation位置格式不同,PDF可引用页码范围,纯文本可引用字符索引,自定义内容文档可引用content block索引。Search results文档则说明,开发者可以提供search_result内容块,包含source、title、content和可选citations配置,Claude可自动为这些结果生成来源归因。

Claude证据形态 可发现的反例 关键字段 管理建议
Web search citation 来源只支持背景,不支持结论 urltitlecited_textpage_age 把主张和150字符片段逐项核对
Web search error 答案缺少必要检索 web_search_tool_result_error、error_code 接口200也要查响应体
PDF citation 旧版文件继续被引用 页码范围、文件名、日期 记录版本并拆出旧版反例
Plain text citation 引用覆盖过宽 字符索引范围 缩小文本块重新测试
search_result 自定义RAG来源冲突 source、title、content、citations.enabled 每个块只放一类事实

来源:Anthropic Claude Web search tool、Citations、Search results官方文档;核验时间:2026年6月15日。

Claude场景最容易出现“不适用场景反例”。比如答案引用了某篇通用介绍文章,片段证明“概念存在”,但用户问的是“是否适合某行业”。这时cited_text相关却不足,不能把它作为高置信支持。更稳的做法是把答案拆成概念、适用对象、限制条件、时间范围4个claim,再分别查看citation是否支撑。没有支撑的claim应进入反例队列,而不是被正文引用顺手带过。

自定义RAG里,search_result块的粒度决定了反例可见度。如果一个content块同时包含当前功能、历史变更、用户案例和免责声明,Claude即使给出citation,也只能说明它用了这一大块,无法证明某个细节。GEO团队应把事实块拆细:当前口径一块,旧版说明一块,限制条件一块,案例样本一块。这样当旧版反例出现时,可以定位到具体块,而不是重查整份文档。

Claude还适合做“旧版反例回放”。由于page_age、页码、字符索引、content block index都能提供定位线索,团队可以保存旧来源与新来源的并列表:旧来源为什么曾经成立,新来源如何改变结论,哪些答案仍在引用旧来源。这个表比简单删除旧文档更有用,因为模型、缓存、外部转载或用户上传资料都可能继续让旧口径出现。


Perplexity如何用search_results处理旧版反例和引用字段演进?

Perplexity场景下,反例证据应优先使用结构化search_results或Search API的results[],并把citations视为需要按端点核验的兼容字段。

Perplexity官方Search API文档说明,Search API返回结构化JSON results[]数组,字段包括titleurlsnippetdatelast_updated;Sonar返回带内置引用的文本答案。Sonar Prompt Guide则提示,不要要求模型在回答正文里写URL,Sonar会在顶层citationssearch_results字段返回来源,应从那里读取。Perplexity Changelog又说明,应用应使用search_results字段,因为它提供标题、URL和发布日期等更详细信息,并提到citations字段的演进。官方文档之间的这种字段演进,本身就是旧版反例管理要记录的对象。

对Perplexity做GEO反例管理,第一优先级是时效字段。datelast_updated能帮助识别旧版口径:某个来源发布较早但仍被引用,或者页面最后更新时间晚于发布日期却仍保留旧片段。第二优先级是snippet,它能快速判断结果片段是否真的支撑主张。第三优先级是字段兼容:旧脚本若只抓citations,在字段演进后可能误判为无来源;新脚本应同时检查search_results、Search API results[]和端点文档。

Perplexity字段 反例价值 应如何记录 注意边界
search_results[].url 定位相反来源 保存URL与域名 不从正文链接反推
search_results[].title 判断来源身份 记录标题与页面类型 标题可能只说明主题
search_results[].snippet 快速查不适用场景 保存片段与主张对照 snippet不足时需打开页面
date 查发布时间旧例 与主张时点比较 旧来源未必错误
last_updated 查更新状态 与页面当前内容比较 更新时间不等于事实有效
citations 兼容展示层 search_results回连 字段状态按端点核验

来源:Perplexity Search API、Sonar Prompt Guide、Agent API Web Search、Changelog官方文档;核验时间:2026年6月15日。

Perplexity的反例库可以设置“旧版有效期”字段。比如一条来源在2025年发布、2026年未更新,但它讨论的是长期概念,可以作为背景;若它讨论的是平台字段、模型能力、政策入口或产品状态,就只能作为旧版反例。这样做能避免把所有旧来源都打成无效,也能避免把明显过期的资料继续当成当前依据。

Perplexity还适合发现“相反来源并存”。同一查询下,search_results可能返回官方文档、第三方教程、新闻、论坛和历史页面。若答案最终采用官方文档,但结果列表中存在相反来源,团队仍应记录,因为下一次查询、不同地域或不同追问可能让相反来源进入答案。反例记录不是只保存最终引用,还要保存“已被检索但未被采用”的冲突候选。

另一个常见问题是让模型在JSON正文里自行生成链接。Perplexity官方Output Control文档提醒,直接让模型在JSON内容中返回链接可能出现无效URL,应使用API响应中的citationssearch_results字段。GEO团队据此可以设一条硬规则:任何从模型正文里抽出的URL都只能算低置信线索,只有回到结构化来源字段后,才能进入正式反例表。


Gemini grounding如何用groundingSupports和search_results区分引用冲突?

Gemini grounding场景下,高价值反例来自groundingSupports未覆盖关键segment,或segment连接的groundingChunks只能支撑部分事实。

Google AI for Developers文档说明,Grounding with Google Search会把Gemini连接到实时Web内容,帮助提供更准确的回答和可验证来源。Gemini API的Generating content参考列出GroundingMetadata字段,包括groundingChunks[]groundingSupports[]webSearchQueries[]searchEntryPointretrievalMetadata。其中groundingChunks是从指定grounding来源检索到的支持引用,groundingSupports是支撑关系列表,webSearchQueries是后续Web搜索查询。

Gemini反例管理要把“搜索过”和“支撑了”分开。webSearchQueries说明模型执行或准备执行了哪些搜索查询,适合发现query层面的相反来源;groundingChunks说明有哪些来源进入支持引用集合,适合发现来源层相反材料;groundingSupports说明答案文本片段和来源块之间的连接,适合发现主张层引用冲突。若某个关键segment没有groundingSupports覆盖,这条主张就不能被标为高置信,即使同一响应里存在相关来源。

Gemini字段 能发现的反例 记录方式 不能替代什么
webSearchQueries 查询层相反来源、例外条件 保存查询数组与原问题 不能证明主张被支撑
groundingChunks 来源层旧版口径 保存URI、title、来源类型 不能说明答案句子正确
groundingSupports.segment 主张层引用缺口 保存文本片段、start/end 不能覆盖未映射句子
groundingChunkIndices 来源连接冲突 回连chunk索引 不能推断排序规则
retrievalMetadata 检索流程线索 记录检索相关元数据 不能单独替代人工复核

来源:Google AI for Developers《Grounding with Google Search》与Gemini API《Generating content》;核验时间:2026年6月15日。

用户常把search_results当作所有平台的统一字段,但Gemini官方文档当前更强调groundingMetadata下的queries、chunks和supports。为了避免字段混用,跨平台表里应设置两列:一列叫“搜索结果列表”,用于Perplexity的search_results或Search API results[];另一列叫“主张支撑映射”,用于Gemini的groundingSupports、OpenAI的url_citation位置和Claude的citation位置。这样才能区分“找到了来源”和“某句答案被来源支持”。

Gemini的典型引用冲突是:答案里有一个包含两个事实的segment,其中第一部分由chunk A支撑,第二部分并没有足够依据;或者segment连接到chunk B,但chunk B标题相关、正文不直接证明该事实。遇到这种情况,反例表应记录segment全文、chunk索引、来源URL、冲突描述和修订动作。修订动作通常不是立刻否定整条答案,而是把主张拆短、补充条件、换用更明确的来源页面。

Gemini还适合识别“例外条件缺失”。如果webSearchQueries里出现了地区、时间或版本词,而最终segment没有把这些条件带回答案,就要记录为例外条件反例。比如查询层搜索了“2026 API field change”,答案却写成无时间限制的通用结论,这不是来源错误,而是条件丢失。GEO内容页要在可引用段落中把时间、入口、版本和适用范围写在同一句或相邻句里,减少条件被抽离的概率。


不同AI平台的GEO反例证据应该怎么建统一台账?

跨平台反例台账至少要有14个字段,把OpenAI citations、Google query fan-out、Microsoft activity、Claude cited_text、Perplexity search_results和Gemini groundingSupports映射到同一套审计语言。

统一台账的目标,是让不同平台的异构字段可以被同一团队复盘。OpenAI的start_index、Gemini的segment、Claude的cited_text、Microsoft的ref_id、Perplexity的snippet、Google的支持链接都不是同一种对象;如果直接比较“来源数量”,就会误判。更稳的做法是先把所有字段翻译为4层:查询层、来源层、主张层、执行层。

台账字段 说明 对应平台字段 必填理由
audit_time 北京时间与UTC时间 全平台 没时间就无法判断旧版反例
platform_mode ChatGPT、AI Mode、Copilot、API等入口 全平台 不同入口不能混算
query_text 原始用户问题 全平台 查询改写会改变来源
retrieval_query 平台公开的检索查询或扇出线索 Google、Microsoft、Gemini、Perplexity 用于查例外条件
claim_text 被审计的答案主张 全平台 主张不拆短就无法判冲突
support_source 支持来源URL或文档ID OpenAI、Claude、Perplexity、Gemini、Microsoft 判断是否有支撑
counter_source 相反来源URL或文档ID 全平台 反例证据核心
support_span 引用片段、segment、索引或ref_id OpenAI、Claude、Gemini、Microsoft 判断主张层闭环
source_date 发布或更新日期 Perplexity、Claude、来源页 查旧版口径
execution_log activity、错误、局部失败 Microsoft、Claude、Perplexity 查检索是否完整
permission_context 用户身份、ACL、模式开关 Microsoft、企业RAG 查权限例外
counter_type 5类反例标签 全平台 后续统计
confidence_label 高、中、低、待复核 全平台 输出统一口径
repair_action 补来源、改条件、归档旧文 全平台 把观察变成动作

来源:上述官方文档字段整理;核验时间:2026年6月15日。

台账还应设置“进入知识库条件”。高置信反例需要满足3点:来源可打开或文档可定位,反例片段与主张直接相关,复测时间和平台入口明确。中置信反例通常是来源相关但片段较宽,适合进入人工复核队列。低置信反例是模型正文里出现了链接或说法,但无法回到结构化字段。待复核反例是平台公开字段显示了检索或错误线索,但还不能判断主张是否成立。

反例证据不应只在内容团队手里流转。技术团队要处理抓取、索引、权限、知识源版本;品牌团队要处理标准表述和旧版口径;法务或合规团队要处理高风险主张;运营团队要处理复测节奏。每次修订都要保留“为什么修”:是因为相反来源出现、旧版页面仍被引用、引用片段不支撑结论,还是权限导致不同用户看到不同结果。


反例证据复测样本表应该如何设计?

反例复测样本表建议至少覆盖6个平台、5类反例、连续4周记录,且每条样本都要区分官方字段观察和团队解释。

下面的样本表是复测设计,不代表任何平台结果。它的价值在于把“我要查什么反例”写清楚,并为每个平台指定应保存的字段。实际执行时,应保持同一查询词、同一语言、同一地区或同一账号条件,连续记录至少4周;若平台入口、模型、知识源或页面状态发生变化,要另起样本,不要混入旧序列。

样本查询 目标平台 重点字段 要找的反例 记录结果口径
某品牌适合所有行业做GEO吗 ChatGPT/OpenAI url_citation、sources “所有行业”是否被来源支持 只记录字段,不写稳定结论
AI Mode会引用企业官网吗 Google AI Mode 支持链接、query fan-out说明、Search Console日期 入口和地区例外 记录链接和曝光层数据
Copilot回答为何引用旧文档 Microsoft Copilot/Azure AI Search sources按钮、activityreferences 旧版来源或权限差异 查ref_id回连
Claude引用片段是否证明适用范围 Claude cited_text、page_age、文档位置 不适用场景 主张拆短后复核
Perplexity为何返回旧结果 Perplexity search_resultsdatelast_updated 旧版口径 新旧来源并列
Gemini某句答案为何没有来源 Gemini grounding groundingSupportsgroundingChunks segment未覆盖 未映射句子降级

来源:OpenAI、Google、Microsoft、Anthropic、Perplexity、Google AI官方文档字段整理;核验时间:2026年6月15日。

复测表要避免两个陷阱。第一,不把“无引用”直接当成负面结论;有些入口可能没有逐句字段,有些平台只展示支持链接,有些知识源因权限不可见。第二,不把“有来源”直接当成支撑;来源可能只证明背景,不证明适用条件。反例管理的难点就在这里:它要求团队保留中间过程,而不是只保留最终答案。

每周复测后,建议输出3个列表。第一是新增反例:本周第一次出现的相反来源、旧版页面或引用冲突。第二是持续反例:连续2次以上出现的同类问题,优先修订内容资产。第三是消退反例:修订后不再出现,但仍要保留至少一个复测周期,防止入口差异造成短期误判。


常见问题

Q:GEO反例证据和普通负面反馈有什么区别?

A: GEO反例证据至少要绑定1个AI平台字段,而普通负面反馈可以只是用户意见。 反例证据需要记录查询、平台入口、来源URL或文档ID、引用片段、时间和冲突类型。没有字段回连的反馈可以作为线索,但不能直接进入高置信反例库。

Q:ChatGPT/OpenAI有citation就能证明答案没有反例吗?

A: 不能,至少要检查url_citation位置、URL、标题和被覆盖主张4项。 引用点可能只支持段落中的一部分事实,也可能指向旧页面或宽泛页面。若答案包含多个条件词,如地区、版本、行业、时间,应逐项确认来源是否支撑。

Q:Google AI Overviews和AI Mode没有逐句字段,还能管理反例吗?

A: 可以,但Google场景主要做链接层、条件层和曝光层反例,不应伪装成逐句引用审计。 你可以记录支持链接、页面索引与摘要资格、query fan-out相关子意图、Search Console生成式AI报告中的URL可见性,但不能据此推断内部排序规则。

Q:Microsoft Copilot里references很多,为什么仍要看activity log?

A: 因为references只说明可用来源集合,activity才能帮助发现查询计划、局部失败和来源回连问题。 如果activity显示某个关键知识源失败,最终答案就可能缺少相反来源;如果references.activitySource无法回连回答引用ID,也要标为待复核。

Q:Claude的cited_text最多只有一小段,够不够判断反例?

A: 够做初筛,但不够替代完整来源复核。 cited_text适合判断引用片段是否直接支撑主张;若片段只给背景,或页面有更多限制条件,就要打开来源继续核对。对PDF、纯文本和自定义内容块,还要看页码、字符索引或content block位置。

Q:Perplexity的citations和search_results该优先看哪个?

A: 优先看结构化search_results或Search API的results[],再按端点文档核验citations Perplexity官方文档强调来源应从响应字段读取,不应要求模型在正文里生成URL。旧脚本若只抓citation字段,可能漏掉字段演进造成的反例。

Q:Gemini grounding里webSearchQueries能当反例证据吗?

A: webSearchQueries只能作为查询层线索,高置信反例仍要看groundingSupports是否覆盖关键segment。 查询数组能说明模型搜索过哪些方向,但不能证明某句答案被来源支撑。若segment没有连接到groundingChunks,应降为待复核或弱支撑。

Q:旧版反例应该删除还是保留?

A: 建议保留旧版反例记录,至少包括旧来源、新来源、失效原因和修订时间4项。 直接删除旧资料会让团队失去追溯能力,也无法解释为什么AI仍可能引用旧页面、转载页或用户上传文件。更稳的做法是归档、标注状态,并在新页面写清当前条件。


来源与核验时间

以下来源均为平台官方文档、官方支持页或官方公告;平台事实统一核验时间为2026年6月15日:

关于作者