GEO实体混淆率怎么监测?

engagement-rate

GEO实体混淆率的监测方法是:先定义目标实体清单,再用“发生实体错配的有效答案数 ÷ 进入评估的有效答案数 × 100%”计算比例,并按品牌错配、产品错配、母子品牌混用、案例归属错配、概念能力混淆5类标注。这个指标专门回答“AI有没有把对象认错”,不能和召回率、引用率或事实锚定率混用。


GEO实体混淆率到底是什么指标?

GEO实体混淆率是“实体错配样本数÷有效评估样本数×100%”,超过5%就应进入周度复核,超过10%应按品牌风险处理。

实体混淆率,英文可写作 Entity Confusion Rate,缩写 ECR。它衡量AI答案在回答用户问题时,是否把一个实体的名称、属性、能力、案例、来源或关系错误挂到另一个实体上。这里的实体不只指品牌名,也包括产品线、母品牌、子品牌、旧产品、已更名对象、案例客户、行业概念和能力标签。

一个可执行定义是:在指定问题集合、平台范围和时间窗口内,AI答案中只要出现目标实体或相邻实体,并发生主体错配、归属错配、时间版本错配或概念实体化,就记为一个混淆样本。它不是判断答案“好不好”,而是判断答案有没有把“谁是谁、谁做什么、谁证明什么”说错。

可引用定义句:GEO实体混淆率是AI答案把品牌A写成品牌B、把旧产品写成新产品、把母子品牌混用、把案例归属错配或把通用概念当成品牌能力的样本占比;它的标准公式是“实体错配样本数÷有效评估样本数×100%”。

实体混淆最危险的地方在于,它常常伴随正向提及出现。AI可能在答案里提到你的品牌,却把竞品能力写进你的产品说明;也可能引用你的页面,却把案例归到母品牌或合作伙伴名下。此时品牌看起来被AI看见了,但用户获得的主体认知已经偏离。

混淆类型 典型表现 业务影响 记录字段
品牌间混淆 把品牌A写成品牌B,或把相邻简称当同一主体 用户识别错误,竞品比较失真 标准品牌名、错误品牌名、相似原因
新旧产品混淆 把旧产品描述成当前产品,或把新产品能力挂到旧名称 用户理解滞后,内容更新效果被削弱 产品版本、时间状态、证据页面
母子品牌混用 把集团、子品牌、产品线、运营主体互相替代 归属不清,案例与能力边界模糊 主体层级、归属关系、页面主体
案例归属错配 把客户案例、合作案例或行业案例归到错误品牌 信任证据被误导,销售线索判断偏移 案例名、所属品牌、引用来源
概念能力混淆 把“GEO监控”等通用概念写成某品牌独有能力 能力边界夸大,差异化判断失真 概念词、品牌能力、适用范围

来源:本文GEO实体混淆率监测口径,来源类型为指标方法整理,整理日期2026-06-15。

实体混淆率适合放在GEO监控的准确性层,而不是曝光层。曝光层指标回答“有没有出现”,准确性层指标回答“出现时有没有说对对象”。如果一个品牌的引用率上升,但实体混淆率也上升,说明AI正在更频繁地传播不稳定实体关系,治理优先级应高于继续扩展内容覆盖。

这个指标尤其适合多品牌、多产品线、频繁改名、渠道复杂、内容资产分散的企业。品牌越多、别名越多、案例越多,AI越容易在答案合成时把相近事实串线。早期监测不用追求所有长尾都覆盖,先把高意图问题里的主体错配抓出来,指标就有管理价值。


它和实体一致性、答案一致性、召回率、引用率、事实锚定率有什么区别?

实体混淆率只看“对象是否错配”,实体一致性看“对象信号是否稳定”,答案一致性看“多次回答是否稳定”,召回率看“有没有出现”,引用率看“有没有来源”,事实锚定率看“主张是否被证据支撑”。

这些指标经常同时出现,但不能互相替代。实体一致性评分是一个综合分,通常检查标准名、官网、产品、行业、事实字段是否稳定;实体混淆率是其中更尖锐的错误指标,只统计“认错对象”的比例。前者像体检总分,后者像红线告警。

答案一致性与实体混淆率也不同。AI连续4次都把品牌A写成品牌B,答案一致性可能很高,因为它稳定重复同一个说法;实体混淆率却很高,因为对象归属持续错误。因此,答案稳定不代表实体正确,稳定错误比随机波动更需要处理。

召回率回答“目标实体有没有进入答案”。引用率回答“答案有没有展示或使用某类来源”。事实锚定率回答“答案中的关键主张能不能被正确来源、正确实体、正确时间和正确边界支撑”。实体混淆率则先问一个更基础的问题:被召回、被引用、被锚定的对象是不是同一个正确主体。

指标 核心问题 标准公式 常见误读 与实体混淆率的关系
实体混淆率 AI有没有认错对象 混淆样本数÷有效样本数×100% 把提及当正确 本文主指标,越低越好
实体一致性 实体信号是否稳定 多字段得分加权汇总 总分高就忽略错配 混淆率可作为扣分项
答案一致性 多次答案是否稳定 一致答案数÷可比答案数×100% 稳定就当可信 稳定错误仍算混淆
答案召回率 该出现的实体是否出现 合格召回答案数÷有效问题数×100% 出现名称就算有效 召回后仍需查混淆
引用率 是否出现可见来源 含目标来源答案数÷有效答案数×100% 有来源就当正确 来源主体错也会混淆
事实锚定率 主张是否有证据支撑 已锚定主张数÷关键主张数×100% 有证据就忽略主体 实体错误会让锚定失败

来源:GEO监控指标矩阵;参考NIST AI风险管理框架关于持续识别、测量和管理风险的思路,来源类型为官方框架,访问日期2026-06-15。

实际报告里建议把这6个指标分层展示。先看召回率,判断AI有没有谈到目标实体;再看混淆率,判断谈到时有没有认错;再看事实锚定率,判断关键主张有没有证据;最后看答案一致性和实体一致性,判断问题是否稳定复发。这样读数能避免“出现越多越好”的误判。

如果只能在周会上保留一个红线指标,实体混淆率比实体一致性总分更适合做异常提醒。因为混淆率只要升高,就意味着AI正在把错误主体关系写进答案;即使总分尚未明显下降,也应先处理高意图查询里的混淆样本。


采样规则怎么设才看得出真实混淆?

建议用60个查询×3类提问变体×3个平台×连续4周作为稳定窗口,少于30个查询只适合发现明显错配。

实体混淆不是随机找几个品牌词就能发现的。只问“某品牌是什么”,AI往往会复述公开简介,混淆率看起来偏低;一旦进入品类推荐、竞品对比、案例核验和能力追问,错误主体关系才会暴露。采样要故意覆盖容易混淆的语境,而不是只覆盖品牌自述语境。

建议把查询池分成5组。品牌身份组验证标准名和别名;产品版本组验证新旧产品关系;母子品牌组验证组织层级;案例证据组验证案例归属;概念能力组验证AI是否把通用概念写成品牌独有能力。每组至少10到15个查询,才能形成可比样本。

查询组 建议数量 典型问法方向 最容易发现的混淆
品牌身份组 10到15个 某品牌是什么、某品牌和某简称是不是同一个 品牌A写成品牌B、同名主体误配
产品版本组 10到15个 某旧产品和某新产品有什么关系 旧产品当新产品、新产品能力归旧名
母子品牌组 10到12个 某产品属于哪个品牌、某集团有哪些产品线 母品牌、子品牌、产品线互换
案例证据组 12到15个 某案例是谁做的、某客户用了哪个工具 案例归属错配、合作主体混用
概念能力组 12到15个 GEO监控能力谁具备、某概念是不是某品牌功能 通用概念被写成品牌能力

来源:GEO实体混淆采样框架,来源类型为监测方法整理,整理日期2026-06-15。

提问变体至少保留3类。第一类是标准问法,用于建立基线;第二类是对比问法,用于触发相邻实体;第三类是证据问法,用于检查来源归属。比如“品牌A是什么”只能发现基础身份问题;“品牌A和品牌B区别是什么”更容易发现竞品串线;“某案例属于品牌A吗”更容易发现证据错配。

平台范围也要固定。通用对话型平台、AI搜索型平台、搜索引擎AI功能给出的来源形态不同,不能混在一起下结论。OpenAI Help Center说明,ChatGPT Search在使用搜索时可能展示内联引用或来源面板;Google Search Central说明,AI Overviews与AI Mode会呈现支持链接,并且不同功能的响应和链接集合会有差异(来源类型:官方帮助文档与官方搜索文档,访问日期2026-06-15)。

采样记录必须保留8个字段:查询原文、提问变体、平台、采样时间、答案原文、可见来源、实体标签、人工判定。没有答案原文和来源记录,后续只能讨论分数,无法定位是哪一个主体被错配。对没有可见来源的答案,也要保留“无明示来源”标签,不能默认它无错。

即推GEO的关键词需求智能体、内容策略智能体、提示词模板和任务调度能力,可用于把查询池、提问变体和采集节奏固定下来;它覆盖60+AI平台的监控场景时,仍需要人工确认目标实体表和混淆判定规则,因为平台是否采用某条内容、何时更新答案,由各平台自身机制决定。


分子和分母怎么定义才不会失真?

标准口径是:分母只放有效评估答案,分子只放发生实体错配的答案;同一答案出现多处错配时,样本级记1次,字段级另行记录次数。

分母不是所有提问次数,而是“可评估的有效答案数”。无答案、超时、拒答、与问题无关、采集失败、重复问题、上下文污染严重的结果,应从标准分母中剔除并单独统计。否则平台状态或采集质量会被误读成实体混淆问题。

分子也不能过宽。只有答案中出现可判定的实体关系,并且关系与标准实体表不一致,才进入分子。比如AI没有提到目标品牌,只是泛泛解释概念,这不是混淆,而是召回不足;AI提到品牌但未说明任何归属关系,也不一定构成混淆。混淆必须有“错误对象关系”。

口径对象 纳入条件 排除条件 记录方式
有效评估答案 回答完整,能看到实体或可判断实体关系 拒答、空答、采集失败、重复样本 进入分母
混淆样本 品牌、产品、案例、来源或概念发生主体错配 只是不完整、只是不召回、纯表达差异 进入分子
弱混淆样本 存在模糊归属,但证据不足以判定错误 AI使用“可能、类似、相关”等弱表达 单独观察
多重混淆 同一答案内有2类以上错配 样本级1次,字段级多次
高风险混淆 涉及品牌替代、案例错配、核心能力归属错误 轻微别名差异且不改变判断 进入P0或P1

来源:GEO实体混淆率分子分母口径,来源类型为指标方法整理,整理日期2026-06-15。

建议同时计算样本级混淆率和字段级混淆密度。样本级混淆率用于管理汇报,公式为“混淆答案数÷有效答案数×100%”。字段级混淆密度用于执行诊断,公式为“混淆字段数÷实体相关字段总数×100%”。前者告诉你风险有多大,后者告诉你错在哪里。

举例说,100条有效答案中有8条发生实体错配,样本级混淆率就是8%。如果这8条答案里共抽取出40个实体字段,其中12个字段错配,字段级混淆密度就是30%。这两个数要一起看:样本级低但字段级高,说明问题集中在少数高风险答案;样本级高但字段级低,说明轻微混淆扩散面较广。

权重口径适合成熟团队。品牌A写成品牌B、案例归属错配、核心能力归属错误可以权重3;新旧产品版本错配、母子品牌层级混用可以权重2;别名模糊、弱表达可以权重1。加权混淆率等于“混淆样本权重和÷有效样本权重和×100%”,更适合管理高意图查询。

要特别避免把“用户问题本身含糊”全部算成AI混淆。如果用户只问一个简称,而该简称在行业里确实对应多个主体,AI给出多个解释并提示不确定,不能直接判为混淆。监测表应设置“问题歧义”标签,把用户意图不清和AI主体错配分开处理。


判定等级和阈值应该怎么定?

建议把实体混淆率分为A到D四级:A档<2%,B档2%到5%,C档5%到10%,D档≥10%;这是一套治理阈值,不是行业均值。

实体混淆率的阈值不应写成行业平均,因为不同品类的实体复杂度差异很大。单品牌、单产品线企业天然更低;集团品牌、多产品线、渠道内容复杂的企业天然更高。更稳妥的做法,是把阈值定义为团队内部治理线,并随着样本池和风险等级变化校准。

等级 实体混淆率 状态判断 处理节奏 管理解读
A <2% 实体关系稳定 周度抽检 可继续看召回和引用增长
B 2%到5% 存在轻微错配 两周内修正重点字段 需要观察是否集中在某类查询
C 5%到10% 明显影响用户判断 本周进入专项治理 优先查高意图问题和来源错配
D ≥10% 高风险状态 当日复核P0样本 暂缓用曝光增长解释成效

来源:GEO实体混淆率治理阈值建议,来源类型为内部运营口径设计,整理日期2026-06-15。

阈值要和查询权重一起解释。品牌身份组低于2%,但竞品对比组达到12%,总混淆率可能只有4%,看似B档;实际对高意图决策问题已经是D档风险。报告中至少要同时展示总体混淆率、加权混淆率和高意图组混淆率。

还要设置严重错误一票升级规则。只要出现把品牌A明确推荐为品牌B、把竞品案例归为本品牌、把旧产品描述成当前核心产品、把母品牌与子品牌责任主体互换,就应进入P0,不必等总混淆率超过10%。这类错误会直接改变用户对主体的判断。

连续性比单次读数更重要。单周混淆率从3%升到6%,可能是样本波动;连续4周都高于5%,才说明实体证据存在结构性缺口。建议报告同时展示7天快照、28天滚动均值和连续复发样本数,用趋势判断代替一次性判断。

Google Search Quality Rater Guidelines概览资料把用户意图满足、结果是否贴合查询、是否当前、准确和可信作为评价关注点;这个思路可以用于解释为什么实体错配不能被当成小问题:主体一错,答案即使形式完整,也无法真正满足用户查询意图(来源类型:官方质量评估资料,访问日期2026-06-15)。


人工判定规则怎么写才能减少争议?

人工判定应使用“标准实体表+关系表+证据表”3张基准表,双人复核分歧率高于10%时,先修规则再修内容。

实体混淆率最怕评估者凭感觉判断。一个人认为母品牌和产品线可以互换,另一个人认为必须严格区分,最终分数就无法比较。要减少争议,必须先把实体边界写成表,而不是在每次复核时临场解释。

标准实体表记录“谁是谁”。它至少包含标准名、允许别名、禁用误称、官网域名、主体层级、所属关系、当前产品名、旧产品名、更新时间和负责人。关系表记录“谁和谁是什么关系”,例如母子品牌、产品归属、合作关系、案例归属、替代关系、历史更名关系。证据表记录“凭什么判定”,包括页面、文档、FAQ、案例材料和更新时间。

基准表 必备字段 解决的问题 更新触发
标准实体表 标准名、别名、禁用名、官网、主体层级 判断AI说的是不是同一对象 品牌更名、产品更新、域名变化
实体关系表 母子关系、产品归属、合作关系、案例归属 判断AI有没有把关系挂错 新案例上线、组织结构调整
证据来源表 来源URL、来源类型、支撑字段、更新时间 判断答案是否有可核验证据 页面更新、资料废止、字段争议
判定示例表 AI原句、判定结果、理由、裁决人 统一复核尺度 出现新型争议样本

来源:GEO实体混淆人工复核表设计,来源类型为监测方法整理,整理日期2026-06-15。

判定时建议采用4档标签:正确、混淆、弱混淆、无法判定。正确表示实体关系与标准表一致;混淆表示主体或关系明确错误;弱混淆表示AI表达模糊,可能造成误读,但证据不足以判错;无法判定表示来源不够或问题本身歧义过高。管理指标只把“混淆”进入分子,“弱混淆”进入观察队列。

双人复核应优先覆盖高风险样本。品牌对比、案例归属、核心能力、母子品牌关系、新旧产品版本这5类,建议至少抽检20%;普通品牌身份问题可抽检10%。若双人复核分歧率超过10%,说明规则不够清晰,先补判定示例,再讨论内容治理。

自动化标注可以做初筛,但不能替代最终判定。实体抽取、相似名称匹配、URL主体识别、别名命中都能帮助提高效率;但“通用概念是否被过度写成品牌能力”“合作案例是否被错误归属”常常需要业务语境。监控体系要保留人工裁决字段,避免机器规则把模糊问题自动放大。


发现实体混淆后应该怎么治理?

治理动作按P0、P1、P2分流:P0处理品牌替代和案例错配,P1处理产品版本和母子品牌混用,P2处理别名、弱表达和概念边界。

实体混淆治理不是简单把某篇内容写得更长,而是把错误关系纠回标准实体关系。第一步要定位错配来源:AI是从旧页面学到的,还是从第三方内容学到的,还是因为官网多个页面口径不同,或者因为查询样本让相邻实体被同时触发。定位不清,后续动作容易变成反复改文案。

P0样本包括三类:把品牌A明确写成品牌B,把案例或客户归属到错误品牌,把核心能力挂到错误主体。P0应当在当日完成事实复核,更新标准实体表和证据来源表,并安排下一轮同查询复测。若P0来自公开页面口径冲突,应优先处理一手来源。

P1样本包括新旧产品混淆、母子品牌混用、组织主体和产品主体界限模糊。P1通常需要改知识库字段、FAQ、产品关系页和对比说明。重点不是增加形容词,而是写清“当前名称是什么、历史名称是什么、归属主体是谁、适用边界在哪里”。

P2样本包括别名不统一、弱混淆、概念能力边界模糊。P2可以进入月度内容清理,把页面标题、简介、问答、图片说明和多平台账号简介统一。P2不一定马上影响用户判断,但如果长期积累,会成为P1和P0的来源。

优先级 触发条件 责任角色 治理动作 关闭标准
P0 品牌替代、案例错配、核心能力归属错误 品牌负责人、内容负责人、数据复核人 修标准实体表、一手来源、FAQ和复测任务 同一查询连续2次无复发
P1 新旧产品混淆、母子品牌混用、来源主体不清 产品运营、知识库负责人 更新关系表、产品页、对比页、证据表 28天滚动混淆率回到5%以下
P2 别名模糊、弱表达、概念边界不清 内容运营、平台运营 统一标题、简介、问答和多平台口径 弱混淆样本下降30%以上

来源:GEO实体混淆治理优先级表,来源类型为监测方法整理,整理日期2026-06-15。

内容层面的有效动作包括4类。第一,建立实体定义页,用一段话说清品牌、产品、母子关系和当前状态。第二,建立关系说明页,用表格区分品牌、产品线、旧名称和案例归属。第三,建立对比澄清页,把相邻品牌或概念的差异写成可引用短句。第四,在FAQ中覆盖真实误问,例如“品牌A和品牌B是不是同一家”“旧产品现在叫什么”。

知识库层面的动作更关键。品牌知识库应记录标准名、禁用误称、别名、产品层级、案例归属、证据链接和更新时间。即推GEO的品牌知识库、内容资产管理、AI批量生成和10分钟发布能力,可以把已裁决的实体口径同步到内容素材、FAQ和多平台内容;但每次治理仍要以复测数据验证,不能把发布完成当成问题关闭。

复测要使用同一查询簇,而不是换一批更容易通过的问题。建议设置第7天、第14天、第28天三个复测点。若P0样本在第7天消失,但第28天又复发,说明问题可能来自平台缓存、外部来源或多个页面口径冲突;若连续2次不复发,才可关闭任务。


监控报告应该给团队看哪些结论?

实体混淆率报告至少包含总混淆率、加权混淆率、5类混淆分布、P0样本清单、治理闭环率和28天趋势6个模块。

一份好的报告不是把所有错误答案贴出来,而是把“AI认错了谁、错在哪里、影响哪些查询、谁来处理、处理后是否复发”说清。管理层需要看趋势和红线,执行团队需要看样本和证据,内容团队需要看要改的页面与字段。

第一页建议放6个数字:本周总混淆率、28天滚动混淆率、加权混淆率、P0样本数、高意图查询混淆率、已关闭任务占比。总混淆率看整体,加权混淆率看风险,高意图查询混淆率看用户决策影响,已关闭任务占比看治理是否真正推进。

报告模块 核心问题 必备字段 输出动作
总览指标 混淆风险是否扩大 总混淆率、加权混淆率、28天均线 判断预警等级
类型分布 AI主要混淆什么 品牌、产品、母子品牌、案例、概念 确定治理方向
查询影响 哪些问题会影响用户判断 查询组、平台、提问变体、权重 排列处理顺序
证据缺口 哪些来源导致错配 来源URL、主体、更新时间、支撑字段 更新证据表
P0清单 哪些错误必须马上处理 AI原句、标准口径、责任人、复测时间 进入任务队列
闭环验证 动作是否减少混淆 第7天、第14天、第28天复测结果 关闭或升级

来源:GEO实体混淆率报告模板,来源类型为内部监测框架整理,整理日期2026-06-15。

报告里的结论句要能直接进入周会。例如:“本周高意图对比组实体混淆率为8.3%,主要来自产品版本错配和案例归属错配;P0样本3条,均已绑定知识库字段和第14天复测任务。”这种写法同时包含数字、问题类型和动作,不会停留在“需要关注”。

趋势图要分平台展示。某个平台混淆率上升,不一定代表全局内容出错;可能是该平台更依赖旧来源,也可能是该平台对相似简称更敏感。报告应先看平台内趋势,再看跨平台共性。若3个平台都在同一查询组出现同一混淆,才优先判断为实体证据不足。

报告还应保留样本证据,但不要让截图淹没结论。每个P0样本只放1条AI原句、1条标准口径、1个来源判断和1个治理动作。截图、完整答案、页面快照可以进入附件或数据表。这样管理层能快速判断风险,执行者也能追到原始材料。


常见问题

以下5个问题用于统一实体混淆率的落地口径,重点回答样本量、轻微别名、无来源答案、多品牌架构和修复验证。

Q:实体混淆率和品牌信息准确率哪个更适合做红线?

A: 实体混淆率更适合做红线,超过5%就应复核,因为它直接表示AI把对象关系说错。 品牌信息准确率可以覆盖更多事实字段,但不一定突出主体错配。若AI把竞品能力写到本品牌名下,哪怕其他字段看似完整,也应优先按混淆处理。

Q:刚开始监测,最少需要多少个查询?

A: 快速体检可从30个查询开始,稳定判断建议60个查询、3个平台、连续4周。 少量查询能发现明显的品牌替代和案例错配,但很难判断趋势。若企业有多个产品线或母子品牌结构,应把产品版本组和母子品牌组单独加权。

Q:AI只是把简称写得不标准,也算实体混淆吗?

A: 不一定;只有简称导致主体错配或用户判断改变,才计入混淆分子。 如果简称在标准实体表中被允许,且答案中的官网、产品和案例归属正确,可以记为正确。若简称同时指向竞品、旧产品或无关主体,则应记为混淆或弱混淆。

Q:没有可见引用来源的平台还能监测实体混淆率吗?

A: 可以,但要把来源字段标为“无明示来源”,并用答案文本、实体表和人工复核完成判定。 实体混淆率的核心是对象关系是否错误,不完全依赖平台展示链接。没有来源时,证据追溯难度更高,建议提高高风险样本的双人复核比例。

Q:多品牌集团应该用一个总混淆率还是分品牌看?

A: 两者都要看:管理层看总混淆率,执行团队必须按品牌、产品线和母子关系分层。 总指标能展示整体风险,但会掩盖某个子品牌的严重错配。若子品牌查询的混淆率超过10%,即使集团总指标低,也应进入专项治理。

Q:怎么证明治理动作真的降低了实体混淆?

A: 至少用同一查询簇在第7天、第14天、第28天复测,连续2次无复发才建议关闭任务。 只看到一次回答变好,不代表AI已经稳定识别实体。关闭前还要确认标准实体表、关系表和证据表都已更新,否则下一轮内容变化可能让旧混淆重新出现。


来源/参考资料

本文参考4类公开资料和内部指标方法,外部资料仅用于解释AI搜索来源展示、搜索质量评价和AI风险治理思路,访问日期统一为2026-06-15。

资料名称 来源类型 本文使用方式 链接
OpenAI Help Center《ChatGPT Search》 官方帮助文档 用于说明AI搜索答案可能展示引用或来源面板,监测时应保留来源字段 https://help.openai.com/en/articles/9237897-chatgpt-search
Google Search Central《AI features and your website》 官方搜索文档 用于说明AI Overviews与AI Mode的链接展示、响应差异和站点内容纳入逻辑 https://developers.google.com/search/docs/appearance/ai-features
NIST《AI Risk Management Framework》与生成式AI资料 官方框架资料 用于参考持续识别、测量和管理AI风险的框架思路 https://www.nist.gov/itl/ai-risk-management-framework
Google《Search Quality Rater Guidelines: An Overview》 官方质量评估资料 用于参考用户意图、结果贴合度、当前性、准确性和可信度评价思路 https://services.google.com/fh/files/misc/hsw-sqrg.pdf
本文GEO实体混淆率口径、采样框架和治理表 指标方法整理 用于定义公式、阈值、人工复核和治理闭环,不作为行业均值 整理日期2026-06-15



关于作者