销售行为萃取
方法论

基于 LLM + 无监督聚类的质性分析框架

IPP Research · 2026.04

高分销售到底做对了什么？

从 1,940 段真实门店对话中，提取可复制的销售行为模式。不依赖专家预设框架，让数据自己说话。

132,517

原始数据行

1,940

销售技巧得分 ≥ 80

22,520

结构化行为证据

17

项行为主题

7

个销售阶段

34

个子场景

12

个产品话题

核心发现：高分销售的本质不是"背参数"，而是"把产品参数翻译成客户的生活场景"。场景化关联占全部行为的 31.7%，是产品参数陈述的 1.6 倍。

从数据结构开始设计终局

QEC 不是简单的"引用 + 编码"。我们刻意将 Context 作为独立字段提取，为后续行为和场景的分别聚类埋下锚点。

Quote

销售员的原话，从对话中原封不动摘出

Explanation

这句话为什么有效，起了什么销售作用

Code

行为编码标签
→ 聚类为行为主题

Context

对话情境描述
→ 聚类为销售场景

设计意图：Code（做了什么）和 Context（在什么情况下做的）是两个正交维度。分开提取 → 分别聚类 → 交叉组合，才能回答"在什么场景下用什么技巧"。同时刻意区分销售技巧和产品知识——萃取的是可跨产品迁移的行为模式，不是参数背诵。

22,520

QEC 总量

11.6

平均 QEC / 对话

100%

Quote 验证通过率

七步管线 × 三层幻觉控制

完全 Bottom-Up，不预设任何分类框架。双路聚类取共识，三层机制控制 LLM 幻觉。

P0
数据准备

→

P1
QEC 提取

→

P2
Code 归一化

→

P3
双路聚类

→

P4
抽象提炼

→

P5
矩阵构建

→

P6
采样验证

双路聚类共识机制

Route A: BERTopic

Embedding + HDBSCAN + UMAP
纯统计，不会编造，但可能过细

∩

Route B: LLM 归纳

语义理解 + 主题合并
有归纳能力，但可能过度概括

三层幻觉控制

Layer 1: 约束性 Prompt

禁止引入外部框架，所有编码必须基于原始对话文本中的实际表达。

Layer 2: 反向验证

独立 LLM 实例对 QEC 重新归类，precision ≥ 0.85 为通过。行为主题 17/17 全通过。

Layer 3: 一致性检验

不同 temperature 下重复分类，检验分类结果对随机性的鲁棒性。

17 项行为主题

14 项销售技巧 + 3 项产品知识。场景化关联独占鳌头——高分销售最核心的行为特征。

14 项 · 75.9%

销售技巧（可跨产品迁移）

3 项 · 24.1%

产品知识（参数传递型）

7 个销售阶段 × 34 个子场景

需求挖掘 + 产品介绍占 70.5%，是高分对话的主战场。点击左侧阶段查看子场景展开。

点击阶段查看子场景 ↓

← 点击左侧任意阶段

行为主题 × 阶段对应关系

哪些行为在哪个阶段集中出现。颜色越亮，行为密度越高。

热点解读：场景化关联在产品介绍展示阶段最集中（3,559）；成交推进在配置选择（401）和促成成交（457）双峰分布；顾虑打消集中在顾虑异议处理阶段（676）。

深度下钻：从矩阵到原始话术

以"需求挖掘 → 客户结合生活场景询问"为例，展示从宏观矩阵到微观话术的完整追溯链。

需求挖掘 → 客户结合生活场景询问整体体验 → 1,668 QEC

场景化关联 893 QEC · 53.5%

"如果开通了5G蜂窝网络，接电话发信息收通知都可以快速搞定，无论我们去到哪都可以及时接听来电、看到消息不会错漏。"

Code: 关联-5G蜂窝与出差通讯不漏接 | Context: 客户提到经常出差，关心手表实际使用体验 | Watch Ultra 3 · 办公族

产品参数陈述 296 QEC · 17.7%

"我们搭配的是A19 Pro芯片，再搭配120赫兹高刷新率屏幕，不管是打游戏还是日常使用都比较好用。"

Code: 陈述-A19Pro芯片与120Hz高刷流畅 | Context: 客户询问手机日常使用是否流畅 | iPhone 17 Pro · 日常使用

深度需求挖掘 151 QEC · 9.1%

"咱们平时是用什么功能会比较多一些呀？"

Code: 询问-客户日常高频使用功能 | Context: 客户确认手表自用，员工需要进一步了解具体需求 | Watch Series 11 · 大学生

追溯链：矩阵格子（行为主题 × 阶段） → 子场景 → 行为主题卡片 → QEC（Quote + Code + Context） → conversation_id + turn → 原始对话全文。每一层都可穿透。

Saturation-Driven 采样验证

不预设样本量，让数据告诉我们"够了"。60 段对话（3.1%）即达饱和，管线高度确定性。

三个组件

C1: 对话向量化

每段对话 = 其 QEC code embedding 均值（384维），将对话转化为可计算的数学向量。

C2: 分层覆盖选择

6 产品 × 3 客群 = 18 层。每层用 submodular facility location 贪心选最有代表性的对话，marginal gain < 1% 自动停止。

C3: 饱和度检测

逐批重跑管线，监测一致性。连续 3 批波动 < 2pp 即饱和——再加样本不改变结论。

验证结果

0.904

综合一致性

0.959

话题分布

0.878

阶段分布

0.871

行为主题分布

0.893

矩阵 Pearson r

0.841

QEC 产出量 r

饱和曲线

0.923

Batch 1
20 对话

0.911

Batch 2
40 对话

0.904

Batch 3
60 对话

波动 0.019 < 阈值 0.02 → 饱和确认 | 理论依据: Xia et al. (ICML 2024) + De Paoli & Mathis (2024-2025)

方法论可迁移，结果可落地

这套框架不仅适用于本次分析，可复制到任何需要从非结构化文本中萃取行为模式的场景。

方法论贡献

QEC 结构化设计

Context 独立提取，为行为 × 场景交叉分析奠基；销售技巧与产品知识刻意分离，确保萃取可迁移的行为模式。

双路聚类共识

BERTopic（统计）× LLM（语义）取交集，避免单一方法偏差。

三层幻觉控制

约束性 Prompt + 反向验证 + 一致性检验，确保 LLM 不编造、不偏离、不漂移。

Saturation-Driven 验证

数学驱动的样本量决策，消除人为预设精度的循环论证。

销售行为萃取方法论

高分销售到底做对了什么？

从数据结构开始设计终局

七步管线 × 三层幻觉控制

双路聚类共识机制

三层幻觉控制

Layer 1: 约束性 Prompt

Layer 2: 反向验证

Layer 3: 一致性检验

17 项行为主题

7 个销售阶段 × 34 个子场景

点击阶段查看子场景 ↓

行为主题 × 阶段 对应关系

深度下钻：从矩阵到原始话术

Saturation-Driven 采样验证

三个组件

C1: 对话向量化

C2: 分层覆盖选择

C3: 饱和度检测

验证结果

饱和曲线

方法论可迁移，结果可落地

方法论贡献

销售行为萃取
方法论

行为主题 × 阶段对应关系