销售行为萃取
方法论

基于 LLM + 无监督聚类的质性分析框架
IPP Research  ·  2026.04

高分销售到底做对了什么?

从 1,940 段真实门店对话中,提取可复制的销售行为模式。不依赖专家预设框架,让数据自己说话。

132,517
原始数据行
1,940
销售技巧得分 ≥ 80
22,520
结构化行为证据
17
项行为主题
7
个销售阶段
34
个子场景
12
个产品话题
核心发现:高分销售的本质不是"背参数",而是"把产品参数翻译成客户的生活场景"。场景化关联占全部行为的 31.7%,是产品参数陈述的 1.6 倍。

从数据结构开始设计终局

QEC 不是简单的"引用 + 编码"。我们刻意将 Context 作为独立字段提取,为后续行为和场景的分别聚类埋下锚点。

Quote
销售员的原话,从对话中原封不动摘出
Explanation
这句话为什么有效,起了什么销售作用
Code
行为编码标签
→ 聚类为行为主题
Context
对话情境描述
→ 聚类为销售场景
设计意图:Code(做了什么)和 Context(在什么情况下做的)是两个正交维度。分开提取 → 分别聚类 → 交叉组合,才能回答"在什么场景下用什么技巧"。同时刻意区分销售技巧产品知识——萃取的是可跨产品迁移的行为模式,不是参数背诵。
22,520
QEC 总量
11.6
平均 QEC / 对话
100%
Quote 验证通过率

七步管线 × 三层幻觉控制

完全 Bottom-Up,不预设任何分类框架。双路聚类取共识,三层机制控制 LLM 幻觉。

P0
数据准备
P1
QEC 提取
P2
Code 归一化
P3
双路聚类
P4
抽象提炼
P5
矩阵构建
P6
采样验证

双路聚类共识机制

Route A: BERTopic
Embedding + HDBSCAN + UMAP
纯统计,不会编造,但可能过细
Route B: LLM 归纳
语义理解 + 主题合并
有归纳能力,但可能过度概括

三层幻觉控制

Layer 1: 约束性 Prompt

禁止引入外部框架,所有编码必须基于原始对话文本中的实际表达。

Layer 2: 反向验证

独立 LLM 实例对 QEC 重新归类,precision ≥ 0.85 为通过。行为主题 17/17 全通过。

Layer 3: 一致性检验

不同 temperature 下重复分类,检验分类结果对随机性的鲁棒性。

17 项行为主题

14 项销售技巧 + 3 项产品知识。场景化关联独占鳌头——高分销售最核心的行为特征。

14 项 · 75.9%
销售技巧(可跨产品迁移)
3 项 · 24.1%
产品知识(参数传递型)

7 个销售阶段 × 34 个子场景

需求挖掘 + 产品介绍占 70.5%,是高分对话的主战场。点击左侧阶段查看子场景展开。

点击阶段查看子场景 ↓

← 点击左侧任意阶段

行为主题 × 阶段 对应关系

哪些行为在哪个阶段集中出现。颜色越亮,行为密度越高。

热点解读:场景化关联在产品介绍展示阶段最集中(3,559);成交推进在配置选择(401)和促成成交(457)双峰分布;顾虑打消集中在顾虑异议处理阶段(676)。

深度下钻:从矩阵到原始话术

以"需求挖掘 → 客户结合生活场景询问"为例,展示从宏观矩阵到微观话术的完整追溯链。

需求挖掘 客户结合生活场景询问整体体验 1,668 QEC
场景化关联  893 QEC · 53.5%
"如果开通了5G蜂窝网络,接电话发信息收通知都可以快速搞定,无论我们去到哪都可以及时接听来电、看到消息不会错漏。"
Code: 关联-5G蜂窝与出差通讯不漏接  |  Context: 客户提到经常出差,关心手表实际使用体验  |  Watch Ultra 3 · 办公族
产品参数陈述  296 QEC · 17.7%
"我们搭配的是A19 Pro芯片,再搭配120赫兹高刷新率屏幕,不管是打游戏还是日常使用都比较好用。"
Code: 陈述-A19Pro芯片与120Hz高刷流畅  |  Context: 客户询问手机日常使用是否流畅  |  iPhone 17 Pro · 日常使用
深度需求挖掘  151 QEC · 9.1%
"咱们平时是用什么功能会比较多一些呀?"
Code: 询问-客户日常高频使用功能  |  Context: 客户确认手表自用,员工需要进一步了解具体需求  |  Watch Series 11 · 大学生
追溯链:矩阵格子(行为主题 × 阶段) → 子场景 → 行为主题卡片 → QEC(Quote + Code + Context) → conversation_id + turn → 原始对话全文。每一层都可穿透。

Saturation-Driven 采样验证

不预设样本量,让数据告诉我们"够了"。60 段对话(3.1%)即达饱和,管线高度确定性。

三个组件

C1: 对话向量化

每段对话 = 其 QEC code embedding 均值(384维),将对话转化为可计算的数学向量。

C2: 分层覆盖选择

6 产品 × 3 客群 = 18 层。每层用 submodular facility location 贪心选最有代表性的对话,marginal gain < 1% 自动停止。

C3: 饱和度检测

逐批重跑管线,监测一致性。连续 3 批波动 < 2pp 即饱和——再加样本不改变结论。

验证结果

0.904
综合一致性
0.959
话题分布
0.878
阶段分布
0.871
行为主题分布
0.893
矩阵 Pearson r
0.841
QEC 产出量 r

饱和曲线

0.923
Batch 1
20 对话
0.911
Batch 2
40 对话
0.904
Batch 3
60 对话
波动 0.019 < 阈值 0.02 → 饱和确认  |  理论依据: Xia et al. (ICML 2024) + De Paoli & Mathis (2024-2025)

方法论可迁移,结果可落地

这套框架不仅适用于本次分析,可复制到任何需要从非结构化文本中萃取行为模式的场景。

方法论贡献

QEC 结构化设计
Context 独立提取,为行为 × 场景交叉分析奠基;销售技巧与产品知识刻意分离,确保萃取可迁移的行为模式。
双路聚类共识
BERTopic(统计)× LLM(语义)取交集,避免单一方法偏差。
三层幻觉控制
约束性 Prompt + 反向验证 + 一致性检验,确保 LLM 不编造、不偏离、不漂移。
Saturation-Driven 验证
数学驱动的样本量决策,消除人为预设精度的循环论证。
Sales Behavior Extraction Methodology  |  IPP Research  |  2026.04