客户数据挖掘项目纪实+问题请教

3 views
Skip to first unread message

hunter

unread,
Jun 25, 2008, 7:20:46 PM6/25/08
to ttnn BI 观点
今天开始干活了,大致了解了项目组的想法(先探探路,决心很大,投入也不小了,已经作了2年的准备,数据仓库,系统整合等),理解了其客户购物流程,参
与了数据提取,参观了实体店,写了一些框架文档。有专人负责协助,很快还有新人加入,我被当作挖掘专家的身份对待(汗)


数据已经整合到一张表中,17M行数据,50多列,以交易id为主键,含交易信息,客户信息,款项,商品等信息,大致如下:

交易id 本次交易总额 商品id 商品码 单价 数量 客户id 客户类型 付款方式

我的计划,打算输出一些初步的数据质量报告,探索性的结果,看看反馈

步骤1 用Clementin的data audit结点,检测异常值,评估数据质量,输出均值,最大,最小,离群点,扭曲度等

考虑: 增加几个标志位:高利润客户,高利润产品等,作为目标变量,这样可以看各个变量中这几个标志位的分布

问题1 还有其他的指标用于data metrics, data profiling等吗?

步骤2 建立产品与客户的关联,用Link Analysis,GRI,关联规则等,看看哪些东西的关联较大(有可能要先把数据集根据不同产品或不同类
别客户分类,在子集里算管理规则,这样支持度等选取更灵活,也减小运算量)

考虑:可能要添加客户分类,产品按特性分类等,可以得到有关这些类别的关联

步骤3 选取重要特征feature selection

步骤4 对客户聚类,对产品聚类,对聚类结果,用决策树,GRI等进行处理,看特征

步骤5 对目标变量(如高利润客户)用决策树处理,看特征

兄弟们赶快指点一下,我肯定有考虑不周甚至是错误的部分!

hunter

unread,
Jun 25, 2008, 7:53:41 PM6/25/08
to ttnn BI 观点
补充问题2

聚类一般大家选几个群?还是 SOM或2步法直接聚?
有没有用具体如david boudlin等指标来测评并优化群数量的?

笨笨

unread,
Jun 25, 2008, 9:57:28 PM6/25/08
to ttnn BI 观点
1. 你做客户细分是要探查客户概况还是要发现各类群体(包括一些异常群体)?如果是探查概况,把所有客户里的异常客户剔除,可以用Anomaly,也
可以用各指标的Zscore来进行判断。如果是为了发现各类群体(包括异常群体),省略剔除异常的步骤
2. 你具体有哪些字段不太清楚,但根据经验,客户描述信息失真较为厉害,银行里的数据失真性也很强,其他行业就不用说了,因此聚类建模的输入字段中应
该尽量使用可信度高的字段,例如从身份证里提取性别、年龄、籍贯等等,以及由交易数据所派生出来的行为信息,例如前一个月交易次数,平均交易金额等
等。
3. 尽量别使用绝对值,而使用规范化处理之后的相对值
4. 尽量别使用离散型字段,因为有违聚类算法本意,实在需要使用,也应处理为哑元或者进行连续性指派
5. 看不明白你为什么要使用feature selection,Target Field是什么?大概是想筛选出信息含量高的字段吧?用
Statistic节点对每一个字段做相关性分析就可以了。
6. 两步法用于第一点中的概况探查十分有效。除此以外,建议用K-means,因为可解释性强,运算时间短,你可以根据聚类结果所产生的类标签自行计
算每类的中心点和半径,甚至可以做到模型脱离Clementine环境。Kohonen没办法实现。
7. david boudlin指标是指什么?第一次听说,望不吝赐教。
> > 兄弟们赶快指点一下,我肯定有考虑不周甚至是错误的部分!- 隐藏被引用文字 -
>
> - 显示引用的文字 -

raullew

unread,
Jun 25, 2008, 10:16:12 PM6/25/08
to ttnn BI 观点
1。就是看看单变量数据分布或者相关性吧
2。描述信息对于建模无用,但可以直接拿来和模型结果结合使用
3。聚类需要这么做,分类不需要
4。Clementine会自动处理
5。feature selection这个node效果很差
6。two step效果不好,k-means还行
7。是不是lz笔误?

On 6月26日, 上午9时57分, 笨笨 <caozhen...@gmail.com> wrote:
> 1. 你做客户细分是要探查客户概况还是要发现各类群体(包括一些异常群体)?如果是探查概况,把所有客户里的异常客户剔除,可以用Anomaly,也
> 可以用各指标的Zscore来进行判断。如果是为了发现各类群体(包括异常群体),省略剔除异常的步骤
> 2. 你具体有哪些字段不太清楚,但根据经验,客户描述信息失真较为厉害,银行里的数据失真性也很强,其他行业就不用说了,因此聚类建模的输入字段中应
> 该尽量使用可信度高的字段,例如从身份证里提取性别、年龄、籍贯等等,以及由交易数据所派生出来的行为信息,例如前一个月交易次数,平均交易金额等
> 等。
> 3. 尽量别使用绝对值,而使用规范化处理之后的相对值
> 4. 尽量别使用离散型字段,因为有违聚类算法本意,实在需要使用,也应处理为哑元或者进行连续性指派
> 5. 看不明白你为什么要使用feature selection,Target Field是什么?大概是想筛选出信息含量高的字段吧?用
> Statistic节点对每一个字段做相关性分析就可以了。
> 6. 两步法用于第一点中的概况探查十分有效。除此以外,建议用K-means,因为可解释性强,运算时间短,你可以根据聚类结果所产生的类标签自行计
> 算每类的中心点和半径,甚至可以做到模型脱离Clementine环境。Kohonen没办法实现。
> 7.davidboudlin指标是指什么?第一次听说,望不吝赐教。
>
> On 6月26日, 上午7时53分, hunter <hunterd...@gmail.com> wrote:
>
>
>
> > 补充问题2
>
> > 聚类一般大家选几个群?还是 SOM或2步法直接聚?
> > 有没有用具体如davidboudlin等指标来测评并优化群数量的?
>
> > On Jun 25, 11:20 pm, hunter <hunterd...@gmail.com> wrote:
>
> > > 今天开始干活了,大致了解了项目组的想法(先探探路,决心很大,投入也不小了,已经作了2年的准备,数据仓库,系统整合等),理解了其客户购物流程,参
> > > 与了数据提取,参观了实体店,写了一些框架文档。有专人负责协助,很快还有新人加入,我被当作挖掘专家的身份对待(汗)
>
> > > 数据已经整合到一张表中,17M行数据,50多列,以交易id为主键,含交易信息,客户信息,款项,商品等信息,大致如下:
>
> > > 交易id 本次交易总额 商品id 商品码 单价 数量 客户id 客户类型 付款方式
>
> > > 我的计划,打算输出一些初步的数据质量报告,探索性的结果,看看反馈
> > > :
> > > 步骤1 用Clementin的data audit结点,检测异常值,评估数据质量,输出均值,最大,最小,离群点,扭曲度等
>
> > > 考虑: 增加几个标志位:高利润客户,高利润产品等,作为目标变量,这样可以看各个变量中这几个标志位的分布
>
> > > 问题1 还有其他的指标用于data metrics, data profiling等吗?
>
> > > 步骤2 建立产品与客户的关联,用Link Analysis,GRI,关联规则等,看看哪些东西的关联较大(有可能要先把数据集根据不同产品或不同类
> > > 别客户分类,在子集里算管理规则,这样支持度等选取更灵活,也减小运算量)
>
> > > 考虑:可能要添加客户分类,产品按特性分类等,可以得到有关这些类别的关联
>
> > > 步骤3 选取重要特征feature selection
>
> > > 步骤4 对客户聚类,对产品聚类,对聚类结果,用决策树,GRI等进行处理,看特征
>
> > > 步骤5 对目标变量(如高利润客户)用决策树处理,看特征
>
> > > 兄弟们赶快指点一下,我肯定有考虑不周甚至是错误的部分!- 隐藏被引用文字 -
>
> > - 显示引用的文字 -- 隐藏被引用文字 -
>
> - 显示引用的文字 -

笨笨

unread,
Jun 25, 2008, 10:53:19 PM6/25/08
to ttnn BI 观点
1. 你理解错了,不是指单变量,概况探查是指对整体中大至存在哪几类人进行分析,所以要剔除有异常的个别客户.并且用两步法就可以了.
3. 分类同样需要尽量使用相对值,占比、平均、趋势、斜率等等。试想,一个人月收入1000,消费800,另一个人月收入10000,消费2000,
哪个人的消费欲望更强?单单比较两个人的消费数额,往往会遗漏一些信息,使用消费能力 = 消费额/月收入是不是更加合理一些?尤其是银行和电信里的信
用评分,特别需要取相对值。
4. 连续性指派需要手工完成,Clementine无法自动处理。
5. 当进行分类建模时,如果候选字段上百上千,feature selection的效果就体现出来了。人工一个一个字段进行评估工作量太大了。
6. 两步聚类的原理还是基于k-means算法,不存在好还是不好的问题。关键看你用在什么样的聚类分析应用上。就比如第一点的整体群体概况探查。

raullew

unread,
Jun 26, 2008, 12:24:55 AM6/26/08
to ttnn BI 观点
1。lz的意思就是单变量探查。。。
3。那是派生变量了,与规范化不是一个事情
4。恩,同时,连续性指派需要数据的配合和一些技巧
5。可是clementine的feature selection的效果不好
6。恩,适合用作数据探索

笨笨

unread,
Jun 26, 2008, 1:13:21 AM6/26/08
to ttnn BI 观点
... 你别老点评我的好伐?? -_-

相对值 可能是派生出来的变量,也可能是规范化的结果。

效果不好的依据是什么?说来听听?

笨笨

unread,
Jun 26, 2008, 1:16:43 AM6/26/08
to ttnn BI 观点
给点有建设性的意见 行不? 别老是好啊差啊的 ~~~~

On 6月26日, 下午12时24分, raullew <raul...@hotmail.com> wrote:

raullew

unread,
Jun 26, 2008, 1:21:15 AM6/26/08
to ttnn BI 观点
我错了。。。

hunter

unread,
Jun 26, 2008, 2:03:54 AM6/26/08
to ttnn BI 观点
谢谢大家解答!


忘了说了,客户id有很多是缺失的,我打算用credit card或发货地址(如果是订货,非柜台交易)来推导一下

但是,怎么样能判断出哪些是常客呢???假设我只有3个月的交易表信息,又想知道哪些客户id买了5次以上

交易id 本次交易总额 商品id 商品码 单价 数量 客户id 客户类型 付款方式

SQL好像可以完成这个操作,Select count(CustomerID) , Distinct(CustomerID) from
Ttable

对吗?

或 group by?
> > - 显示引用的文字 -- Hide quoted text -
>
> - Show quoted text -

笨笨

unread,
Jun 26, 2008, 2:16:33 AM6/26/08
to ttnn BI 观点
Clementine aggregate节点
> > - Show quoted text -- 隐藏被引用文字 -
>
> - 显示引用的文字 -

hunter

unread,
Jun 26, 2008, 2:30:58 AM6/26/08
to ttnn BI 观点
多谢多谢,又有4个问题。

select count(cid), cid from ttable group by cid 可以达到找出frequent user的结果,
刚才试了。

问题1:"你做客户细分是要探查客户概况还是要发现各类群体",我两者都做,异常个体倒是不太在乎。除了聚类,以及有目标变量(是否VIP客户)时用
data audit, statistic或coorelation节点看相关度等信息之外,还有哪些办法?



附加问题1.从交易表倒推出一个客户表对我的挖掘有价值么?每行是该客户购买过的不同产品(产品类别)的统计信息

cid 产品类别1 类别1购买总数 类别2 类别2购买总数 这样子的结构



问题2什么是哑元?不参加距离计算吗?

我老觉得K-means会自己计算离散变量的距离,但没注意看具体方法,是因为它自动计算效果不好吗


>也应处理为哑元或者进行连续性指派


问题3 我的变量不到100个,但是偷懒想用feature selection.这么一说只能用statistics一个一个看咯?
》看不明白你为什么要使用feature selection,Target Field是什么?大概是想筛选出信息含量高的字段吧?用
Statistic节点对每一个字段做相关性分析就可以了

问题4 那交易金额需要规范化吗?是normalization?是说除以最大值,变为【0,1】之间的分布么?

尽量别使用绝对值,而使用规范化处理之后的相对值

那个什么david指标是以前看论文时看到的,就是评估各群间和群内距离是否理想的一个东西吧。曾经看过几篇希腊和中国的论文,对于选取几个群有一些不
错的尝试,有空一定发我写过的评论上来

On Jun 26, 5:21 am, raullew <raul...@hotmail.com> wrote:

raullew

unread,
Jun 26, 2008, 2:47:09 AM6/26/08
to ttnn BI 观点
问题1,不知道你想做什么,如果做聚类,应该是聚成类目1一个类,类目2一个类,类目3一个类这个样子的,我觉得从别的角度聚比较好
问题2,clementine会自动处理哑元,你看文档中kmeans算法
问题3,feature selection的区分度有误导,我一般让决策树自己跑,跑完了就自然区分出来了
问题4,正规化通常用zscore,kmeans会自动把min,max划分为[0,1],决策树不需要正规化
评估聚类我是用肉眼看的
> > - Show quoted text -- 隐藏被引用文字 -
>
> - 显示引用的文字 -

hunter

unread,
Jun 26, 2008, 2:54:29 AM6/26/08
to ttnn BI 观点
回答1没理解?类目1一个类?聚类的结果出来几个群内点距离近的,群间距离远的群(事先未知),是说这个吗?

2:哑元是什么?查了说是"定性变量",完全没概念?

hunter

unread,
Jun 26, 2008, 2:55:01 AM6/26/08
to ttnn BI 观点
"你想过这些挖掘的结果,且不论好坏,可以派什么用吗,这个问题最重要"(引用一位大侠问我的问题)

我觉得结果可以印证对方的一些业务猜测,或者给予他们一些启发。才好进一步收集数据(知道缺什么)或者改进现有的数据质量等。如果有有效规则(能发现高
价值客户的特征,或如何提高关联产品的销售),则可直接促销

audit/profiling等提供一些数据的大致分布情况吧(天,这个我真不熟,真是赶鸭子上架),到底有哪些方法啊,我就知道聚类和data
audit等统计指标,以及和目标变量的相关性。

我用高价值客户,做目标变量,合适吗?

On Jun 26, 6:47 am, raullew <raul...@hotmail.com> wrote:

hunter

unread,
Jun 26, 2008, 3:16:46 AM6/26/08
to ttnn BI 观点
又来一疑问!

每列交易信息都有交易总金额,如果我想分高中低3档(比如),最好的分法是怎么分呢?以前实验用过类似一刀切的手工方法,max-min/3,在哪就是
哪;也试过参考mean/medium和分布情况等,手工看看大概分几档,每档从多少钱到多少钱合适

有没有什么更科学或自动的方法?多谢!
> ...
>
> read more >>- Hide quoted text -

huwanli

unread,
Jun 26, 2008, 4:44:39 AM6/26/08
to tt...@googlegroups.com
以客户价值举例,若其为定性变量,且值有3个:高、中、低。
则处理成哑元后,客户价值变量会以2个(3-1=2)来表示。以Y1和Y2表示:
Y1 Y2
高 1 0
中 0 1
低 0 0

-----邮件原件-----
发件人: tt...@googlegroups.com [mailto:tt...@googlegroups.com] 代表 hunter
发送时间: 2008年6月26日 14:54
收件人: ttnn BI 观点
主题: Re: 客户数据挖掘项目纪实+问题请教

huwanli

unread,
Jun 26, 2008, 4:45:41 AM6/26/08
to tt...@googlegroups.com
Binning节点可以实现自动离散化。

-----邮件原件-----
发件人: tt...@googlegroups.com [mailto:tt...@googlegroups.com] 代表 hunter
发送时间: 2008年6月26日 15:17
收件人: ttnn BI 观点
主题: Re: 客户数据挖掘项目纪实+问题请教

又来一疑问!

每列交易信息都有交易总金额,如果我想分高中低3档(比如),最好的分法是怎么分
> > > 我老觉得K-means会自己计算离散变量的距离,但没注意看具体方法,是因为它自
动计算效果不好吗
>
> > > >也应处理为哑元或者进行连续性指派
>
> > > 问题3 我的变量不到100个,但是偷懒想用feature selection.这么一说只能用
statistics一个一个看咯?
> > > 》看不明白你为什么要使用feature selection,Target Field是什么?大概是
> > > > > > > > > 可以用各指标的Zscore来进行判断。如果是为了发现各类群体(包
括异常群体),省略剔除异常的步骤
> > > > > > > > > 2. 你具体有哪些字段不太清楚,但根据经验,客户描述信息失真
较为厉害,银行里的数据失真性也很强,其他行业就不用说了,因此聚类建模的输入字
段中应
> > > > > > > > > 该尽量使用可信度高的字段,例如从身份证里提取性别、年龄、籍
贯等等,以及由交易数据所派生出来的行为信息,例如前一个月交易次数,平均交易金
额等
> > > > > > > > > 等。
> > > > > > > > > 3. 尽量别使用绝对值,而使用规范化处理之后的相对值
> > > > > > > > > 4. 尽量别使用离散型字段,因为有违聚类算法本意,实在需要使
用,也应处理为哑元或者进行连续性指派
> > > > > > > > > 5. 看不明白你为什么要使用feature selection,Target Field是
什么?大概是想筛选出信息含量高的字段吧?用
> > > > > > > > > Statistic节点对每一个字段做相关性分析就可以了。
> > > > > > > > > 6. 两步法用于第一点中的概况探查十分有效。除此以外,建议用
K-means,因为可解释性强,运算时间短,你可以根据聚类结果所产生的类标签自行计
> > > > > > > > > 算每类的中心点和半径,甚至可以做到模型脱离Clementine环境。
Kohonen没办法实现。
> > > > > > > > > 7.davidboudlin指标是指什么?第一次听说,望不吝赐教。
>
> > > > > > > > > On 6月26日, 上午7时53分, hunter <hunterd...@gmail.com>
wrote:
>
> > > > > > > > > > 补充问题2
>
> > > > > > > > > > 聚类一般大家选几个群?还是 SOM或2步法直接聚?
> > > > > > > > > > 有没有用具体如davidboudlin等指标来测评并优化群数量的?
>
> > > > > > > > > > On Jun 25, 11:20 pm, hunter <hunterd...@gmail.com>
wrote:
>
> > > > > > > > > > > 今天开始干活了,大致了解了项目组的想法(先探探路,决心
很大,投入也不小了,已经作了2年的准备,数据仓库,系统整合等),理解了其客户
购物流程,参
> > > > > > > > > > > 与了数据提取,参观了实体店,写了一些框架文档。有专人负
责协助,很快还有新人加入,我被当作挖掘专家的身份对待(汗)
>
> > > > > > > > > > > 数据已经整合到一张表中,17M行数据,50多列,以交易id为
主键,含交易信息,客户信息,款项,商品等信息,大致如下:
>
> > > > > > > > > > > 交易id 本次交易总额 商品id 商品码 单价 数量 客户id
客户类型 付款方式
>
> > > > > > > > > > > 我的计划,打算输出一些初步的数据质量报告,探索性的结
果,看看反馈
> > > > > > > > > > > :
> > > > > > > > > > > 步骤1 用Clementin的data audit结点,检测异常值,评估数
据质量,输出均值,最大,最小,离群点,扭曲度等
>
> > > > > > > > > > > 考虑: 增加几个标志位:高利润客户,高利润产品等,作为
目标变量,这样可以看各个变量中这几个标志位的分布
>
> > > > > > > > > > > 问题1 还有其他的指标用于data metrics, data profiling等
吗?
>
> > > > > > > > > > > 步骤2 建立产品与客户的关联,用Link Analysis,GRI,关联
规则等,看看哪些东西的关联较大(有可能要先把数据集根据不同产品或不同类
> > > > > > > > > > > 别客户分类,在子集里算管理规则,这样支持度等选取更灵
活,也减小运算量)
>
> > > > > > > > > > > 考虑:可能要添加客户分类,产品按特性分类等,可以得到有

Isaac

unread,
Jun 26, 2008, 9:50:24 AM6/26/08
to ttnn BI 观点
1.按十分位数去分,每分段有相同的人数
2.按金额均分
2.按帕累托法,按金额从高到低排序,看累计金额的比例去分

笨笨

unread,
Jun 26, 2008, 11:13:07 AM6/26/08
to ttnn BI 观点
1。means节点 Matrix节点 都能探查变量之间的相关性 前者用于连续型字段 后者用于离散型字段
附加:
1。当然很有价值,行为信息嘛,非常重要,客户的行为不会存在欺骗性,但客户的描述信息往往有欺骗性,例如收入
2。哑元别人解释过了
3。聚类是无指导学习,所以用statistic节点探查输入字段之间的相关性,剔除高度相关的字段,100多个字段全放到算法里,结果的解释性差,也
可能出现共线性问题。Feature Selection 用于有指导的学习。
4。交易金额特别需要规范化,从交易金额本身来说,小到几元,大到几十万,跨度过大,且分布偏度较大,甚至不是正态。不适宜做聚类,从和其他字段关系来
说,例如年龄,年龄跨度0-100,金额跨度是其数十倍上百倍,显然也不合适同时放入聚类模型中

On 6月26日, 下午2时30分, hunter <hunterd...@gmail.com> wrote:
> > - Show quoted text -- 隐藏被引用文字 -
>
> - 显示引用的文字 -

hunter

unread,
Jun 26, 2008, 4:29:10 PM6/26/08
to ttnn BI 观点
不停流汗中。。谢谢几位热心回答。这可真是砖家一上阵就快穿帮了,亏得有大家相助。还得赶快学艺。

今天用的也是Binning来离散化一个购买频率,绝大多客户是个位数或十位数,有异常值(店长的授权卡)上百次那种。(似乎应该先删掉才对)。这回记
住哑元了,以前看几本书都提到聚类时做这样的变换,唉。

又一批问题:

1. 17000万行50列的交易表,怎么样做data auditing呢?我抽样(first 1000000行)先做了一个,全表的那个
audit结果还没出来,估计要那么20个小时吧!

补充问题: 这么大(别笑俺见识小)的数据量,怎么样才能进行任何的操作呢?不至于要我运行一个聚类等24小时吧?去除无关变量,导入另一个表并建索引
吗?还是随机抽样比如5%导入新表,在新表里先做全套挖掘(关联规则,聚类),好用了再尝试更大的数据?或者说吧数据summarize一下?

思路1:用filter节点,只留下CustomerID和商品种类。这样可能推关联规则会快一些。 那么商品种类要掌握在合并到多少个,才适合呢?最
上层的分类是30大种,然后120,然后4500,第四层是15万小类。我在哪一级的粒度上推GRI和Apriori会好一些呢? 4500种这级
吗?

问题2. 甲方的考虑是
1.想知道数据里面有什么,质量如何
2.已有数据能否回答这些问题:
优质客户特性何在?能否扩大对其销售?
什么客户群在增长?什么在消退?
按忠诚度给客户分类。
能否把不同产品的关联找出来,并且利用(market basket)。
找出哪些产品赚钱,哪些是物美价廉的(然后其中哪些能吸引赚钱产品、以及优质客户)
客户和品牌的价格敏感度分析。


思路:我对客户(把交易表聚集成客户+金额+购买数量表)进行聚类(),这样可以给每行都打上类别标签如$K-K-MEANSx,外加直观分类(比如高
中低购买额的3种客户 00 01 10)。这样客户的类别标签和商品类别标签都有了(利用merge节点),就可以做web plot图和GRI。看
哪些东西关联哪些东西。

傻问:对客户聚类的时候把商品信息过滤掉会不会好一些?
> ...
>
> read more >>- Hide quoted text -

raullew

unread,
Jun 26, 2008, 8:43:00 PM6/26/08
to ttnn BI 观点
数据挖掘=业务分析+SQL

笨笨

unread,
Jun 27, 2008, 12:40:17 AM6/27/08
to ttnn BI 观点
问题太散啦,一下不知道该回答哪个了-_-。。。

随机抽样 做局部建模可以的

我在想你为什么要对这么大的数据量建模,性能压力太大了,而且画图也很讨厌,性能压力太大。

filter是对数据处理性能优化的一种方式

至于产品分类的粒度级别,需要和客户沟通解决,你两眼一抹黑地在各个级别建模,挖掘结果很可能不是客户想要的。

对于第二个问题,再次强调,不到不得已,不要使用离散变量,即使非要使用,也要做哑元处理或者连续性指派。

比如,购买额你分成了高中低三类,其实直接把客户的购买额实际数字作为聚类输入就可以了阿(必要的话还要做标准化处理),不需要先切分成三段。

还有一点不太明白的是为什么始终想把客户和产品联系在一起?包括web plot 或者 关联规则建模

观察两者之间的关系的话,直接用客户购买产品的行为数据来做聚类分析就可以了阿。

至于客户提出的这些需求,绝对不是单单客户细分就能解决的问题。

楼主,我觉得你要考虑下把控项目的范围了。
> ...
>
> 阅读更多 >>- 隐藏被引用文字 -
>
> - 显示引用的文字 -

Qing

unread,
Jun 27, 2008, 2:22:03 AM6/27/08
to tt...@googlegroups.com
我来针对hunter的第二个问题谈谈想法。
 
其中的第一小问,客户是很容易问出来的,我觉得重点是在后半部分,"质量"二字,他们可能担心从垃圾里面分析出来的也是垃圾,所以想知道这些数据能不能说明问题。如果,如果在做外数据剖析之后,基本上应该能够回答了吧。哪些变量是可疑的,哪些是根本就不靠谱的。
 
第二小问。如果这是客户的原话(很像是原话),表明他们希望对自己的顾客想更多的认识,凭自己的业务感觉,已经形成了几个群体:优质、劣质,以及忠诚情况,要回答这些问题,通过技术化的分群聚类是回答不了的。首先还是要对这些假设进行一些"猜测",比如优质的客户,可能具备什么特性?比如是购买频次越高的越好,收入越高的越好,喜欢高档产品的,好...这得问问客户,他们觉得什么叫做"优质"。而对于扩大其销售,如果仅仅从技术上来看,可以是基于产品关联分析的交叉销售——他还有什么没买得,跟他类似的人买了,就可以向他推荐。
 
至于客户群的增长和消退,在群体还没有分出来之前,没意义。群体出来了,但如果群体并没有得到业务上的认可,谈增长和消退也没意义。倒是如果你跟他说优质客户群体在缩小,劣质的扩大,这还真的能够让他感到紧张。因为对优质、劣质的群体划分肯定要比分群的结果简单,更加能够被理解。
 
简单地说"按忠诚度"来给客户分类,说起来简单,可麻烦着呢。但客户也许觉得这并不麻烦,因为他们本身确实没有太高的期望。对于忠诚度一词,也许只是我们自己理解的一个变量——光顾的时长。越长的越忠诚,于是,如果你能获得这个信息的话,可以做个分布就能大体地切分成几类。很忠诚的,七年前就过来买东西了,较忠诚的,五年前就来了...这当然不够严谨,但可能正是客户想要的。(这是我的猜测,究竟客户想要什么,有多高期望,得进一步了解)
后面那个所谓的"价格敏感度"分析,听起来像个虚词,还是要转换成比较通俗的,大家理解起来没什么太大异议的。仅仅从字面意思,可能是"顾客比较在乎价格,不买高价东西。"也可能是,"顾客对价格变动比较关注,一降价,他就买。"将那些虚头八脑的词通俗表达,是易于沟通的。
 

 
2008/6/27 hunter <hunte...@gmail.com>:
...问题2. 甲方的考虑是

1.想知道数据里面有什么,质量如何
2.已有数据能否回答这些问题:
优质客户特性何在?能否扩大对其销售?
什么客户群在增长?什么在消退?
按忠诚度给客户分类。
能否把不同产品的关联找出来,并且利用(market basket)。
找出哪些产品赚钱,哪些是物美价廉的(然后其中哪些能吸引赚钱产品、以及优质客户)
客户和品牌的价格敏感度分析。
....
Message has been deleted

Mr.Somebody

unread,
Jun 28, 2008, 9:01:12 AM6/28/08
to ttnn BI 观点
强烈同意Qing的看法,我再补充几点。

想知道优质客户特性何在,首先需要定义优质客户,然后根据客户特性对数据进行分析。从数据分析的角度上看,那些客户ID缺失的数据就必然要被除掉,因为
那些没有ID的客户你没有他们的客户特性信息,你不知道他们的年龄,收入,职业等等。那做出来的结果必定是基于有客户ID的会员数据上。对会员分析的结
果最好能应用在针对会员的promotion上。当然,也可以用这个结果去推导整个顾客群的习惯,但是策略要慎之又慎。

客户和品牌的价格敏感度分析。
这似乎是经典的价格-需求分析。做个模型弄个系数出来告诉你价格上涨1%需求下降3%,这就是价格弹性(price elasticity)。模型还要
考虑竞争品牌的价格和其他相关产品的价格等等。但是商场那么多产品线,你要做那几条?项目要进行多长时间?有足够的时间去做么?甲方提这么多问题每一个
都可能是几个星期的工作量。要控制好。

店长的记录是outlier,可以去掉。

On 27 Jun, 07:22, Qing <happys...@gmail.com> wrote:
> 我来针对hunter的第二个问题谈谈想法。
>
> 其中的第一小问,客户是很容易问出来的,我觉得重点是在后半部分,"质量"二字,他们可能担心从垃圾里面分析出来的也是垃圾,所以想知道这些数据能不能说明问题。如果,如果在做外数据剖析之后,基本上应该能够回答了吧。哪些变量是可疑的,哪些是根本就不靠谱的。
>
> 第二小问。如果这是客户的原话(很像是原话),表明他们希望对自己的顾客想更多的认识,凭自己的业务感觉,已经形成了几个群体:优质、劣质,以及忠诚情况,要回答这些问题,通过技术化的分群聚类是回答不了的。首先还是要对这些假设进行一些"猜测",比如优质的客户,可能具备什么特性?比如是购买频次越高的越好,收入越高的越好,喜欢高档产品的,好...这得问问客户,他们觉得什么叫做"优质"。而对于扩大其销售,如果仅仅从技术上来看,可以是基于产品关联分析的交叉销售——他还有什么没买得,跟他类似的人买了,就可以向他推荐。
>
> 至于客户群的增长和消退,在群体还没有分出来之前,没意义。群体出来了,但如果群体并没有得到业务上的认可,谈增长和消退也没意义。倒是如果你跟他说优质客户群体在缩小,劣质的扩大,这还真的能够让他感到紧张。因为对优质、劣质的群体划分肯定要比分群的结果简单,更加能够被理解。
>
> 简单地说"按忠诚度"来给客户分类,说起来简单,可麻烦着呢。但客户也许觉得这并不麻烦,因为他们本身确实没有太高的期望。对于忠诚度一词,也许只是我们自己理解的一个变量——光顾的时长。越长的越忠诚,于是,如果你能获得这个信息的话,可以做个分布就能大体地切分成几类。很忠诚的,七年前就过来买东西了,较忠诚的,五年前就来了...这当然不够严谨,但可能正是客户想要的。(这是我的猜测,究竟客户想要什么,有多高期望,得进一步了解)
> 后面那个所谓的"价格敏感度"分析,听起来像个虚词,还是要转换成比较通俗的,大家理解起来没什么太大异议的。仅仅从字面意思,可能是"顾客比较在乎价格,不买高价东西。"也可能是,"顾客对价格变动比较关注,一降价,他就买。"将那些虚头八脑的词通俗表达,是易于沟通的。
>
> 2008/6/27 hunter <hunterd...@gmail.com>:

Mr.Somebody

unread,
Jun 28, 2008, 9:09:31 AM6/28/08
to ttnn BI 观点
题外话,我想知道clementine是那超市提供的么?印象中clementine在uk没有卖出去多少个copy。。。

提醒一下楼主不要用盗版软件做商业应用,很有可能引起商业纠纷的说。

raullew

unread,
Jun 28, 2008, 11:36:15 AM6/28/08
to ttnn BI 观点
好奇地问问,有人用weka做商业项目吗?这个软件效果如何

On Jun 28, 9:09 pm, "Mr.Somebody" <Mr.Someb...@gmail.com> wrote:
> 题外话,我想知道clementine是那超市提供的么?印象中clementine在uk没有卖出去多少个copy。。。
>
> 提醒一下楼主不要用盗版软件做商业应用,很有可能引起商业纠纷的说。
>
> On 28 Jun, 14:01, "Mr.Somebody" <Mr.Someb...@gmail.com> wrote:
>
>
>
> > 强烈同意Qing的看法,我再补充几点。
>
> > 想知道优质客户特性何在,首先需要定义优质客户,然后根据客户特性对数据进行分析。从数据分析的角度上看,那些客户ID缺失的数据就必然要被除掉,因为
> > 那些没有ID的客户你没有他们的客户特性信息,你不知道他们的年龄,收入,职业等等。那做出来的结果必定是基于有客户ID的会员数据上。对会员分析的结
> > 果最好能应用在针对会员的promotion上。当然,也可以用这个结果去推导整个顾客群的习惯,但是策略要慎之又慎。
>
> > 客户和品牌的价格敏感度分析。
> > 这似乎是经典的价格-需求分析。做个模型弄个系数出来告诉你价格上涨1%需求下降3%,这就是价格弹性(price elasticity)。模型还要
> > 考虑竞争品牌的价格和其他相关产品的价格等等。但是商场那么多产品线,你要做那几条?项目要进行多长时间?有足够的时间去做么?甲方提这么多问题每一个
> > 都可能是几个星期的工作量。要控制好。
>
> > 店长的记录是outlier,可以去掉。
>
> > On 27 Jun, 07:22, Qing <happys...@gmail.com> wrote:
>
> > > 我来针对hunter的第二个问题谈谈想法。
>
> > > 其中的第一小问,客户是很容易问出来的,我觉得重点是在后半部分,"质量"二字,他们可能担心从垃圾里面分析出来的也是垃圾,所以想知道这些数据能不能说明问题-。如果,如果在做外数据剖析之后,基本上应该能够回答了吧。哪些变量是可疑的,哪些是根本就不靠谱的。
>
> > > 第二小问。如果这是客户的原话(很像是原话),表明他们希望对自己的顾客想更多的认识,凭自己的业务感觉,已经形成了几个群体:优质、劣质,以及忠诚情况,要回-答这些问题,通过技术化的分群聚类是回答不了的。首先还是要对这些假设进行一些"猜测",比如优质的客户,可能具备什么特性?比如是购买频次越高的越好,收入越-高的越好,喜欢高档产品的,好...这得问问客户,他们觉得什么叫做"优质"。而对于扩大其销售,如果仅仅从技术上来看,可以是基于产品关联分析的交叉销售-----他还有什么没买得,跟他类似的人买了,就可以向他推荐。
>
> > > 至于客户群的增长和消退,在群体还没有分出来之前,没意义。群体出来了,但如果群体并没有得到业务上的认可,谈增长和消退也没意义。倒是如果你跟他说优质客户群-体在缩小,劣质的扩大,这还真的能够让他感到紧张。因为对优质、劣质的群体划分肯定要比分群的结果简单,更加能够被理解。
>
> > > 简单地说"按忠诚度"来给客户分类,说起来简单,可麻烦着呢。但客户也许觉得这并不麻烦,因为他们本身确实没有太高的期望。对于忠诚度一词,也许只是我们自己理-解的一个变量----光顾的时长。越长的越忠诚,于是,如果你能获得这个信息的话,可以做个分布就能大体地切分成几类。很忠诚的,七年前就过来买东西了,较忠诚的,-五年前就来了...这当然不够严谨,但可能正是客户想要的。(这是我的猜测,究竟客户想要什么,有多高期望,得进一步了解)
> > > 后面那个所谓的"价格敏感度"分析,听起来像个虚词,还是要转换成比较通俗的,大家理解起来没什么太大异议的。仅仅从字面意思,可能是"顾客比较在乎价格,不买-高价东西。"也可能是,"顾客对价格变动比较关注,一降价,他就买。"将那些虚头八脑的词通俗表达,是易于沟通的。
>
> > > 2008/6/27 hunter <hunterd...@gmail.com>:
>
> > > > ...问题2. 甲方的考虑是
> > > > 1.想知道数据里面有什么,质量如何
> > > > 2.已有数据能否回答这些问题:
> > > > 优质客户特性何在?能否扩大对其销售?
> > > > 什么客户群在增长?什么在消退?
> > > > 按忠诚度给客户分类。
> > > > 能否把不同产品的关联找出来,并且利用(market basket)。
> > > > 找出哪些产品赚钱,哪些是物美价廉的(然后其中哪些能吸引赚钱产品、以及优质客户)
> > > > 客户和品牌的价格敏感度分析。
> > > > ....- Hide quoted text -

hunter

unread,
Jun 28, 2008, 5:43:30 PM6/28/08
to ttnn BI 观点
呵呵,是他们提供的。看了是正版,不过估计即使是盗版的,我只是受雇在项目里使用他们买的这玩意,应该也没我啥事,没准还能从版权部门拿点告密提成。多
谢提醒了,版权意识确实很重要,能避免很多麻烦。

看来最省钱的办法就是雇学生了,很多学校都有正版的SAS/Clem等。

hunter

unread,
Jun 29, 2008, 2:21:53 AM6/29/08
to ttnn BI 观点
正在出报告ing,包含单变量分布描述,极值/离群点,在此基础上哪些变量可以去除,哪些极值需要调查或处理,可能还要加上变量间两两
correlation。



On Jun 27, 11:19 pm, hunter <hunterd...@gmail.com> wrote:
> 本周小结
>
> 我起初的计划,是先输出一些初步的数据质量报告,探索性的结果,看看反馈。
>
> 实际几天下来,在等待Audit节点对全表的统计完成前,做了局部探索,建立了可以用于下一步工作的stream,含一些数据转换,去异常值,衍生变量
> 及合并等,对局部数据出了几个模型以了解数据特性。 目前能识别出来的客户都是有卡的,现金客户无法识别(客户id空)。
>
> 用Clementin的data audit结点,可以检测异常值,评估数据质量,输出均值,最大,最小,离群点,扭曲度等。但是我找不到有关的详细文
> 档做参考,比如对具体的交易频次,我看它是非正态,多数人是2-3次,一些人10次上下,个别人(其实是店长用的促销打折卡)高达几百次。这种情况下有
> 必要做变换吗?店长名下的购物记录需要作为 outlier/extreme value去掉吗?还是用capp或用均值,中值替换法?
>
> 在数据探索阶段,到底要什么格式的数据质量,内容报告?呵呵,本周最后一问,兄弟们周末愉快

笨笨

unread,
Jun 29, 2008, 4:15:27 AM6/29/08
to ttnn BI 观点
对Mr Somebody的分析主题"客户和品牌的价格敏感度分析"十分感兴趣,能说得具体些么?
这个模型是怎么来做的?会用到些什么技术?

On 6月28日, 下午9时01分, "Mr.Somebody" <Mr.Someb...@gmail.com> wrote:
> 强烈同意Qing的看法,我再补充几点。
>
> 想知道优质客户特性何在,首先需要定义优质客户,然后根据客户特性对数据进行分析。从数据分析的角度上看,那些客户ID缺失的数据就必然要被除掉,因为
> 那些没有ID的客户你没有他们的客户特性信息,你不知道他们的年龄,收入,职业等等。那做出来的结果必定是基于有客户ID的会员数据上。对会员分析的结
> 果最好能应用在针对会员的promotion上。当然,也可以用这个结果去推导整个顾客群的习惯,但是策略要慎之又慎。
>
> 客户和品牌的价格敏感度分析。
> 这似乎是经典的价格-需求分析。做个模型弄个系数出来告诉你价格上涨1%需求下降3%,这就是价格弹性(price elasticity)。模型还要
> 考虑竞争品牌的价格和其他相关产品的价格等等。但是商场那么多产品线,你要做那几条?项目要进行多长时间?有足够的时间去做么?甲方提这么多问题每一个
> 都可能是几个星期的工作量。要控制好。
>
> 店长的记录是outlier,可以去掉。
>
> On 27 Jun, 07:22, Qing <happys...@gmail.com> wrote:
>
>
>
> > 我来针对hunter的第二个问题谈谈想法。
>
> > 其中的第一小问,客户是很容易问出来的,我觉得重点是在后半部分,"质量"二字,他们可能担心从垃圾里面分析出来的也是垃圾,所以想知道这些数据能不能说明问题-。如果,如果在做外数据剖析之后,基本上应该能够回答了吧。哪些变量是可疑的,哪些是根本就不靠谱的。
>
> > 第二小问。如果这是客户的原话(很像是原话),表明他们希望对自己的顾客想更多的认识,凭自己的业务感觉,已经形成了几个群体:优质、劣质,以及忠诚情况,要回-答这些问题,通过技术化的分群聚类是回答不了的。首先还是要对这些假设进行一些"猜测",比如优质的客户,可能具备什么特性?比如是购买频次越高的越好,收入越-高的越好,喜欢高档产品的,好...这得问问客户,他们觉得什么叫做"优质"。而对于扩大其销售,如果仅仅从技术上来看,可以是基于产品关联分析的交叉销售-----他还有什么没买得,跟他类似的人买了,就可以向他推荐。
>
> > 至于客户群的增长和消退,在群体还没有分出来之前,没意义。群体出来了,但如果群体并没有得到业务上的认可,谈增长和消退也没意义。倒是如果你跟他说优质客户群-体在缩小,劣质的扩大,这还真的能够让他感到紧张。因为对优质、劣质的群体划分肯定要比分群的结果简单,更加能够被理解。
>
> > 简单地说"按忠诚度"来给客户分类,说起来简单,可麻烦着呢。但客户也许觉得这并不麻烦,因为他们本身确实没有太高的期望。对于忠诚度一词,也许只是我们自己理-解的一个变量----光顾的时长。越长的越忠诚,于是,如果你能获得这个信息的话,可以做个分布就能大体地切分成几类。很忠诚的,七年前就过来买东西了,较忠诚的,-五年前就来了...这当然不够严谨,但可能正是客户想要的。(这是我的猜测,究竟客户想要什么,有多高期望,得进一步了解)
> > 后面那个所谓的"价格敏感度"分析,听起来像个虚词,还是要转换成比较通俗的,大家理解起来没什么太大异议的。仅仅从字面意思,可能是"顾客比较在乎价格,不买-高价东西。"也可能是,"顾客对价格变动比较关注,一降价,他就买。"将那些虚头八脑的词通俗表达,是易于沟通的。
>
> > 2008/6/27 hunter <hunterd...@gmail.com>:
>
> > > ...问题2. 甲方的考虑是
> > > 1.想知道数据里面有什么,质量如何
> > > 2.已有数据能否回答这些问题:
> > > 优质客户特性何在?能否扩大对其销售?
> > > 什么客户群在增长?什么在消退?
> > > 按忠诚度给客户分类。
> > > 能否把不同产品的关联找出来,并且利用(market basket)。
> > > 找出哪些产品赚钱,哪些是物美价廉的(然后其中哪些能吸引赚钱产品、以及优质客户)
> > > 客户和品牌的价格敏感度分析。
> > > ....- 隐藏被引用文字 -
>
> - 显示引用的文字 -

raullew

unread,
Jun 29, 2008, 4:47:17 AM6/29/08
to ttnn BI 观点
微经和博弈论的经典命题,转化为求解微积分
然而我没有能力现实化她...pricing部门是需要的

On 6月29日, 下午4时15分, 笨笨 <caozhen...@gmail.com> wrote:
> 对Mr Somebody的分析主题"客户和品牌的价格敏感度分析"十分感兴趣,能说得具体些么?
> 这个模型是怎么来做的?会用到些什么技术?
>
> On 6月28日, 下午9时01分, "Mr.Somebody" <Mr.Someb...@gmail.com> wrote:
>
>
>
> > 强烈同意Qing的看法,我再补充几点。
>
> > 想知道优质客户特性何在,首先需要定义优质客户,然后根据客户特性对数据进行分析。从数据分析的角度上看,那些客户ID缺失的数据就必然要被除掉,因为
> > 那些没有ID的客户你没有他们的客户特性信息,你不知道他们的年龄,收入,职业等等。那做出来的结果必定是基于有客户ID的会员数据上。对会员分析的结
> > 果最好能应用在针对会员的promotion上。当然,也可以用这个结果去推导整个顾客群的习惯,但是策略要慎之又慎。
>
> > 客户和品牌的价格敏感度分析。
> > 这似乎是经典的价格-需求分析。做个模型弄个系数出来告诉你价格上涨1%需求下降3%,这就是价格弹性(price elasticity)。模型还要
> > 考虑竞争品牌的价格和其他相关产品的价格等等。但是商场那么多产品线,你要做那几条?项目要进行多长时间?有足够的时间去做么?甲方提这么多问题每一个
> > 都可能是几个星期的工作量。要控制好。
>
> > 店长的记录是outlier,可以去掉。
>
> > On 27 Jun, 07:22, Qing <happys...@gmail.com> wrote:
>
> > > 我来针对hunter的第二个问题谈谈想法。
>
> > > 其中的第一小问,客户是很容易问出来的,我觉得重点是在后半部分,"质量"二字,他们可能担心从垃圾里面分析出来的也是垃圾,所以想知道这些数据能不能说明问题--。如果,如果在做外数据剖析之后,基本上应该能够回答了吧。哪些变量是可疑的,哪些是根本就不靠谱的。
>
> > > 第二小问。如果这是客户的原话(很像是原话),表明他们希望对自己的顾客想更多的认识,凭自己的业务感觉,已经形成了几个群体:优质、劣质,以及忠诚情况,要回--答这些问题,通过技术化的分群聚类是回答不了的。首先还是要对这些假设进行一些"猜测",比如优质的客户,可能具备什么特性?比如是购买频次越高的越好,收入-越-高的越好,喜欢高档产品的,好...这得问问客户,他们觉得什么叫做"优质"。而对于扩大其销售,如果仅仅从技术上来看,可以是基于产品关联分析的交叉销售------他还有什么没买得,跟他类似的人买了,就可以向他推荐。
>
> > > 至于客户群的增长和消退,在群体还没有分出来之前,没意义。群体出来了,但如果群体并没有得到业务上的认可,谈增长和消退也没意义。倒是如果你跟他说优质客户群--体在缩小,劣质的扩大,这还真的能够让他感到紧张。因为对优质、劣质的群体划分肯定要比分群的结果简单,更加能够被理解。
>
> > > 简单地说"按忠诚度"来给客户分类,说起来简单,可麻烦着呢。但客户也许觉得这并不麻烦,因为他们本身确实没有太高的期望。对于忠诚度一词,也许只是我们自己理--解的一个变量----光顾的时长。越长的越忠诚,于是,如果你能获得这个信息的话,可以做个分布就能大体地切分成几类。很忠诚的,七年前就过来买东西了,较忠-诚的,-五年前就来了...这当然不够严谨,但可能正是客户想要的。(这是我的猜测,究竟客户想要什么,有多高期望,得进一步了解)
> > > 后面那个所谓的"价格敏感度"分析,听起来像个虚词,还是要转换成比较通俗的,大家理解起来没什么太大异议的。仅仅从字面意思,可能是"顾客比较在乎价格,不买--高价东西。"也可能是,"顾客对价格变动比较关注,一降价,他就买。"将那些虚头八脑的词通俗表达,是易于沟通的。
>
> > > 2008/6/27 hunter <hunterd...@gmail.com>:
>
> > > > ...问题2. 甲方的考虑是
> > > > 1.想知道数据里面有什么,质量如何
> > > > 2.已有数据能否回答这些问题:
> > > > 优质客户特性何在?能否扩大对其销售?
> > > > 什么客户群在增长?什么在消退?
> > > > 按忠诚度给客户分类。
> > > > 能否把不同产品的关联找出来,并且利用(market basket)。
> > > > 找出哪些产品赚钱,哪些是物美价廉的(然后其中哪些能吸引赚钱产品、以及优质客户)
> > > > 客户和品牌的价格敏感度分析。
> > > > ....- 隐藏被引用文字 -
>
> > - 显示引用的文字 -- 隐藏被引用文字 -
>
> - 显示引用的文字 -

Qing

unread,
Jul 1, 2008, 1:17:40 AM7/1/08
to tt...@googlegroups.com
我也十分感兴趣这个"敏感度"分析的话题。
 
最近我们有个项目可能是研究这个问题,不过还是可能,因为我现在还没弄明白客户到底要什么,有时候这真的很难判断。我以为是研究收入、话务跟价格之间的关系,回答一个问题——为什么话务增长不能带来收入增长?正如上面所说的,价格变动多少导致收入变动多少,导致话务变动多少。
 
不过在电信行业里面,价格不太好衡量,不想零售行业那样的明码标价,不同类型的话务还不同的价,长途一个价、漫游一个价,有时候又打了个包不区分这些话务。而且,我不知道在这里是否可以抽象成为价格敏感度问题。
 
而且,感觉价格敏感度是一种比较宏观层面的分析。针对上面的问题,最后的结论可能是"价格下降的程度并不能带动话务爆发增长,所以价格下降导致的收入差距弥补不了量增加带来的收入。"如果是这种回答,其实是废话,也许客户会继续抛出另一个问题,那么究竟价格在什么位置水平,可以将话务量刺激到一定程度,正好达到收入的平衡点呢?用价格敏感度可能可以回答,如果价格定在一毛三,可以刺激话务30%的增长。这时,收入正好平衡。这个答案倒是很有帮助意义的。不过也有另一种可能,就是根本无解,不存在这个平衡点。再从宏观分析,语音收入是否已经到了穷途末路?是否根本不可能用提升语音话务的方式来提升收入?这些问题很多人猜测,但是没人敢肯定地说确实如此。但如果确实如此,恐怕那个平衡点是找不到的。
 
客户真的是想找到这个平衡点?我不敢确定。如果之后的决策行动跟这个平衡点没有关系,那么从一开始的问题就定义错了。

2008/6/29 笨笨 <caozh...@gmail.com>:
对Mr Somebody的分析主题"客户和品牌的价格敏感度分析"十分感兴趣,能说得具体些么?
这个模型是怎么来做的?会用到些什么技术?
...

raullew

unread,
Jul 1, 2008, 1:49:29 AM7/1/08
to ttnn BI 观点
市场有一条价格-产量曲线
公司有一条产量-收益曲线
对手有一条产量-收益曲线
根据不同市场地位和博弈阶段的博弈模型求解纳什均衡,得到最优产量

On 7月1日, 下午1时17分, Qing <happys...@gmail.com> wrote:
> 我也十分感兴趣这个"敏感度"分析的话题。
>
> 最近我们有个项目可能是研究这个问题,不过还是可能,因为我现在还没弄明白客户到底要什么,有时候这真的很难判断。我以为是研究收入、话务跟价格之间的关系,回-答一个问题----为什么话务增长不能带来收入增长?正如上面所说的,价格变动多少导致收入变动多少,导致话务变动多少。
>
> 不过在电信行业里面,价格不太好衡量,不想零售行业那样的明码标价,不同类型的话务还不同的价,长途一个价、漫游一个价,有时候又打了个包不区分这些话务。而且-,我不知道在这里是否可以抽象成为价格敏感度问题。
>
> 而且,感觉价格敏感度是一种比较宏观层面的分析。针对上面的问题,最后的结论可能是"价格下降的程度并不能带动话务爆发增长,所以价格下降导致的收入差距弥补不-了量增加带来的收入。"如果是这种回答,其实是废话,也许客户会继续抛出另一个问题,那么究竟价格在什么位置水平,可以将话务量刺激到一定程度,正好达到收入的-平衡点呢?用价格敏感度可能可以回答,如果价格定在一毛三,可以刺激话务30%的增长。这时,收入正好平衡。这个答案倒是很有帮助意义的。不过也有另一种可能,-就是根本无解,不存在这个平衡点。再从宏观分析,语音收入是否已经到了穷途末路?是否根本不可能用提升语音话务的方式来提升收入?这些问题很多人猜测,但是没人-敢肯定地说确实如此。但如果确实如此,恐怕那个平衡点是找不到的。
>
> 客户真的是想找到这个平衡点?我不敢确定。如果之后的决策行动跟这个平衡点没有关系,那么从一开始的问题就定义错了。
>
> 2008/6/29 笨笨 <caozhen...@gmail.com>:
>
>
>
> > 对Mr Somebody的分析主题"客户和品牌的价格敏感度分析"十分感兴趣,能说得具体些么?
> > 这个模型是怎么来做的?会用到些什么技术?
Reply all
Reply to author
Forward
0 new messages