分析的四种类型

50 views
Skip to first unread message

Q

unread,
Dec 5, 2011, 9:21:43 PM12/5/11
to ttnn
从那天delin给ttnn绘制的一副论坛帖子趋势图,我突然想到点什么。先发现了一些论坛的变化。而从这个发现,触发我对分析套路的思考。

我一直相信分析问题是有套路的,分析问题的类型、不同类型的分析方法、不同的结论表达形式,都可以串联一起,如果能够形成套路,就可形成工具,让我们平常的业务分析可以快速深入。

显然,delin的趋势图让我看到了变化,这也就是一种分析,可以叫这类分析为“诊断型“。

Delin对这个图的解读反应出一种诊断——”0809达到巅峰、10、11稍有下滑。“这种诊断反应出一种变化。变化,即突破了人们常规的认识,认为事情在平稳而有规律的发展。但通过数据,反映出事实并非如此,在发生某种不符合预期的变化,或者叫做“异常”。而诊断型分析,更主要是发现“异”。显然,诊断型分析的周期应当短促,每月、每周、每天,甚至实时。

异,刚才那个例子可以表明了。发现在时间上的一些不合预期的变化,这里,预期其实就是我们心中的“常”,他们之间产生了差异,于是对人产生警醒,引起注意。

而,常。也并非总是一目了然。这个“常”是事先存在的(但未必是准确的,人的经验判断可能并不准确,数据反映更准确)。上面例子里,我们可能不假思索地认为趋势是平稳规律的,但未必。从数据中发现那种“常”,也是诊断型分析的一部分,发现数据的变化规律。比如一个月里面充值缴费的的周期性规律,这可以作为“常”而存在。显然,这种规律并非总是周期性分析,只是如果要做诊断型分析,需要这种“常”作为一种常识存在,作为一种背景。

由此,可以引出另一种分析,称作“陈述型”分析吧。它就是要陈述这类常态、规律性的东西,作为后续分析的背景。陈述性分析周期可相对常,季度、月,或者不定期。

诊断型分析发现了异于常态的变化,需要深入对这个变化找出原因。这个分析可以通过经验判断,比如delin在帖子里提出了两个原因:一个是行业和从业发展的原因,一个是用户职业变迁的原因。这是经验分析,当然也是受数据所限。而如果有充足的数据,可以用数据来探索异常的原因,为什么会发生那种变化?那么,这类分析可以称作“求证型”分析。这类分析也许还包括丰富的细类,比如为了求证,可以是求关联,或者是求因果的。但不管如何,先统称为求证型。

而最终,还需要一种对未来的预期分析。Delin也在趋势图上描绘出几个上扬的红点,很乐观地预期12年将引来爆发。这类分析是为了告诉别人未来会发生什么样的变化。预测分析,或者what-if分析都是这类,可叫作“预期型“分析。

再回顾一下,分析的类型可以分成四类:
1、陈述型分析:陈述现状和规律常识;
2、诊断型分析:发现异于规律常识的变化(一般都是时间上的);
3、求证型分析:挖掘导致那种变化的原因,或关联因素;
4、预期型分析:预期未来的变化,不同影响因素下的变化;

在一个完整的分析里,也许这四类分析都包括,只不过未必显性化而已。可以用一段一百字的文字完成一次分析,也可能包括这四类分析。而如果用一篇长达100页的分析报告,充斥大量数据和模型结论,其实也是这四类分析。

对于每类分析的方法和表现形式,仍需继续思考。如果大家觉得这四类不全,或者有定义不清者,请切我的嫩鸡,欢迎来切。

下载.jpeg

把余咏

unread,
Dec 6, 2011, 4:24:01 AM12/6/11
to ttnn
我们都知道提出问题、分析问题、解决问题,也都知道其实能够发现问题也是一件不容易的事情。说“问题”是跟心理的“预期”不一样,才是问题,这个“预期”的产生就需要有一定的经验、观察、学习、想象等过程形成。就像Q的诊断型分析,我们得先有对一个事情的描述(陈述),才能跟“预期”对比,并进而“求证”。
 
但“求证”似乎也严重依赖个体因素,包括知识、经验、背景、信息完整等组成了“求证”的几个支撑因素,。前两天看新闻说中国学生参加美国SAT考试,对判断论述文的表现普遍较差(命题好像是学校是否应该教授道德和伦理),分析认为是中国学生缺乏判断力。
 
而在Delin的描述中也提到“乐观预期12年引来爆发”,这里也是个假设前提。我们一般在分析问题后,会提出解决办法,此时的“预期性分析”的结果就依赖这个解决办法的成功执行;也有可能解决办法是不可操作的,问题自然发展,也许“预期”就是另外一种状况了。
 

bayy
 
发件人: Q
发送时间: 2011-12-06 10:21
收件人: ttnn
主题: 分析的四种类型

Q

unread,
Dec 6, 2011, 10:01:14 PM12/6/11
to tt...@googlegroups.com
提出这四类分析的目的是想盖一个帽子——任何分析先都逃不脱这四类。

然后,还需要细化每类的细类、方法和表现形式。但这大概还是更难的。

比如,陈述型分析。是要陈述现状和规律。那分析报告中常见的一种TopN分析来看,其实可以发现多半带有陈述型和诊断型的特征。比如”分公司利润排名Top3“,如果是首次分析,可能只是列出前三名ABC,告知读者这三个分公司业绩领先,大家脑海里也许有个印象,会凭感觉有个自己的排名,如果不一样,会琢磨了,哎,为什么B公司竟然排到第二了?而如果是后续的周期性分析,排名前三可能比较固定,这时候分析很可能加入一个排名的变化,D公司这个月排第一了。这就演变成诊断型分析。

诊断型分析一般使用可视化分析方法。因为诊断必须直观,避免用复杂的分析技巧。大多都是反映在时间上、区域上的指标变化。曲线图、雷达图、排名图、散点图、区域热图可能更好地表达诊断结果。

求证型的方法很多了,可以是人工经验判断,可以是数据分析,比如关联分析,可以找出关联性因素。因果分析能够找到更严格的因果因素。估计还能细分很多。

预期型。我能想到的就是两种,一种就是自然预期,比如通过时间序列分析,或者加入一些季节性因素去预测未来的数值变化。这种方法是一种宏观分析,假设总体变动一定符合某种规律。另一种是影响预期,可以说是微观分析。当一个刺激因素改变以后,将导致结果发生什么变化?也就是what-if分析,通过这种分析,可以帮助决策者选择行动策略。

2011/12/6 把余咏 <bayuy...@hotmail.com>



--
ttnn
telno: 13514984944

Q

unread,
Dec 7, 2011, 10:10:48 PM12/7/11
to tt...@googlegroups.com
如果我们要做一个分析,要做一份分析报告,可以尝试用这四类分析来整理思路。

当然,未必这四类都同时出现在一份报告中。比如陈述型分析可能在以前已经有专门的分析报告阐述(如聚类分析、模式分析),如果需要,只是将那结论作为当前报告的一个背景而已。甚至有可能淡化陈述型分析,直接进入诊断型分析。而如果一份报告真的能够诊断出某种异常情况,已经有价值了。求证型和预期型分析是更上一层楼,为了让结论有说服力,或者引出某种行动策略选择。

可以用经验来分析,给出一种“见解”,或者用数据来表达。未必前者就不如后者,要看什么人做的。

我们通常会见到一类分析报告,可能会被评价为“浮于表面“,没有深层次的东西。我想,大多这类分析停留在陈述型分析层面,并且给出一种审美疲劳的陈述。

陈述型分析要给出一种”规律“,如果这种规律已经被大家认可,就失去价值,只有给出一种新奇、出乎意料的规律才让人耳目一新。

这让我产生一个想法——可以做一个checklist,来引导初级分析者完成任务。也可以用这个checklist来评判分析报告的质量。

2011/12/7 Q <happ...@gmail.com>



--
ttnn
telno: 13514984944

Q

unread,
Dec 8, 2011, 9:16:04 PM12/8/11
to tt...@googlegroups.com
尝试用这四类分析去看看一些分析案例吧。

前几天看到一篇关于《北京的”蓝天“掩不住健康风险》的帖子,其中包含若干图表。既然有图表,大概就是在分析什么吧,于是就拿这个当做案例。

这篇文章的背景就是最近北京空气质量问题,美国大使馆在自己屋顶上架起一个玩意儿,检测他们上空的空气质量,结果经常爆出”有毒害“的级别,引发争议。官方的解释是质量标准不一样,中国用PM10,美国用PM2.5。至于标准究竟哪个更合理,就不纠缠了。关键还是看本文的分析思路吧。

用四类分析去查看,却不容易捕捉到作者的思路。究竟他要陈述什么或论证什么?

陈述型分析。作者用文字和数据结合说话,陈述了标准的差异,北京PM10的检测数据,以及用PM2.5拟测的数据。结果是,北京自己检测的结果是北京的空气质量比香港、欧洲、美国都好。

但美国标准和中国标准在结果上的差异,究竟是陈述型还是诊断型?这需要跟文章的核心观点对应,如果文章要回到标准差异在哪儿,那么差异的存在就是陈述型分析。如果要暴露竟然有差异的存在,那么应当是诊断型分析。针对这个事情,我认为差异的存在已经是”常识“,所以应当作为陈述型分析,而文章要进一步诊断差异的具体方面。

不过这篇文章似乎并没有深入下去,还是停留在差异方面,一个是中国PM10标准,一个是美国大使馆的PM2.5标准、一个是中国PM2.5标准拟测。不过在后面,对这种差异分得更细一点,对比各个级别的差异。然而,这仍然没有诊断出新的问题。所以,文章几乎只是停留在陈述层面。然而,陈述分析到这儿似乎有点无力,虽然提出标准不同,但那个标准更合理?就像面前放了三块手表,你说那块是准的?

当然,在中间穿插着一个小小的诊断和求证。

其中提到北京的蓝天天数从98年100天到2010的286天,空气质量大大提升了。这个结论有点跟我们的”常识”违背(空气质量竟然好这么多?),于是作者接下来求证,为什么会这样,是因为新增了不少郊外的检测点,并列出数据。这是一个求证型分析。

预期型分析?似乎没有,本身这事儿也没什么预期的。作者如果能够诊断问题,求证原因,已经了不得。预期得是政府去做(自然,预期都是很好的)。

运用这四类分析去看这个案例。可以发现它缺少一些核心的观点,分析思路有些随意(当然,作者大概也并没有将这当做分析报告来写,只是想到那儿写哪儿,这才有中间穿插那个小小的诊断和求证),当然也许他更多的意图是提出对中国标准的不信任。剩下的,自己去判断——你信不信我不知道,反正我是不信。

Jill

unread,
Dec 8, 2011, 11:03:17 PM12/8/11
to tt...@googlegroups.com
恩,这四种分析总结的很好哦。我认为诊断型分析的定义应该更丰富些。
 个人认为诊断型分析发现异于规律常识的变化,这部分更多是对陈述性分析的认识、理解并表达的一个动作。还不构成一类分析。
我们常常遇到套餐评估,服务评估等XX评估类的分析,可以认为是诊断型的分析。诊断型的分析有两个关键的问题,诊断框架和诊断结果。诊断框架即从哪些方面进行诊断,是否全面又能反应具体应用的特征。诊断结果即能够立场鲜明的表达优势与劣势。
 
一篇分析报告可能会包括这4种类型的分析,通常会有所侧重,侧重某一种类型的分析。
 
-----------------------------------------------------------------------------------------------------------------------------

Q

unread,
Dec 9, 2011, 12:18:10 AM12/9/11
to tt...@googlegroups.com
我也发现陈述型跟诊断型之间界限有点含糊。

不过另一方面,他们的区别也是显而易见,目的不同,做分析的周期也不尽相同。

你说的不构成一类分析是否是指在方法上,还是比较简单,所以不能算?如果是因此,我想每类分析可以简单、也可以复杂。都可以运用人脑经验判断,或者用数据来表达。比如用数据挖掘算法发现奇异点,其实也就是诊断型分析的一种方法。

2011/12/9 Jill <wangj...@163.com>



--
ttnn
telno: 13514984944

abbo

unread,
Dec 9, 2011, 10:12:18 PM12/9/11
to ttnn BI 观点
这篇帖子我反复了看了几次,起初还有点模糊,越看倒越有些眉目了。

提到的四类分析,有点像医生看病的道理:

望闻问切,望闻问切是中医用语。
望,指观气色; | 陈述型分析:陈述现状和规律常识;
闻,指听声息; | 诊断型分析:发现异于规律常识的变化(一般都是时间上的);
问;指询问症状; | 求证型分析:挖掘导致那种变化的原因,或关联因素;
切;指摸脉象。 | 预期型分析:预期未来的变化,不同影响因素下的变化;

对比一看,好像还有那么点对路。

On 12月6日, 下午5时24分, 把余咏 <bayuyon...@hotmail.com> wrote:
> 我们都知道提出问题、分析问题、解决问题,也都知道其实能够发现问题也是一件不容易的事情。说“问题”是跟心理的“预期”不一样,才是问题,这个“预期”的产生 就需要有一定的经验、观察、学习、想象等过程形成。就像Q的诊断型分析,我们得先有对一个事情的描述(陈述),才能跟“预期”对比,并进而“求证”。
>
> 但“求证”似乎也严重依赖个体因素,包括知识、经验、背景、信息完整等组成了“求证”的几个支撑因素,。前两天看新闻说中国学生参加美国SAT考试,对判断论述 文的表现普遍较差(命题好像是学校是否应该教授道德和伦理),分析认为是中国学生缺乏判断力。
>
> 而在Delin的描述中也提到“乐观预期12年引来爆发”,这里也是个假设前提。我们一般在分析问题后,会提出解决办法,此时的“预期性分析”的结果就依赖这个 解决办法的成功执行;也有可能解决办法是不可操作的,问题自然发展,也许“预期”就是另外一种状况了。


>
> bayy
>
> 发件人: Q
> 发送时间: 2011-12-06 10:21
> 收件人: ttnn
> 主题: 分析的四种类型
> 从那天delin给ttnn绘制的一副论坛帖子趋势图,我突然想到点什么。先发现了一些论坛的变化。而从这个发现,触发我对分析套路的思考。
>
> 我一直相信分析问题是有套路的,分析问题的类型、不同类型的分析方法、不同的结论表达形式,都可以串联一起,如果能够形成套路,就可形成工具,让我们平常的业务 分析可以快速深入。
>
> 显然,delin的趋势图让我看到了变化,这也就是一种分析,可以叫这类分析为“诊断型“。
>

> Delin对这个图的解读反应出一种诊断——”0809达到巅峰、10、11稍有下滑。“这种诊断反应出一种变化。变化,即突破了人们常规的认识,认为事情在平 稳而有规律的发展。但通过数据,反映出事实并非如此,在发生某种不符合预期的变化,或者叫做“异常”。而诊断型分析,更主要是发现“异”。显然,诊断型分析的周 期应当短促,每月、每周、每天,甚至实时。


>
> 异,刚才那个例子可以表明了。发现在时间上的一些不合预期的变化,这里,预期其实就是我们心中的“常”,他们之间产生了差异,于是对人产生警醒,引起注意。
>

> 而,常。也并非总是一目了然。这个“常”是事先存在的(但未必是准确的,人的经验判断可能并不准确,数据反映更准确)。上面例子里,我们可能不假思索地认为趋势 是平稳规律的,但未必。从数据中发现那种“常”,也是诊断型分析的一部分,发现数据的变化规律。比如一个月里面充值缴费的的周期性规律,这可以作为“常”而存在 。显然,这种规律并非总是周期性分析,只是如果要做诊断型分析,需要这种“常”作为一种常识存在,作为一种背景。


>
> 由此,可以引出另一种分析,称作“陈述型”分析吧。它就是要陈述这类常态、规律性的东西,作为后续分析的背景。陈述性分析周期可相对常,季度、月,或者不定期。
>

> 诊断型分析发现了异于常态的变化,需要深入对这个变化找出原因。这个分析可以通过经验判断,比如delin在帖子里提出了两个原因:一个是行业和从业发展的原因 ,一个是用户职业变迁的原因。这是经验分析,当然也是受数据所限。而如果有充足的数据,可以用数据来探索异常的原因,为什么会发生那种变化?那么,这类分析可以 称作“求证型”分析。这类分析也许还包括丰富的细类,比如为了求证,可以是求关联,或者是求因果的。但不管如何,先统称为求证型。
>
> 而最终,还需要一种对未来的预期分析。Delin也在趋势图上描绘出几个上扬的红点,很乐观地预期12年将引来爆发。这类分析是为了告诉别人未来会发生什么样的 变化。预测分析,或者what-if分析都是这类,可叫作“预期型“分析。


>
> 再回顾一下,分析的类型可以分成四类:
> 1、陈述型分析:陈述现状和规律常识;
> 2、诊断型分析:发现异于规律常识的变化(一般都是时间上的);
> 3、求证型分析:挖掘导致那种变化的原因,或关联因素;
> 4、预期型分析:预期未来的变化,不同影响因素下的变化;
>

> 在一个完整的分析里,也许这四类分析都包括,只不过未必显性化而已。可以用一段一百字的文字完成一次分析,也可能包括这四类分析。而如果用一篇长达100页的分 析报告,充斥大量数据和模型结论,其实也是这四类分析。

villa7.li

unread,
Dec 12, 2011, 4:25:05 AM12/12/11
to tt...@googlegroups.com
其实只有三类:评估、监控、预测;

Q

unread,
Dec 12, 2011, 10:25:03 PM12/12/11
to tt...@googlegroups.com
嘿,这三类倒确实是覆盖全了,过去、当前和未来。

我也迷糊了,究竟我们各自从什么角度切入的?如果说从分析数据的周期看,确实这三类全了。然而,也有个很显而易见的,我们平常很多分析工作还是在找原因,这种分析放在这三类的哪一类里面呢?

也许我们对”分析“的涵义,或者是分类的目的有不同理解。

你谈谈你这么分的理由啊。




--
ttnn
telno: 13514984944

villa7.li

unread,
Dec 12, 2011, 10:50:12 PM12/12/11
to tt...@googlegroups.com
评估:对应你的第一个 ,我们每天给运营商做的一大部分工作就是在做各种效果评估,就像人要自我反省一样,事情做了总要看看做的如何。
 
监控:就是你的第二个、第三个,其实是我们说的概念不同而已,我认为监控就不能只看看数,包括,1、监控  3、发现原因  3、寻找解决办法;其实就是发现问题、分析问题、解决问题;
对于监控只能支持发现和部分分析和解决。
对于发现不外乎结论就是三个,好、正常、差;对于好的合正常的如何让更好,对于差的如何让正常且好。所以分析就两类,问题诊断和潜力分析。
 
预测:就更简单了,这个到底准不准只是心理安慰。你想让好就好,你不想让好就差呗。所以现在大家很务实,预测这种事情越来越少,当然我认为预测这种事情其实关键是居安思危时候干的事情,现在很多企业其实都在你死我活中,都没精力搞什么预测。
 
我们一大部分工作在搞评估和监控,监控中大部分工作在找原因,在做优化和提升。只是经常原因没找对,没法对症下药,且世事变化太快,原因愈加复杂,所以人们每天都在反省、寻找、发现、解决。就像人一样。
 
扯远了,另最近深感运营商搞 BI这个东西搞的太复杂了,我觉得互联网现在搞BI的模式很好,运营商或者更大的国企就是把简单问题复杂化,这是的传统思维模式;而互联网就是把复杂问题简单化,如何更简单更好用,更方便用,就像国人和老外的区别。

兰德里尼

unread,
Dec 12, 2011, 11:52:24 PM12/12/11
to tt...@googlegroups.com
预测,我来补充一下
预测实际是监控的基础,既然要监控,就要有预警阀值,而这些阀值,大多来源于计划,计划来源于预测
我预测明年收入增幅在8%,那么,围绕8%会制定一系列分解计划值,按照这些分解值再来制定分阶段的预警区间,红黄绿等 。监控就是查看当前运行与计划之间的差异。
Long Credit
Zhongwei / 仲伟
+86 -13910741770

把余咏

unread,
Dec 18, 2011, 10:24:53 PM12/18/11
to ttnn
这样一来似乎进入一个不断陈述、评估、预测、监控的发展循环了。
 

bayy
 
发件人: 兰德里尼
发送时间: 2011-12-13 12:52
收件人: ttnn
主题: Re: 分析的四种类型
Catch.jpg

Q

unread,
Dec 18, 2011, 10:58:07 PM12/18/11
to tt...@googlegroups.com
说是循环也未尝不可。
我觉得还是要继续探讨一下此处为分析分类的目的。
另外我注意到你在术语上合并了我跟villa的,那么就从我们俩在术语采用上的区分开始。

villa用评估、监控、预测作为名称。我用陈述、诊断、求证和预期作为名称。

V的分类试图从分析的目标切入的——做那个分析为了什么?是为了评估过去的工作?还是监控当下?还是预测未来?很明显,这种区分已经能覆盖全部。

Q的分类试图从分析过程的差异切入——总觉得有些分析跟其他分析有些不一样,目的不一样,方法不一样,需要为他们做出区分。这四类我并不确定是否能覆盖全部,只是目前看起来觉得像。在这个分类后面,本来还计划列出每种类型的不同方法,可以细化下去。因此,其用途之一是可以指导或评估分析者的分析逻辑。

有一些细微的差别。大家体会下。

至于是否是一个循环。从分析一个问题的过程来说,是不断深入,应当是一种循环。而从静态的的分析结果(比如最终的分析报告),已经形成结果,不再是循环了。

不容易说清楚,很多词的含义没有固定内涵,导致看上去都是那么回事,但细细想又有点不同。

2011/12/19 把余咏 <bayuy...@hotmail.com>



--
ttnn
telno: 13514984944

Catch.jpg

Jill

unread,
Feb 6, 2012, 3:21:21 AM2/6/12
to tt...@googlegroups.com

最近在思考如何总结分析的方法,又把前期大家讨论的分析的四种类型翻出来看了一遍。

 

从分析过程和分析方法的相似性,将分析分为陈述型、评估型、关系型和预测型四种类型。实际上与Q提出的四种类型差不多,后面我又所了一些细分,也把最近一年大家做的分析拿出来按这四种类型归类了一下,发现还都能对号入座,只是数量分布上的差异。V的评估、监控、预测感觉是覆盖比较全了,但个人感觉监控更多的是一种技术实现方式。

陈述型:通常是面对一个新的业务问题或者是比较普遍的业务问题时用该方法。陈述型分析又可以分为细分类、识别类和一般描述类。

细分类:结合细分目的和用户行为特征,提出存在几个细分群的假设,根据细分群的特征寻找细分的关键变量。细分包括实现细分、细分特征刻画及各群的建议。

识别类:识别类的识别通常是一个难点,譬如外来人识别的难点在于如何识别那些人是外来人,WLAN上网终端识别难点在于识别用户数是通过什么终端上网的,宽带竞争分析难点在于识别有多少竞争对手用户。识别分析识别是基础,对于识别的结果通常需要结合业务目的或业务特征进行细分,这样识别结果才能更好的落地执行。

普通描述类:譬如,中高端重新拍照之后,客户对新拍照的用户不了解,需要做一个总体分析。

评估型评估分析又可以细分为影响分析和评估分析。

影响分析:影响分析主要分析事件带来的机遇和挑战,即积极的影响和消极的影响分别是什么,如何充分发挥积极影响,化解消极影响?譬如智能终端对移动业务的影响分析。

评估分析:评估分析相对于影响分析,更强调从哪几个方面来进行评估,各个方面的优劣势,则更评估的全面性,通常会有多个对象进行比较分析。譬如终端捆绑营销评估,通常会有多个终端捆绑的营销政策进行评估,比较各策略在不同方面的优劣势。

关系型:寻找因果、相关性等关系。譬如收入下降的原因是什么?手机报与来电提醒是否存在相关关系。原因型通常需要给出原因,并且给出相应的改进策略。

预测型:通过现在预测未来,以分为总量预测和个体预测。

总量预测,即对总体量进行预测,譬如预测未来半年的收入情况。

个体预测,对客户从个体上进行预测,譬如客户流失预测。个体类预测除了预测个体的概率之后,还需要对预测结果从总体上进行分析。譬如客户流失预测,首先需要预测哪些客户可能会流失,预测结果出来之后,需要总体上分析流失用户的规模、特征等,以便对流失用户进行保有。

 

 


--
订阅地址:ttnn+subs...@googlegroups.com
退订地址:ttnn+unsub...@googlegroups.com


Reply all
Reply to author
Forward
0 new messages