统计在平常分析中的运用

186 views
Skip to first unread message

Q

unread,
Jun 24, 2013, 11:24:37 PM6/24/13
to ttnn
成熟的统计分析技术在我们平常分析中,究竟用的怎么样?

前日,客户发起一分析需求,我帮助梳理分析思路。其目的主要是对现有的业务策略进行评估,以提出优化策略,是否存在一些共性的好的做法,或可避免的差的做法。这些业务策略都已经固化到系统级别,属操作型策略,面向个体用户的。数据层面,都是具备的。

按照tale的方法,当即分解成三个原子分析,随后,给出详细的纲要。提出两个框架,一为评估框架,评估这些策略中哪些是好的,哪些是坏的。所谓好的,表现在哪些方面(如是否接受,是否达成直接业务目标,是否取得回报)。另一个为诊断框架,即那些好的策略,具备哪些特质,而哪些坏的呢?从三方面来做这些特质的假设,假设策略(其实是策略执行)的好坏,是受客户群、策略本身以及执行环节的影响,从这三个方面进一步假设影响因素的细节。最终也就提出了一个数据需求。其实,也就是形成一张宽表,包括了诸多的自变量和因变量。

接着,问题来了。

思路之后的工作将由另一家公司的团队去做分析。此时,即便是数据需求出来了,然而具体怎么做分析却没谱。因此,客户希望我能把详细的分析方法也写出来,更明确。还有那些能组合考虑的因素,都列出来。

在思路假设时,我尽可能地做了一些多因素组合带来的影响。比如是因为策略和客户群不匹配造成对接受度有影响,更细一点,可能有诸如优惠幅度和保底消费不匹配对回报度的影响。但不得不说,这种组合的枚举我心想是不容易穷尽的,所以,列出来更多是处于示意的目的。所谓的匹配,在我看来,是单变量的组合。所以,在提出数据需求时,并没有给出各种匹配的可能。

而客户觉得是否在数据准备时,就应该要求把各种可能的匹配算出来。这样后面做分析就更明确了。

当时的数据需求,其实就是列出了各种自变量和因变量的关系,统计学里典型的命题。

可是,统计学似乎离我们比较远。就以我自己来说,零星了解过统计学的知识,但实际分析操作,很少用上。所以,我只能回答,单变量的相关性容易看吧,而多变量的,我只能根据经验去找那些可能的关联。况且在统计分析里面,应该是有这种多变量相关性的论证方法的(我相信有,但不知道是什么)。

所以,这个案例中可以看出可能存在的两种方式:
1、运用业务假设能力,将尽可能的多变量组合形成单独的变量,于是分析变成单变量跟目标变量的相关性分析;
2、业务假设给出原始变量,而他们的组合,交给统计学去解决;

个人直觉认为,第二种方式应该是存在的。是否是因为统计学的术语造成了某些门槛障碍,诸如什么卡方检验之类。是否可以抽离出一些应用场景,简化统计学的应用呢?

祝迎春

unread,
Aug 30, 2013, 5:13:29 AM8/30/13
to tt...@googlegroups.com

统计分析还是交给统计人员,或者精通统计的管理人才去做。里面陷阱太多,我看过计算机出身的用回归,在他们眼中回归是一个帽子矩阵的计算问题,摇头,无法解释(不愿)。回归是把刀的话,在实际运用中,知道其参数和实际的对应,就像看机器的仪表盘知道真实实际的情况一样。多年前,给移动写过类似的白皮书。培训比白皮书管用得多。而招聘又比培训好用。

Ding Xining

unread,
Sep 17, 2013, 9:59:25 AM9/17/13
to tt...@googlegroups.com
第一种方法,是用来观测自变量与目标变量之间的关系,比如:是否是线性相关,还是非线性相关。可以借助散点图来大致的描述这种关系。当自变量与因变量都是分类变量时,检验的方法可以是卡方检验。但是当影响因素较多,并且自变量与自变量之间相互影响,出现多重相关性时,这种单变量的因素分析就不能正确描述自变量对目标变量的影响了。可以用回归模型来计算这种关系。
各种统计模型都各自有它自己的假设条件,所以我认为即使可以抽象出应用场景,模型的运用也会根据与之对应的数据的不同而有不同。比如:是否需要进行数据转换等等。


xy zhang

unread,
Nov 15, 2015, 9:20:17 PM11/15/15
to tt...@googlegroups.com
主成分分析

Learns BI

unread,
Sep 5, 2016, 5:00:54 AM9/5/16
to tt...@googlegroups.com
这个论坛现在还有人用吗?新的地方在哪儿?

在 2015年11月16日 上午10:20,xy zhang <zhucheng...@gmail.com>写道:
主成分分析

在 2013年9月17日 下午9:59,Ding Xining <happyjav...@gmail.com>写道:
第一种方法,是用来观测自变量与目标变量之间的关系,比如:是否是线性相关,还是非线性相关。可以借助散点图来大致的描述这种关系。当自变量与因变量都是分类变量时,检验的方法可以是卡方检验。但是当影响因素较多,并且自变量与自变量之间相互影响,出现多重相关性时,这种单变量的因素分析就不能正确描述自变量对目标变量的影响了。可以用回归模型来计算这种关系。
各种统计模型都各自有它自己的假设条件,所以我认为即使可以抽象出应用场景,模型的运用也会根据与之对应的数据的不同而有不同。比如:是否需要进行数据转换等等。
在 2013年6月25日上午11:24,Q <happ...@gmail.com>写道:
成熟的统计分析技术在我们平常分析中,究竟用的怎么样?

前日,客户发起一分析需求,我帮助梳理分析思路。其目的主要是对现有的业务策略进行评估,以提出优化策略,是否存在一些共性的好的做法,或可避免的差的做法。这些业务策略都已经固化到系统级别,属操作型策略,面向个体用户的。数据层面,都是具备的。

按照tale的方法,当即分解成三个原子分析,随后,给出详细的纲要。提出两个框架,一为评估框架,评估这些策略中哪些是好的,哪些是坏的。所谓好的,表现在哪些方面(如是否接受,是否达成直接业务目标,是否取得回报)。另一个为诊断框架,即那些好的策略,具备哪些特质,而哪些坏的呢?从三方面来做这些特质的假设,假设策略(其实是策略执行)的好坏,是受客户群、策略本身以及执行环节的影响,从这三个方面进一步假设影响因素的细节。最终也就提出了一个数据需求。其实,也就是形成一张宽表,包括了诸多的自变量和因变量。

接着,问题来了。

思路之后的工作将由另一家公司的团队去做分析。此时,即便是数据需求出来了,然而具体怎么做分析却没谱。因此,客户希望我能把详细的分析方法也写出来,更明确。还有那些能组合考虑的因素,都列出来。

在思路假设时,我尽可能地做了一些多因素组合带来的影响。比如是因为策略和客户群不匹配造成对接受度有影响,更细一点,可能有诸如优惠幅度和保底消费不匹配对回报度的影响。但不得不说,这种组合的枚举我心想是不容易穷尽的,所以,列出来更多是处于示意的目的。所谓的匹配,在我看来,是单变量的组合。所以,在提出数据需求时,并没有给出各种匹配的可能。

而客户觉得是否在数据准备时,就应该要求把各种可能的匹配算出来。这样后面做分析就更明确了。

当时的数据需求,其实就是列出了各种自变量和因变量的关系,统计学里典型的命题。

可是,统计学似乎离我们比较远。就以我自己来说,零星了解过统计学的知识,但实际分析操作,很少用上。所以,我只能回答,单变量的相关性容易看吧,而多变量的,我只能根据经验去找那些可能的关联。况且在统计分析里面,应该是有这种多变量相关性的论证方法的(我相信有,但不知道是什么)。

所以,这个案例中可以看出可能存在的两种方式:
1、运用业务假设能力,将尽可能的多变量组合形成单独的变量,于是分析变成单变量跟目标变量的相关性分析;
2、业务假设给出原始变量,而他们的组合,交给统计学去解决;

个人直觉认为,第二种方式应该是存在的。是否是因为统计学的术语造成了某些门槛障碍,诸如什么卡方检验之类。是否可以抽离出一些应用场景,简化统计学的应用呢?

--
发帖 - mailto:tt...@googlegroups.com

--
发帖 - mailto:tt...@googlegroups.com

--


Q

unread,
Sep 8, 2016, 3:40:54 AM9/8/16
to ttnn
不更新了!

--




--

Liao Wei

unread,
Jul 12, 2017, 9:35:54 PM7/12/17
to tt...@googlegroups.com
Q啥时候回来?

--


吉 雅

unread,
Jul 12, 2017, 9:45:12 PM7/12/17
to tt...@googlegroups.com
估计过了这么多年大家都有很大变化了吧,曾经的这些讨论给我的帮助很大,主要是训练思维、站在多角度考虑问题!很感谢这个平台。

吉雅
--

Q

unread,
Jul 12, 2017, 9:59:00 PM7/12/17
to tt...@googlegroups.com
是啊是啊,大家都各有变化,还能记得ttnn,好极了。

吉 雅 <btj...@hotmail.com>于2017年7月13日 周四09:45写道:
Q啥时候回来?

不更新了!

这个论坛现在还有人用吗?新的地方在哪儿?

主成分分析

--
发帖 - mailto:tt...@googlegroups.com

--


--




--

--


--

--

--

Jinxin Yao

unread,
Jul 13, 2017, 7:44:17 AM7/13/17
to tt...@googlegroups.com, tt...@googlegroups.com
我那天还和朋友说,以前我们叫BI,人家现在叫IB(智能商业)和AI,以前我们叫数据挖掘人家现在言必称大数据。Q作为那些年的灵魂人物,要是可以牵头一起做事就好了。


Johnson
--

Howard Wang

unread,
Aug 29, 2017, 1:20:34 AM8/29/17
to tt...@googlegroups.com
算法还不是那些

是啊是啊,大家都各有变化,还能记得ttnn,好极了。

Q啥时候回来?

不更新了!

这个论坛现在还有人用吗?新的地方在哪儿?

主成分分析

--
发帖 - mailto:tt...@googlegroups.com

--


--




--

--


--

--

--

--

--




--
大王的异想世界:
http://Jindows.cn

Eric

unread,
Aug 31, 2017, 3:32:03 AM8/31/17
to tt...@googlegroups.com


当时要继续把这块垂直做深入下去就好了。
--



 

Reply all
Reply to author
Forward
0 new messages