有没有大牛人能帮我们做一些数据挖掘的工作啊?

6 views
Skip to first unread message

杨威

unread,
Oct 21, 2008, 10:55:37 PM10/21/08
to tt...@googlegroups.com
我们是做机票等旅游产品相关的搜索引擎的,所以我们拥有大量的与这些行业相关的数据,以及海量的用户操作的数据,和百度一样,我们希望建立完善的数据挖掘体系,并向用户和行业提供更多的资讯。
目前的想法是根据我们的数据,向用户提供未来价格可能发生的变化趋势的分析,寻找能给予我们支持的朋友,也可以向各位提供很好的展现平台。
公司的介绍我就不多说了,给一个链接吧:http://www.qunar.com/site/zh/Qunar.in.China_1.2.shtml




--
杨威
中国*北京
=============================================================
http://www.qunar.com                          Think.Search.Travel
"去哪儿"旅游搜索                            聪明你的旅行!

Ming Xiao

unread,
Oct 21, 2008, 11:24:23 PM10/21/08
to tt...@googlegroups.com
我正在北航读工程硕士,其中有数据挖掘的课程,想要在实践中,学习数据挖掘的技术。
不知道你们是否考虑!

2008/10/22 杨威 <szy...@gmail.com>

Jiangtang Hu

unread,
Oct 21, 2008, 11:27:03 PM10/21/08
to tt...@googlegroups.com
“去哪儿”是个好地方,找打折机票都去这里。这些数据用好了,我们作为用户就更得实惠了。
 
胡江堂
Jiang...@gmail.com
北京大学软件与微电子学院06级硕
生活博客(读书、见闻): http://panshanghu.spaces.live.com
技术博客(SAS、数据挖掘、数量金融):http://johnthu.spaces.live.com

兰德里尼

unread,
Oct 22, 2008, 12:56:02 AM10/22/08
to tt...@googlegroups.com
比较感兴趣,感觉数据可挖的地方还是很多的,如果可以的话,可以参与一下需求讨论,
我的项目经验:税务,财政

2008/10/22 Jiangtang Hu <jiang...@gmail.com>

xi rong

unread,
Oct 22, 2008, 1:18:11 AM10/22/08
to tt...@googlegroups.com
这个东西很有前景啊!

在 08-10-22,兰德里尼<zw8...@gmail.com> 写道:


--
Regards
Rongxi

Qing

unread,
Oct 22, 2008, 1:26:27 AM10/22/08
to tt...@googlegroups.com
去哪儿提供的价格对比,我只是用了一两次,因为最低价格的那些机票我不太敢订,一般看到最低的比大代理商只是低0.5、1个折扣,宁愿选择去大代理商那里去订。

价格预测应该还是挺有用的,鄙人就有这样的需求,比如看看什么时候的机票便宜,我就在那段时间出行。

不过你们仅仅是做价格预测么?你们的商业模式是不是通过机票价格信息向潜在乘客提供增值服务,最终还是卖广告呢?
除了预测价格,是否还要预测用户的出行需求呢?
不知道你们的用户操作数据主要是指用户在去哪儿网站的行为数据,还是有一些交易数据?

你说的"完善的数据挖掘体系"是个什么概念?我觉得在这个体系之前,可以先谈谈,挖掘的目的是什么。可以在这里集思广益一下。

2008/10/22 杨威 <szy...@gmail.com>

Ethan

unread,
Oct 22, 2008, 1:30:16 AM10/22/08
to ttnn BI 观点
虽然没做过类似的项目,但是感觉对于搜索引擎网站,未来价格可能发生变化的趋势分析貌似不是一个很直观的挖掘主题,因为比方说机票价钱,未来多少天的时
候各家航空公司的机票价钱是多少已经是一个明确的事情了吧,似乎好像不用去预测了。

个人觉得在垂直搜索网站方面,挖掘的主题应该可以包括对搜索结果的排序(当然不是机票或酒店价格排序之类的),另外就是在网络交叉营销方面是可以有主题
来做的。

当然了,最终能在哪些主题上来做,一来是要看现有的数据主要是来自于哪些方面。
再一个就是在做挖掘之前应该要有一个明确的业务目标,(比如想向用户提供未来价格可能变化的趋势分析,那对于网站经营者而言,这样做的业务目标是什
么),只有有了明确的业务目标,才能确定挖掘的主题和在业务目标下的挖掘问题描述。

就像TTNN里好多帖子讨论的一样,需求其实是一个挖掘项目成功与否至关重要的一点。

呵呵,午间瞎说一通,片面之处请多指教。

对楼主提到的想法,挺有兴趣的,不过不知道合作方式,比如兼职,还是全职....



On 10月22日, 上午10时55分, "杨威" <szy...@gmail.com> wrote:
> *
> 我们是做机票等旅游产品相关的搜索引擎的,所以我们拥有大量的与这些行业相关的数据,以及海量的用户操作的数据,和百度一样,我们希望建立完善的数据挖掘体系,-并向用户和行业提供更多的资讯。
> 目前的想法是根据我们的数据,向用户提供未来价格可能发生的变化趋势的分析,寻找能给予我们支持的朋友,也可以向各位提供很好的展现平台。
> 公司的介绍我就不多说了,给一个链接吧:http://www.qunar.com/site/zh/Qunar.in.China_1.2.shtml
>
> *
>
> --
> 杨威
> 中国*北京
> =============================================================http://www.qunar.com Think.Search.Travel
> "去哪儿"旅游搜索 聪明你的旅行!

shzxqdj

unread,
Oct 22, 2008, 2:41:41 AM10/22/08
to ttnn BI 观点
这个帖子好,不过该用户的需求不太对路子.挖掘的目的有很多,比如对广大旅游者提供更精准的导航\推荐, 对广告客户提供有关付费效果的优化模型, 更
多的目的大家可以在这里讨论,我觉得你能否把你们目前有规模的各种数据格式能告诉大家,我们才知道有什么资源,这样讨论比较能一语中的. 另外,说个泼
凉水的话, 真正挖掘时,业余的合作能成功的机会太小,里面牵涉到太多的数据挖掘项目的关联性,不是说一两个人在家里编些程序就可以搞定的,;话说回
来,在这里讨论,还是可以给这个公司提供很多好建议和思路的,请先告诉我们你的数据资源有些什么具体的东西把,谢谢

On 10月22日, 下午1时26分, Qing <happys...@gmail.com> wrote:
> 去哪儿提供的价格对比,我只是用了一两次,因为最低价格的那些机票我不太敢订,一般看到最低的比大代理商只是低0.5、1个折扣,宁愿选择去大代理商那里去订。
> 价格预测应该还是挺有用的,鄙人就有这样的需求,比如看看什么时候的机票便宜,我就在那段时间出行。
>
> 不过你们仅仅是做价格预测么?你们的商业模式是不是通过机票价格信息向潜在乘客提供增值服务,最终还是卖广告呢?
> 除了预测价格,是否还要预测用户的出行需求呢?
> 不知道你们的用户操作数据主要是指用户在去哪儿网站的行为数据,还是有一些交易数据?
>
> 你说的"完善的数据挖掘体系"是个什么概念?我觉得在这个体系之前,可以先谈谈,挖掘的目的是什么。可以在这里集思广益一下。
>
> 2008/10/22 杨威 <szy...@gmail.com>
>
>
>
> > *
> > 我们是做机票等旅游产品相关的搜索引擎的,所以我们拥有大量的与这些行业相关的数据,以及海量的用户操作的数据,和百度一样,我们希望建立完善的数据挖掘体系,-并向用户和行业提供更多的资讯。
> > 目前的想法是根据我们的数据,向用户提供未来价格可能发生的变化趋势的分析,寻找能给予我们支持的朋友,也可以向各位提供很好的展现平台。
> > 公司的介绍我就不多说了,给一个链接吧:http://www.qunar.com/site/zh/Qunar.in.China_1.2.shtml
> > *- 隐藏被引用文字 -
>
> - 显示引用的文字 -

fun...@gmail.com

unread,
Oct 22, 2008, 3:43:24 AM10/22/08
to ttnn BI 观点
俺是搞电信BI、DM项目工作,老婆在经营机票生意。杨威抛出的这个话题正合我的胃口。qunar我很熟悉了,机票行业我也时刻关注着。

1、真正的需求在哪里?

杨威提到了价格预测。那么,哪些客户最喜欢价格预测?是个人客户。我把购买机票的人分成两种,个人客户和企业客户。一般来说,个人坐飞机出行,时间灵
活度比较大,出行约束较少,可以等到机票价格比较便宜了才买。所以个人客户属于价格敏感性客户。企业客户往往是因公出差,出行时间比较严格,他们更关心
航班的时间而非价格,因此属于非价格敏感性客户。

如果用DM手段做预测,结果可以更科学一些。但我们不能忽视一些影响因素,例如经济因素、天气因素。最近,金融危机、钢材价格下降等,导致我老婆的机
票生意少了;刮超级台风,导致客户退票、改签,这些因素都直接影响市场供求、引起价格波动。我们往往用历史数据来做预测,可是,之前的历史时期中,没有
包含金融危机、超级台风等因素。因此预测模型的准确度很难保证。

建立价格预测模型,模型产出的结果的表达模式可以有多种,其中一种可以是:
------------------------------------------------------
广州 -> 上海 2008-10-22 当前价格:900元
预测:
2008-10-23 40%机会上升,60%机会下降
2008-10-24 45%机会上升,55%机会下降
2008-10-25 14%机会上升,86%机会下降
.......
------------------------------------------------------

qunar提供价格预测的增值服务:为客户定时发送最新的预测结果,能够提高客户的粘度。显然,它不是“杀手级”应用,不能给企业直接带来很大的收
益。如果你对模型的准确率很有信心,那么可以使它变成收费服务。可我觉得,“收费的价格预测服务”是一个理想目标,能实现理想的人能有多少呢?

综上所述,价格预测要做好不容易,它能为网站带来一些附加服务,但并不是“杀手级”应用。只有对需求进行深入分析,找出“杀手级”应用,才能让BI在
机票行业的应用得到重视,有助于商旅企业建立完善的数据挖掘体系。


2、qunar的BI弱点在哪里?
有了大量的网友搜索行为数据,貌似可以做很多分析?但qunar的弱点恰恰就是数据不够。
首先,缺乏用户帐号数据。qunar的用户不需要登录,就能使用搜索功能。记录下来的搜索行为数据,不能定位到具体某个人。利用客户分群等办法,顶多
可以分析出有那些客户群体,各个客户群有哪些特征,至于这些客户群都包含哪些人,不知道!这样的结果,可以形成一份行业分析报告,辅助宏观决策,但可实
用性不强。

缺乏交易数据。由于qunar的商业定位,她不参与交易环节,所以缺乏用户的机票购买、改签、退票等数据。这些数据恰恰是含金量最高的数据。这些数据
存在于机票代理商(携程、elong)的Call Center系统中。如果通过某些渠道(黑市买卖?)得到这些交易数据,是否就解决问题了呢?从别的
系统得到的数据与qunar的搜索行为数据相互独立,只能分开来独立分析。要把网友的搜索行为和实际购买行为关联起来,很难。

我抛砖引玉,胡扯了一通,呵呵。希望大家继续讨论,把这个主题再深化一下。

兰德里尼

unread,
Oct 22, 2008, 4:38:27 AM10/22/08
to tt...@googlegroups.com
我先抛砖引玉,胡乱写了一些,欢迎大家拍砖!
见附图。

价格预测.jpeg

Qing

unread,
Oct 22, 2008, 4:49:20 AM10/22/08
to tt...@googlegroups.com
兰兰,我太崇拜你乐,速度也忒快了点....orz

2008/10/22 兰德里尼 <zw8...@gmail.com>
我先抛砖引玉,胡乱写了一些,欢迎大家拍砖!
见附图。

George Zhang

unread,
Oct 22, 2008, 4:51:48 AM10/22/08
to tt...@googlegroups.com
"懒的理你"兄真是分析的好细啊
我总觉得还没有这个必要

我的观点:
1、关于机票价格的预测,这是一个接近经济学的命题
     所以精确时间段的准确预测很难,不应该下太多功夫
     Qunar主页上的价格趋势已经能够满足主要需求

     能够补充的也只有统计一下历史数据中,低价机票的购买策略
     这个还要伴随一些主观因素,不需要使用太复杂的挖掘技术

2、给航空业界的资讯服务
     不知道Qunar的市场份额如何,但我想,你还没有资格可以出来说这个市场的情况,因为交易数据你都没有。而你能够提供给航空业界的,只是用户的搜索关注,其中有价值的就是:航线的搜索量航空公司的关注度

3、对消费者的服务
     单纯的机票信息貌似没有太多新意
     建议将机票,酒店,和旅游相关信息结合起来给用户做参考

2008/10/22 兰德里尼 <zw8...@gmail.com>



--
Best Regard
George Zhang

杨威

unread,
Oct 22, 2008, 5:20:07 AM10/22/08
to tt...@googlegroups.com
针对某一天的的一个航班的价格是实时变化的,所以掌握未来的变化的可能性对用户来说是非常有价值的,我们寻找愿意和我们一起挑战这个项目,向用户提供更"聪明"的支持的朋友。


2008/10/22 Ethan <fengy...@yahoo.com.cn>



--
杨威
中国*北京
=============================================================

George Zhang

unread,
Oct 22, 2008, 5:25:29 AM10/22/08
to tt...@googlegroups.com
难道你想搞机票期货交易?

2008/10/22 杨威 <szy...@gmail.com>
针对某一天的的一个航班的价格是实时变化的,所以掌握未来的变化的可能性对用户来说是非常有价值的,我们寻找愿意和我们一起挑战这个项目,向用户提供更"聪明"的支持的朋友。
--
杨威
中国*北京
=============================================================
http://www.qunar.com                          Think.Search.Travel
"去哪儿"旅游搜索                            聪明你的旅行!



lianyanjie

unread,
Oct 22, 2008, 5:35:30 AM10/22/08
to tt...@googlegroups.com
嘿嘿!想不到在这里又遇到杨威遇了。我对数据挖掘这块道行尚潜,所以平时也少有言语。
 
做了两年的网站产品经理,经常需要分析数据,不过更多的是用户的操作数据。通过分析这些数据,提高用户的使用体验、挖掘用户的潜在需求、开发产品新的经营模式、丰富产品的附加价值等等。
 
“去哪儿”给自己的定义是旅游搜索引擎,涵盖了机票、酒店、签证以及部分旅行社的旅行线路。通过抓取获得相关信息,这些信息的价值需要建立在不断更新的基础上。
 
从行业数据里面可以挖掘出什么呢?我说一下我的想法:
 
1、价格趋势:价格的升降、周期变化甚至规律。
2、热度趋势:根据业务的销售程度,例如某航班机票某时间内全部售出、某酒店某规格的客房某时间内全部被预定、某旅游线路某时间内名额已满。
3、市场趋势:在线旅游服务商分为旅游预订网站和旅游资讯网站,不知道“去哪儿”抓取的内容除了预定网上的价格之外会不会抓取资讯网上的旅游资讯,如果也有抓取,那么市场就不应该只有价格这个标签,还应该包括市场的业务标签,例如最近各网站都在主推红色旅游、经济型酒店等等。
 
挖掘出这三点,似乎对用户更有用,但是还不足以支撑一个盈利模式,或者说不算是一个增值服务。还有待了解在线旅游服务商的运作模式,所以我的能力只允许提供以上三点。
 
我倒是很想说说对用户行为的分析。
 
在分析之前我扯一个题外话,就是经营模式。我作为“去哪儿”的用户,更愿意把“去哪儿”看作一个“比较购物网站”,而不是传统的搜索引擎,或者垂直搜索。传统的搜索引擎比如百度,用户在输入某个关键词之前他们对结果的预期是不完整的,很可能只是其中的一个点,搜索引擎针对此关键词相关的内容进行分析,把相关性最强的内容放在前面,这应该是理想中的关键词排名服务。比如用户输入“国庆旅游”,用户对搜索结果的落脚点可以很多,可以是旅游地点、旅游攻略、旅游线路、旅游新闻等等,用户通过搜索列表开始选择,此时就产生出了盈利模式--“竞价排名”,用户既然在选择,那么谁都希望往前挤,就像美丽的少女抛绣球选郎君,男人们削尖了脑袋往前挤一样。
 
那么“去哪儿”是什么情况呢?用户说:“我要购买10月23日从北京去上海的机票。”这句话太完整了,包括时间地点人物事件的起因经过结果,所以“去哪儿”连输入关键字的搜索框都不需要提供,让用户选“地点”“方式”“时间”就行了。于是大家都别挤“我就要抛绣球啦,大家从矮到高排好。”这样看来“去哪儿”似乎就失去了“竞价”这个作为搜索引擎支柱性的盈利模式了。
 
是这样么?如果是,那么能不能找出新的盈利模式?分析一下用户先!
 
用户的操作数据包括用户资料、用户浏览、用户输入、用户点击、用户交易,“去哪儿”不存在会员概念,没有用户资料,也不存在真正意义上的用户输入操作(输入城市名这个动作和下拉选框是同样的性质,所以不算输入。),也不参与交易环节,那么剩下的就是用户浏览和点击的操作数据了。
 
一、对用户的浏览数据挖掘
1、用户进入和离开网站的路径:
从哪来?到哪去?白骨精说:“从东土大唐来,到西天取经去,那他就是唐僧,老娘找的就是他。”这组数据的分析会影响网站的推广以及运营,例如30%的用户从搜索引擎来,通过内容细览页进入网站,我们就可以考虑在细览页上下功夫,引导用户到更多的页面去。
2、平均每个用户浏览的页面数:
为什么每个用户平均访问页面只有1.6个?符合网站的预期么?
3、用户的浏览深度
网站引导是否做好,内容是否具有黏性?
4、用户浏览逻辑
很多男士进入超市买完啤酒还会去选购婴儿尿布,我们能不能在啤酒边上摆上婴儿尿布?通过这组数据的分析可以让用户来引导用户,比如当当网的“浏览本书的顾客还看过”。
5、来访用户的平均在线时间
6、来访用户的地域分布
7、用户访问的时间分布
一天24小时,用户在哪个时间段登陆得最多
8、用户回头率
再次访问的用户情况
9、用户通过什么关键词搜索到网站
用户你网站什么内容最关系
 
产品的决策有一大部分应该来源于对用户的分析,维系用户就好比谈恋爱,难道不希望了解对方多一些么?
 
二、对用户在网站上的点击情况分析。用户在网站上的点击动作,就是用户留下的脚印。
1、操作流程中页面的访问数流向
一个页面也许会有很多的按钮和链接,1000个人到了“去哪儿”的首页,有多少人直接点击“机票搜索”按钮,有多少人点击“推荐特价信息”,现在数据是这样的情况,为什么?
2、操作流程中页面的转化情况
当机票搜索列表存在翻页的情况,假设用户平均翻看1.8个页面才点击“订票”按钮,如果用户只在乎价格,而我们已经给价格做好了排序,第一个就是价格最低的,那么为什么绝大部分用户还要查看下一页?难道他们除了价格还关心其他的?他们还关心什么呢?
3、操作流程中每一步页面的页面流向
我们为用户设计的流程是从A页面开始,到B页面,接着进入C页面,到D页面结束,可是通过数据分析,发现大部分用户到C页面时又返回到B,然后要么继续进入C要么退出,为什么会这样呢?是不是流程中有问题,或者我们这样设计不是用户想要的?
4、操作流程中每个页面的点击分布
“去哪儿”的机票搜索列表页包括导航区、搜索区、筛选区、排序区、“订票按钮”、酒店推荐、相关优惠、google广告等,用户在这些区域的点击比例为什么是这样的?和预期的是否相同?页面布局有问题吗?用户关注的难道不是这些?
 
通过对用户的点击分析,可以更深入的挖掘用户需求,优化使用流程,甚至新的业务点,例如:如果用户不仅仅关注价格,价格并不是他们决定购买的关键点,也许会有其他的,这个其他也许就是一个新的业务点。
 
不知不觉写了那么多,似乎没有多少人会看完,语多必失,说的不对的地方大家修正,先到这吧!我是练燕杰,还记得吧?现在中企动力做邮箱。
2008-10-22

lianyanjie

发件人: 杨威
发送时间: 2008-10-22  10:55:52
抄送:
主题: 有没有大牛人能帮我们做一些数据挖掘的工作啊?

笨笨

unread,
Oct 22, 2008, 5:48:02 AM10/22/08
to ttnn BI 观点
我一直不赞成做价格预测这种东西。但被逼无奈,很多时候是项目的需要、客户的需要,被迫做了些模型。

预测模型有一个很重要的假设:即过去发生的事情,其规律和未来发生事情的规律相同。

试想:1.可能相同么?答案:不一定,有时可能、有时不可能。
2.即使相同,你把所有的因素都考虑进来了么?就像楼上所说的钢材因素、天气因素等。

个人觉得,这样的价格指数预测,噱头多余实际,更多的是乙方忽悠甲方。

如果预测这么准确,早就都去预测股票期货了,哪有空给一群大爷们做项目,装孙子阿?

On 10月22日, 下午5时20分, "杨威" <szy...@gmail.com> wrote:
> 针对某一天的的一个航班的价格是实时变化的,所以掌握未来的变化的可能性对用户来说是非常有价值的,我们寻找愿意和我们一起挑战这个项目,向用户提供更"聪明"-的支持的朋友。
>
> 2008/10/22 Ethan <fengyin...@yahoo.com.cn>
>
>
>
>
>
> > 虽然没做过类似的项目,但是感觉对于搜索引擎网站,未来价格可能发生变化的趋势分析貌似不是一个很直观的挖掘主题,因为比方说机票价钱,未来多少天的时
> > 候各家航空公司的机票价钱是多少已经是一个明确的事情了吧,似乎好像不用去预测了。
>
> > 个人觉得在垂直搜索网站方面,挖掘的主题应该可以包括对搜索结果的排序(当然不是机票或酒店价格排序之类的),另外就是在网络交叉营销方面是可以有主题
> > 来做的。
>
> > 当然了,最终能在哪些主题上来做,一来是要看现有的数据主要是来自于哪些方面。
> > 再一个就是在做挖掘之前应该要有一个明确的业务目标,(比如想向用户提供未来价格可能变化的趋势分析,那对于网站经营者而言,这样做的业务目标是什
> > 么),只有有了明确的业务目标,才能确定挖掘的主题和在业务目标下的挖掘问题描述。
>
> > 就像TTNN里好多帖子讨论的一样,需求其实是一个挖掘项目成功与否至关重要的一点。
>
> > 呵呵,午间瞎说一通,片面之处请多指教。
>
> > 对楼主提到的想法,挺有兴趣的,不过不知道合作方式,比如兼职,还是全职....
>
> > On 10月22日, 上午10时55分, "杨威" <szy...@gmail.com> wrote:
> > > *
>
> > 我们是做机票等旅游产品相关的搜索引擎的,所以我们拥有大量的与这些行业相关的数据,以及海量的用户操作的数据,和百度一样,我们希望建立完善的数据挖掘体系,--并向用户和行业提供更多的资讯。
> > > 目前的想法是根据我们的数据,向用户提供未来价格可能发生的变化趋势的分析,寻找能给予我们支持的朋友,也可以向各位提供很好的展现平台。
> > > 公司的介绍我就不多说了,给一个链接吧:http://www.qunar.com/site/zh/Qunar.in.China_1.2.shtml
>
> > > *
>
> > > --
> > > 杨威
> > > 中国*北京
> > > =============================================================
> >http://www.qunar.com Think.Search.Travel
> > > "去哪儿"旅游搜索 聪明你的旅行!
>
> --
> 杨威
> 中国*北京
> =============================================================http://www.qunar.com Think.Search.Travel
> "去哪儿"旅游搜索 聪明你的旅行!- 隐藏被引用文字 -
>
> - 显示引用的文字 -

杨威

unread,
Oct 22, 2008, 5:50:57 AM10/22/08
to tt...@googlegroups.com
我们拥有的数据包括:一个航班从起飞前90天到起飞时的各个时段的有效机票价格及变化的内容、用户对各个航班的关注度。
我们希望通过这个数据能判断:未来一段时间内,一个还没有起飞的航班的价格可能不断上涨还是存在下降的可能性,这个信息对用户的意义非常大。


2008/10/22 杨威 <szy...@gmail.com>

杨威

unread,
Oct 22, 2008, 5:56:24 AM10/22/08
to tt...@googlegroups.com
好久没有联系了,有机会在聚聚啊?


2008/10/22 lianyanjie <liany...@gmail.com>

杨威

unread,
Oct 22, 2008, 5:57:40 AM10/22/08
to tt...@googlegroups.com
机票本身就是一个期货,到了时间兑现,但是中间不能交易的期货。
买的是未来的服务,但是其定价的变化导致其本身就是一个对未来的预期。

2008/10/22 George Zhang <birdzha...@gmail.com>

jun.sky

unread,
Oct 22, 2008, 6:05:54 AM10/22/08
to tt...@googlegroups.com

呵呵,在看最后一句话之前以为你是我现在部门的同事!居然描述了我现在做的工作的80%

 

最近也在做一个项目就叫做用户行为分析,不过比你描述的更进一步,不仅仅是对用户流入,流出,点击做分析,还要将这些信息和网站的交易数据打通。而打通的方法就是利用COOKIE了。这可能也就解决了前边某某说的日志和DB数据连通不起来的担忧了!

看了杨威的描述,个人觉得他想做的是在去哪儿现有功能上再提供一个价格预测的应用性功能,我也觉得这会是一个比较有市场的产品,可以增加网站的粘度。但不会促成一个增值性产品的出现。而lianyanjie所描述的用户行为分析是一种运营支持,UI优化支持,广告投放支持的分析方法。两个貌似不搭边哦~当然,对客户的聚类分群还是有用的~

 


发件人: tt...@googlegroups.com [mailto:tt...@googlegroups.com] 代表 lianyanjie
发送时间: 2008年10月22 17:36
收件人: tt...@googlegroups.com
主题: Re: 有没有大牛人能帮我们做一些数据挖掘的工作啊?



<BR

袁旭

unread,
Oct 22, 2008, 6:06:51 AM10/22/08
to tt...@googlegroups.com
偶用过
还不错

2008/10/22 杨威 <szy...@gmail.com>

--
顺祝安康!

Qing

unread,
Oct 22, 2008, 6:15:33 AM10/22/08
to tt...@googlegroups.com
方便大家更多了解一些背景,大家可以看看一篇博文:http://www.mindmeters.com/day.asp?id=6364

这里有一些关于qunar的模式探讨,其中回复中也有个杨威,不知道是不是楼主呢。

对于机票是期货的概念,有个问题,对于消费者来说,购买机票后,他应该不再关注价格了吧。

对用户推送一些他最关注的旅行信息,我觉得这是一种模式,将用户的需求,和旅行产品的供应匹配起来。如此,倒是需要去深入分析用户的需求了。

练燕杰提到的一些分析,似乎更多是点击流分析,算是一个专门的领域了吧。想google analyitcs这类,几乎都提供流向、来源、关键字、广告的分析。上次还有个中科院的解决方案,可以看鼠标停留的热度,也比较牛。这类分析,甚至可以通过在网站中插入一些代码,搜集用户行为信息就可以。不过,要从这些信息中挖掘用户的真实需求,还需进一步挖掘。

2008/10/22 杨威 <szy...@gmail.com>
。。

George Zhang

unread,
Oct 22, 2008, 6:20:03 AM10/22/08
to tt...@googlegroups.com
嘿嘿我喜欢讨论这种问题

现在我们把机票看作是一种期货
那么机票的最终结算价格其实是由市场供需来决定的
即定价者明确知道自己的供给情况,在对市场的需求情况做了预测以后,可以定出机票的价格。

以上这些都是航空公司干的事情,现在qunar也要来干,那凭什么呢?
这里主要涉及的是两个因素,一个是供给,一个是需求
对于需求,qunar可以根据网站用户的使用情况来判断,那么供给呢?
就是航空公司现在的仓位空余,假设这个空余可以从该航班的票价趋势的出,即票价不断下降的我们认为他的供给过多

结论:好像以前一个经济学家说过,所有的市场供需变化终究都会反映在价格上,所以qunar可以根据航班的历史价格来预测他的供给

问题:价格对供需的,拍脑袋想一下应该是滞后的,如何可以在航空公司降价以前就预测到他要降价呢?


2008/10/22 杨威 <szy...@gmail.com>

杨威

unread,
Oct 22, 2008, 6:26:50 AM10/22/08
to tt...@googlegroups.com
我确实是这个话题的发起者,我非常感兴趣中科院的这个解决方案,能不能告诉我是什么呢?
用户买了机票之后确实不再关注价格,但是价格的变化确实存在期货特性,所以我觉得关键是帮助用户决定"什么时候是合适的购买时间点",我想如果能把握到这个变化会对用户产生极大的帮助。


2008/10/22 Qing <happ...@gmail.com>

杨威

unread,
Oct 22, 2008, 6:29:38 AM10/22/08
to tt...@googlegroups.com
非常有见地,也很直接,我们是不知道具体的库存的,但是我们基本上能清楚整体的供应。
基于这样的信息,我不知道这个事情你能不能帮我们想到更好的办法了?

2008/10/22 George Zhang <birdzha...@gmail.com>

Jarvis

unread,
Oct 22, 2008, 8:06:07 AM10/22/08
to tt...@googlegroups.com
机票价格应该不是由你们公司预测的吧。我没在中国通过网站定过机票,在美国网站定机票,你每天上网定未来同一个航班的机票价格不同,而且不同时间到某个地点去的航班价格也不同。比如,你要从LA去NY,你可以查9月份的价格,也可以查10月份的价格,这些价格是航空公司给定的。这些价格其实不是你们网站预测的,而是航空公司根据历史数据预测后给出的。当然也存在一种情况,飞机起飞前2个小时机票会非常便宜。 机票搜索网站对价格部分可以做的是对这些价格做一个曲线图,从而可以让用户对价格趋势有个直观的了解,另外趋势图上设鼠标热点,用户对曲线上哪个日期感兴趣,可以直接点击进入。


2008/10/22 杨威 <szy...@gmail.com>



--
Best Regards!
Jarvis (Zhiwei) Sun

郭军

unread,
Oct 22, 2008, 9:00:41 AM10/22/08
to tt...@googlegroups.com

http://www.ymdg.net/article/sort0182/sort0206/info-305.html

就是这个了,几个月前开始关注的,也在考虑做类似的分析,不过点击热区比较好做,就是通过SCRIPT事件发送异步请求传送点击坐标,但前边说的鼠标停留热区以及文中说的鼠标滑动轨迹的研究暂时还没有想到好的方法。

 


发件人: tt...@googlegroups.com [mailto:tt...@googlegroups.com] 代表 杨威
发送时间: 2008年10月22 18:27

收件人: tt...@googlegroups.com
主题: Re: 有没有大牛人能帮我们做一些数据挖掘的工作啊?

 

我确实是这个话题的发起者,我非常感兴趣中科院的这个解决方案,能不能告诉我是什么呢?

XL

unread,
Oct 22, 2008, 9:32:24 AM10/22/08
to ttnn BI 观点
I don't think ticket can be considered as a kind of 'future'. You can
not trade your ticket. You buy it , then it's yours.
Firstly, We have to know what variables will have impact to the price
of ticket (weather,oil price,specfic event, promotion,time frame,
tax ,etc...)
To be honest, I don't know excatlly why ticket price is changing all
the time, even within one day.
Once, I bought one ticket to Sweden on Day N. And N+1, airline gave
the promotion, the price fall to half. You can never forcast event
like this.
Take Beijing Olympicis as another example. At the beginning of 2008,
the price of ticket to China is really expensive for flight during
july and August. However,in May and Jue, a lot of airlines gave
promotions for the flight to China, even though the oil price was more
than $100 at that time. Really strange.

On Oct 22, 12:20 pm, "George Zhang" <birdzhangxi...@gmail.com> wrote:
> 嘿嘿我喜欢讨论这种问题
>
> 现在我们把机票看作是一种期货
> 那么机票的最终结算价格其实是由市场供需来决定的
> 即定价者明确知道自己的供给情况,在对市场的需求情况做了预测以后,可以定出机票的价格。
>
> 以上这些都是航空公司干的事情,现在qunar也要来干,那凭什么呢?
> 这里主要涉及的是两个因素,一个是供给,一个是需求
> 对于需求,qunar可以根据网站用户的使用情况来判断,那么供给呢?
> 就是航空公司现在的仓位空余,假设这个空余可以从该航班的票价趋势的出,即票价不断下降的我们认为他的供给过多
>
> *结论*:好像以前一个经济学家说过,所有的市场供需变化终究都会反映在价格上,所以qunar可以根据航班的历史价格来预测他的供给
>
> *问题*:价格对供需的,拍脑袋想一下应该是滞后的,如何可以在航空公司降价以前就预测到他要降价呢?
>
> 2008/10/22 杨威 <szy...@gmail.com>
>
>
>
>
>
> > 机票本身就是一个期货,到了时间兑现,但是中间不能交易的期货。
> > 买的是未来的服务,但是其定价的变化导致其本身就是一个对未来的预期。
>
> > 2008/10/22 George Zhang <birdzhangxi...@gmail.com>
>
> >> 难道你想搞机票期货交易?
>
> >> 2008/10/22 杨威 <szy...@gmail.com>
>
> >>> 针对某一天的的一个航班的价格是实时变化的,所以掌握未来的变化的可能性对用户来说是非常有价值的,我们寻找愿意和我们一起挑战这个项目,向用户提供更"聪明"-的支持的朋友。
>
> >>> --
> >>> 杨威
> >>> 中国*北京
> >>> =============================================================
> >>>http://www.qunar.com Think.Search.Travel
> >>> "去哪儿"旅游搜索 聪明你的旅行!
>
> >> --
> >> Best Regard
> >> George Zhang
>
> > --
> > 杨威
> > 中国*北京
> > =============================================================
> >http://www.qunar.com Think.Search.Travel
> > "去哪儿"旅游搜索 聪明你的旅行!
>
> --
> Best Regard
> George Zhang- Hide quoted text -
>
> - Show quoted text -

George Zhang

unread,
Oct 22, 2008, 10:07:38 AM10/22/08
to tt...@googlegroups.com
我现在想到的也就这么多了
建议找些搞过经济,金融的人来做这个事,这里面涉及的经济模型,和传统的BI应该有些差异

我个人还是不太赞同这件事情
试想最后如果这个能做成的话,是会反过来左右机票价格的

比如,已经有足够多的人相信你的预测,那么有一天你预测上海到北京的机票在5天后会降价,那么一部分人本来打算3天后出门的,也改到5天后了。

航空公司那里,3天后的机票没人坐,结果低价出售。如果航空公司聪明的话,他能预测到3号客流的推后(或者航空公司也关注你们的网站),就会抬高5号的票价,结果你的预测永远都是不准的

结论还是:这个命题有内在的矛盾
当你预测不准的时候,没有人理你
当你预测准了,相信你的人多了,你反过来影响市场,往与你的预测相反的方向偏移

一个解决方法:只对少量用户公开预测结果,并向这部分用户收费

怎么想都悬,祝你们好运啦

2008/10/22 杨威 <szy...@gmail.com>

杨威

unread,
Oct 22, 2008, 10:55:59 AM10/22/08
to tt...@googlegroups.com
呵呵,我觉得你的推理不是没有道理,但是我觉得这个事情还是可以做的,毕竟我们的用户还只是民航业旅客的百分之几。

2008/10/22 George Zhang <birdzha...@gmail.com>

LiAndy

unread,
Oct 22, 2008, 12:48:18 PM10/22/08
to tt...@googlegroups.com
恩,似乎很显然,George Zhang是学数学的(或者物理的),推理正确。
但如果预测只是为了适当的影响市场,从而产生一些经济效果的话,这中间只是牵涉到一些'平衡'的问题而已,最终的结果是要在挖掘后得到应得到的,而不只是一个挖掘过程,做到近似就很优秀了。
 
到底如何做?我想专业人士对业务需求深化下,抽取相关条件,似乎问题不复杂???
 

--
------Crazy in Silence. Silence in Crazy.------

兰德里尼

unread,
Oct 22, 2008, 8:36:00 PM10/22/08
to tt...@googlegroups.com
哈,突然就这么热闹了,不会是我匆匆忙忙抛出来的一块砖居然起了一些作用吧,呵呵
看到大家都在讨论,提两点看法:
1楼主来负责定期归纳每个人提出的需求,然后张贴上去,供大家进一步讨论明确
2关于用这些数据来挖掘什么?这需要先来明确。已经看到有相关专业人士就各自
  熟悉的领域展开较为细致的描述,网站流量,用户行为等等,包括楼主希望的价格预测
  但是我觉得应该大致先确定几个方向,然后分别讨论,如果大家兴致高昂,可以分成几个贴
  来进行,这样会比较清爽,否则比较混乱。


2008/10/23 LiAndy <netcl...@gmail.com>

兰德里尼

unread,
Oct 22, 2008, 9:14:32 PM10/22/08
to tt...@googlegroups.com
大致总结了一下各人说法,重新画了一下,供大家继续......

2008/10/23 兰德里尼 <zw8...@gmail.com>
价格预测 V2.jpeg

杨威

unread,
Oct 22, 2008, 10:55:33 PM10/22/08
to tt...@googlegroups.com
非常感谢兰兰,我觉得在这里的这一轮讨论让我受益匪浅,我会按照你的期望,回头一次性整理这里的所有内容,并形成一个新的题目,谢谢啦。
说心里话,我本身只是想做价格预测,但是我发现这里的朋友们非常深入了解的领域远远超出了这个范围,惊喜。


2008/10/23 兰德里尼 <zw8...@gmail.com>
Reply all
Reply to author
Forward
0 new messages