互联网行业的分析模型讨论

0 views
Skip to first unread message

19840814

unread,
Aug 27, 2008, 4:37:23 AM8/27/08
to ttnn BI 观点
看了qing的电信行业的分析模型应用这个话题,受益菲浅!
大家再探讨一下互联网行业的分析模型的相关应用吧~尤其是针对电子商务模式的分析,现在很火!我先抛出几个~

营销推广趋势分析
B2B模式下基于上下游元素不同类产品的推荐引擎;
B2B/C2C模式下基于同类产品的推荐引擎;
C2C模式下基于用户消费习惯的不同类产品推荐引擎;
赠送(优惠)敏感性模型


大家畅所欲言吧~特别是有过互联网行业工作经验的朋友们!

raullew

unread,
Aug 27, 2008, 4:47:57 AM8/27/08
to ttnn BI 观点
广告计算投放?

李瑞强

unread,
Aug 27, 2008, 4:46:25 AM8/27/08
to tt...@googlegroups.com
C2C模式下基于用户消费习惯的不同类产品推荐引擎;

产品推荐和用户导向,是目前社区网站和c2c、b2c网站比较迫切的需求,是提升网站核心价值的重要途径
这方面国内做的比较好的好像不多,大部分处于探索阶段

jun.sky

unread,
Aug 27, 2008, 5:02:20 AM8/27/08
to tt...@googlegroups.com
是的,淘宝有做一些!不过只是很粗糙的一部分!大家有兴趣可以去体验一下!收藏部
分做了不同类别的推荐,具体算法还不是清楚!如果有淘宝的朋友可以分享一下!

-----邮件原件-----
发件人: tt...@googlegroups.com [mailto:tt...@googlegroups.com] 代表 李瑞强
发送时间: 2008年8月27日 16:46
收件人: tt...@googlegroups.com
主题: Re: 互联网行业的分析模型讨论

C2C模式下基于用户消费习惯的不同类产品推荐引擎;

产品推荐和用户导向,是目前社区网站和c2c、b2c网站比较迫切的需求,是提升网站核

李瑞强

unread,
Aug 27, 2008, 5:06:02 AM8/27/08
to tt...@googlegroups.com
是,从淘宝的职位招聘需求能看出来,他们经常大量招聘数据仓库和数据挖掘工程师

jun.sky

unread,
Aug 27, 2008, 5:22:07 AM8/27/08
to tt...@googlegroups.com
大家继续吧~给出一些好的idea和以往的经验!
我继续帖出一些想法,有借鉴或者说抄袭的嫌疑,哈哈!

收费产品分类营销
客户生命周期管理
收费产品生命周期模型(对于产品的把握)
客户流失模型(对历史数据做分析,进而作出预测)
客户细分模型,可按内容进行营销(按用户访问的网站对象的类别和访问行为对用户分
类,对于较大的门户网站如sina可能很有用)
交叉销售模型(新业务的推广,新产品的推荐)
网络营销报告(针对电子商务行业,包括行业均值,高端用户运营特点分析;给销售\给客
户\给服务人员)


-----邮件原件-----
发件人: tt...@googlegroups.com [mailto:tt...@googlegroups.com] 代表 李瑞强
发送时间: 2008年8月27日 17:06
收件人: tt...@googlegroups.com
主题: Re: 互联网行业的分析模型讨论

EC

unread,
Aug 27, 2008, 5:09:27 AM8/27/08
to ttnn BI 观点
一个带有‘骚扰’性质的问题:我下载不了ttnn groups的pdf文件,具体情况不清楚,哪位朋友能帮忙下,把所有pdf打包,供下载,这些讨论
很具有价值啊。

李瑞强

unread,
Aug 28, 2008, 6:58:54 AM8/28/08
to tt...@googlegroups.com
现在淘宝做BI和数据挖掘的团队有多少人?
有淘宝的兄弟吗?

shzxqdj

unread,
Aug 28, 2008, 9:53:41 PM8/28/08
to ttnn BI 观点
上面大家说得都不错,不过这些应用放在互联网行业之外也可以应用,所以算是通用型的问题,很好.
另外,搜索引擎行业中广告的竟价排名的分析现在也在开始有尝试了,比如竟价业务性价分析需求(比如关键词,排位,广告标题,广告语,该关键词指向的
url等等发现最佳性价比的广告指标,这个模型可以为广告客户提供优质的建议和选择),广告标题和文字内容的语义对客户点击率的影响,里面可以有很多值
得研究的地方,

raullew

unread,
Aug 28, 2008, 11:04:43 PM8/28/08
to ttnn BI 观点
你说的那个是广告公司研究的
互联网公司做的是根据效果的排序浮动,客户买不相关的关键字是他的自由,只要他出得起价钱并且广告效果好
> > 大家畅所欲言吧~特别是有过互联网行业工作经验的朋友们!- 隐藏被引用文字 -
>
> - 显示引用的文字 -

Hawking, Bin

unread,
Aug 29, 2008, 1:36:01 AM8/29/08
to ttnn BI 观点
基于数据挖掘的SEO/反SEO
基于数据挖掘的IDS/网络攻击
基于数据挖掘的SPAM识别/SPAM生成
基于数据挖掘的分布式自动枪文发布/枪手识别
基于数据挖掘的流行话题识别或预测或创造
基于数据挖掘的信息协同过滤与整合
基于数据挖掘的网友关联分析
...
......

shzxqdj

unread,
Aug 29, 2008, 1:40:37 AM8/29/08
to ttnn BI 观点
"流行话题识别或预测或创造",这个太有意思了,非常想知道流行话题如何预测,能分享一下研究思路吗?谢谢

19840814

unread,
Aug 29, 2008, 1:46:37 AM8/29/08
to ttnn BI 观点
另外,我对
SEO/反SEO ,
信息协同过滤与整合
网友关联分析
这三个比较有现实意义的主题分析比较感兴趣
不知能不能就算法和实现过程展现深入探讨!
谢谢!

On 8月29日, 下午1时36分, "Hawking, Bin" <binhawk...@gmail.com> wrote:

raullew

unread,
Aug 30, 2008, 6:12:00 AM8/30/08
to ttnn BI 观点
seo和协同过滤都可以google
sns目前最典型的是校内把校园泡妞关系搬上网站,baidu和sina也在依托博客搞,看看最近在玩病毒营销的开心网就知道运营的力量>>关联分析
> > ......- 隐藏被引用文字 -
>
> - 显示引用的文字 -

Hawking, Bin

unread,
Aug 31, 2008, 10:12:40 PM8/31/08
to ttnn BI 观点
网友关联就是给一个网络用户找到他可能喜欢的另一个用户。这可以通过BLOG、浏览、阅读、兴趣表等方面或多方面综合来判断。比如BLOG聚类,根据博
文文字,文以类聚。如果是内容聚类,这个比较简单。复杂的话可以考虑文风和性情。挖掘之后,可以告诉用户,哪些BLOG和你的很相似。对读者也有类似的
推荐阅读功能。相信大家都会感兴趣。BLOG之间的现在链接也是可以利用的,通过关联分析,了解一类人喜欢哪几类人。比如IT wsn喜欢加美女为友,
喜欢群聊8g话题;投行的喜欢名牌和泡高档吧。还有可以利用用户的读书、购物记录,进行关联。比如对一个豆瓣或facebook用户,找和她看同类的书
/电影/音乐的潜在朋友。(注意,是“同类”,这就先有个对项目聚类的任务。)这个可以通过这些网站提供的API读取用户数据,然后进行数据挖掘。

我与互联网还有些交错合离的经历。中国第一个千万用户级电子邮箱coremail和163.net是我的高一界的师兄在大学期间开发和创立的,有些大网
站也在用这套系统。我的同学在网易还只是几个人的时候,在丁前首富那里兼职。不过我剑走偏锋,没做热门技术,而是去做BI。我也做过网站,觉得当时的开
发语言和工具要改进的地方太多了。果然后来几年互联网应用开发技术和工具有了很大的进步;但还是不够。不过,我亲历电信交换机上的应用开发后,才知互联
网开发再怎么原始,还是比电信要灵活得多。

我也做过电信业的BI。电信业与互联网其实是两回事。互联网是极度开放的,在技术上来说,平台往往自己掌握的,必要时会改写操作系统、数据库、中间件
等,很多公司也这样做过。在运营手段上来说,也是不管3721,无所不用其极。尤其在数据上,获取的手段也很多。永远不要满足于手头上的数据,也不要限
于现有技术能收集到的数据。总可以设法拿更多的数据,必要时可改写网络服务器来增加数据采集点。AOP(aspect oriented
programming)之类的框架技术也使数据捕获的开发更为简单。另外还要特别注意“互联”二字。在服务上,按web 2.0的概念,多个网站可以
联合起来提供服务。现在越来越多的网站开放RSS/API或web services,供第三方运用。数据上更是一片公海,只要有能力,小公司也可以爬
整个互联网的超文本数据。就算是别国的领海,或者是用户的桌面行为,也照样有办法搞到数据。独立的互联网数据供应与分析公司也会越来越多。

前面有人讨论BI项目的价值。在互联网是快鱼吃慢鱼。BI是产业链整合中的神经线和反射弧,它价值是缩短企业反应时间。对互联网内容提供者来说,非常关
键的其中一点是做市场变化的快速反应者。如果ETL三周,挖掘建模三周,新产品开发三周、部署三周,这时市场早从6000点变到3000点,功夫白费
了。要把三个月压缩成三天。一个热点出现,马上就推出新产品。这就要更多的IT介入,并且IT系统全线整合。(整合才实现价值。)IT技术应用的目的,
就是要在成本可控的条件下,尽量地快。业务人员很有经验,但处理大量情景时很慢,就用机器做,哪怕粗糙一点。精确的算法准确度高5%,但多运行三个小
时,就改用简单的算法。只要能达到目的,不拘一格。数据挖掘也只是一个环节或一个手段。而且数据挖掘也不必是一个独立的部门,实际中经常是要无缝嵌到事
务系统里。

另外几个分析题目迟些再写...仅是抛砖引玉,大家指正。
Reply all
Reply to author
Forward
0 new messages