肉鸡企业的数据挖掘——国内第一个

3 views
Skip to first unread message

Franc Fu

unread,
Sep 21, 2008, 9:41:22 PM9/21/08
to tt...@googlegroups.com
在BI人聚会的时候我就和大家讲过我老板的项目,但是那个时候我理解不深,讲的也不够透彻,刚好前短时间都在讲行业应用模型,现在也顺便也再说说。这个项目应该是肉鸡企业国内第一案例了,为什么敢这么说呢:
 
第一,和我们项目合作的企业是亚洲最大肉鸡企业,从91年开始和我们学院合作建设信息系统,目前的数据量应该国内同行最大最完整。而其他企业,应该没有这个规模
第二,能够意识到数据挖掘,意识到从数据中挖掘规律的肉鸡企业就更少了,再能够拿钱出来的也更少了
第三,也许我们目前还没有看到相关的报到。
 
下面说说我们具体做什么吧:
 

利用数据挖掘技术,对肉鸡企业肉鸡养殖的生产和经营的海量历史数据进行深度分析,寻找到一些事先无法预知的、用传统统计方法不能得出、有着潜在应用价值的知识,用以指导生产和经营,进而为决策提供辅助支持。本项目的内容包括下列四个研究主题:

(1)预测肉鸡品种结构对经济效益的影响。

以市场为导向、优化品种结构、建立能够适应市场需要的肉鸡品种体系,是养鸡业发展的决定性因素之一。节粮型、块大型肉鸡品种更符合节约型社会的发展趋势;但饲料报酬效率较低的优质型肉鸡仍有相当的市场容量和较好的经济效益;不同肉鸡品种在不同地区受欢迎程度与生产成本存在差异。项目拟建立"品种--市场--成本"三者关联的模型,预测肉鸡品种结构对经济效益的影响。

(2)研究季节性因素对肉鸡生产的影响。

影响养鸡业生产因素众多,包括季节、疾病、天气、饲料配方、生产方法、生产过程等,其中季节对生产影响明显。如每年三、四月份多数养鸡户的养鸡效率低:上市率下降、次鸡率上升和料肉比上升。这是普遍但非绝对的现象。项目拟通过比对不同养鸡户的生产数据,有针对性地寻找和挖掘影响生产的关键因素,研究季节性因素对养鸡业生产的影响。

(3)建立肉鸡疾病发病规律的预测模型。

禽病预防与控制是影响养鸡行业经济效益的重要因素,在特定情况下还对社会的食品安全产生影响。禽病种类众多,主要与季节、地区因素,同时也与饲养环境、免疫程序与消毒规程、养殖场管理水平、养殖品种等因素有关。项目拟建立肉鸡疾病发病规律的预测模型,实现对肉鸡疾病的有效预防与控制。

(4)建立肉鸡价格与生产规模的动态模型。

肉鸡的市场容量与价格随季节变化,随节假日波动,遇重大突发事件(如非典、禽流感)出现较大波动,且在不同地区呈现有差异的规律。本项目拟建立肉鸡价格与肉鸡养殖规模的动态模型,指导企业能够因季节变化而主动地、有效地调整生产规模与品种布局,提高经济效益、规避市场风险。

要重点解决的技术关键问题:

(1)肉鸡生产和经营的历史数据的预处理和质量保证。

(2)根据肉鸡养殖的生产和经营的历史数据,设计数据挖掘的模型和算法。

(3)对挖掘模型和算法的评价。

(4)对挖掘所得到的知识的有效表达。

--------------------------------------------
我自己是处在第四个主题中,我的毕业论文也是,肉鸡价格的预测模型,会用到ARIMA、神经网络,支持向量机等等,目前进展不快,因为出来实习了。整个项目应该都会用到分类、聚类、关联规则、时间序列等等一些传统的挖掘技术。其中我们最难的就是理解肉鸡行业的背景知识和潜规律了,只知道小时候家里养过鸡,可没见过年产6亿只以上的,好好挖吧。不知道大伙对我们项目有和看法和见解?
--

shzxqdj

unread,
Sep 21, 2008, 10:59:38 PM9/21/08
to ttnn BI 观点
这个讨论很好玩,有挑战性,先谈谈个人的浅见。
首先,Franc fu说该亚洲最大肉鸡企业目前的数据量应该国内同行最大最完整。我们先要确认,这些数据不仅只关注有关该企业的数据,还应该包含个地
区市场的数据(即必须包含竞争对手的数据),否则没法分析市场的。
项目一,拟建立"品种--市场--成本"三者关联的模型。这里对品种的描述可能不是简单的一个类别变量可以胜任的,是否是对品种的描述要通过一组指标来
描述,比如从出栏时间、饲料消耗水平、脂肪比重,等等考虑。我觉得该项目关键是找到足够、充分的上述三个大类指标的不同维度的子指标,才能有效分析。
项目二,研究季节性因素对肉鸡生产的影响。如果数据来自不同养鸡户的数据,那如何定义这些不同企业的生产环境和管理因素,有什么客观指标?这样看来,只
分析该亚洲最大肉鸡企业自己内部的数据可能比较合理,也有意义。这个项目相对而言,比较容易,只要用户能积极参与进来,贡献他们的行业经验和知识。
项目三,拟建立肉鸡疾病发病规律的预测模型,实现对肉鸡疾病的有效预防与控制。 模型可以发现的可能是有规律的发病(应该都不是大的威胁),类似大规模
禽流感的发生可能是某个特殊环节的偶然发生,这种灾难模型可能无能为力,另外灾难的数据毕竟太少,也无法建模。
项目四,拟建立肉鸡价格与肉鸡养殖规模的动态模型,指导企业能够因季节变化而主动地、有效地调整生产规模与品种布局¬,提高经济效益、规避市场风险。这
一定涉及到整个市场的数据(包含竞争对手的数据,以及市场供应的数据,而不仅仅只是销售数据)。这个项目也很有意义,类似于根据市场价格、供应等来预测
未来某时间可能销量),因为涉及到竞争对手的博弈,考虑的东西很多,有挑战性。
一孔之见,欢迎批评。


On 9月22日, 上午9时41分, "Franc Fu" <happyfr...@gmail.com> wrote:
> 在BI人聚会的时候我就和大家讲过我老板的项目,但是那个时候我理解不深,讲的也不够透彻,刚好前短时间都在讲行业应用模型,现在也顺便也再说说。这个项目应该­是肉鸡企业国内第一案例了,为什么敢这么说呢:
>
> 第一,和我们项目合作的企业是亚洲最大肉鸡企业,从91年开始和我们学院合作建设信息系统,目前的数据量应该国内同行最大最完整。而其他企业,应该没有这个规模
> 第二,能够意识到数据挖掘,意识到从数据中挖掘规律的肉鸡企业就更少了,再能够拿钱出来的也更少了
> 第三,也许我们目前还没有看到相关的报到。
>
> 下面说说我们具体做什么吧:
>
> 利用数据挖掘技术,对肉鸡企业肉鸡养殖的生产和经营的海量历史数据进行深度分析,寻找到一些事先无法预知的、用传统统计方法不能得出、有着潜在应用价值的知识,­用以指导生产和经营,进而为决策提供辅助支持。本项目的内容包括下列四个研究主题:
>
> (1)预测肉鸡品种结构对经济效益的影响。
>
> 以市场为导向、优化品种结构、建立能够适应市场需要的肉鸡品种体系,是养鸡业发展的决定性因素之一。节粮型、块大型肉鸡品种更符合节约型社会的发展趋势;但饲料­报酬效率较低的优质型肉鸡仍有相当的市场容量和较好的经济效益;不同肉鸡品种在不同地区受欢迎程度与生产成本存在差异。项目拟建立
> "品种--市场--成本"三者关联的模型,预测肉鸡品种结构对经济效益的影响。
>
> (2)研究季节性因素对肉鸡生产的影响。
>
> 影响养鸡业生产因素众多,包括季节、疾病、天气、饲料配方、生产方法、生产过程等,其中季节对生产影响明显。如每年三、四月份多数养鸡户的养鸡效率低:上市率下­降、次鸡率上升和料肉比上升。这是普遍但非绝对的现象。项目拟通过比对不同养鸡户的生产数据,有针对性地寻找和挖掘影响生产的关键因素,研究季节性因素对养鸡业­生产的影响。
>
> (3)建立肉鸡疾病发病规律的预测模型。
>
> 禽病预防与控制是影响养鸡行业经济效益的重要因素,在特定情况下还对社会的食品安全产生影响。禽病种类众多,主要与季节、地区因素,同时也与饲养环境、免疫程序­与消毒规程、养殖场管理水平、养殖品种等因素有关。项目拟建立肉鸡疾病发病规律的预测模型,实现对肉鸡疾病的有效预防与控制。
>
> (4)建立肉鸡价格与生产规模的动态模型。
>
> 肉鸡的市场容量与价格随季节变化,随节假日波动,遇重大突发事件(如非典、禽流感)
> 出现较大波动,且在不同地区呈现有差异的规律。本项目拟建立肉鸡价格与肉鸡养殖规模的动态模型,指导企业能够因季节变化而主动地、有效地调整生产规模与品种布局­,提高经济效益、规避市场风险。
>
> 要重点解决的技术关键问题:
>
> (1)肉鸡生产和经营的历史数据的预处理和质量保证。
>
> (2)根据肉鸡养殖的生产和经营的历史数据,设计数据挖掘的模型和算法。
>
> (3)对挖掘模型和算法的评价。
>
> (4)对挖掘所得到的知识的有效表达。
> --------------------------------------------
> 我自己是处在第四个主题中,我的毕业论文也是,肉鸡价格的预测模型,会用到ARIMA、神经网络,支持向量机等等,目前进展不快,因为出来实习了。整个项目应该­都会用到分类、聚类、关联规则、时间序列等等一些传统的挖掘技术。其中我们最难的就是理解肉鸡行业的背景知识和潜规律了,只知道小时候家里养过鸡,可没见过年产­6亿只以上的,好好挖吧。不知道大伙对我们项目有和看法和见解?
> --

George Zhang

unread,
Sep 21, 2008, 11:33:56 PM9/21/08
to tt...@googlegroups.com
...会用到ARIMA、神经网络,支持向量机...
...整个项目应该­都会用到分类、聚类、关联规则、时间序列等等一些传统的挖掘技术。...

其实这种项目,好像和算法没什么关系
业务模型是最重要的

肉机养殖的终极目的是用最少的钱,养最肥的鸡(体重)?还是养最多的鸡(鸡翅膀的个数)?,或者同时满足

明确目标以后,再看那些因素会影响到鸡的体重增加,和繁殖率等等

看上去还真是一个大项目
不知现在进展如何啊

2008/9/22 shzxqdj <shz...@163.com>



--
Best Regard
George Zhang

Franc Fu

unread,
Sep 22, 2008, 12:13:20 AM9/22/08
to tt...@googlegroups.com
我来试着回答这些问题,大家的看法和建议我会汇总到我们项目组,然后也会把他们的意见汇总过来,我们项目有10多个人,四个博士相关专业毕业的老师,有副教授、教授、博导等,也有企业信息中心的老大,也是我们学院的副教授。
 
一、关于数据,主要是企业内部的数据,企业而又专门调查市场数据的人员,但是关于市场数据的完整性很难保证,数据粒度也不一样,因为大家都不会轻易让你得到这些数据,还有企业在全国有很多分公司,各个地区的数据也会有一些。
 
二、项目主题一,一个细分品种对应的相关指标比如从出栏时间、饲料消耗水平、脂肪比重在一定的管理水平下基本恒定的,当然这个指标数据都是有的,具体分析时可以考虑。

 三、项目主题二 ,这个主题确实有些麻烦,因为目前企业采用的是企业——农户的模式,企业提供技术和市场保证,而农户则只管养鸡,每个农户的具体季节性因素应该有差异,需要考虑这些差异对结果的影响成都,不过在同一个地方比如广州地区,可能差异应该不会很大。
 四、项目主题三、这个主题可能会放弃,一方面数据可能不太多,而且正如shzxqdj 所言很难预警重大疾病,一般的疾病技术人员一般根据经验就可以预警了
 
五,项目主题四,这个主题最有意义也最难,我们也是先做这个,一方面涉及的经济学的东西,我们项目里还没有经济学出身的,一方面虽然是亚洲最大但是市场份额确不占主导地位,就算是企业的老家地区也只有30%左右吧,而且很难获得其他企业(更多是小企业小散户)的数据,市场的供应量很难获得,这是难点所在。但是也有一些规律性的东西,企业内部的价格数据基本反应市场价格数据而且企业的价格数据更加完整,目前已经得出一些价格波动的规律,也得到企业的认可,但是没有重大的突破。中国肉鸡产业市场很不完善,刚刚开始走上市场道路,市场的运作并不是完全按照市场规律的走动,还有很多其他的因素,这也是难点,但是目前企业能够去做也已经是很好了,希望以后能够做的更好。
 
肉鸡产业确实有很多东西需要理解,有很多潜规律,下次我好好总结一下潜规律,但是我也知识了解皮毛,呵呵,希望大家一起讨论。
2008/9/22 shzxqdj <shz...@163.com>
> --

--
--~--~---------~--~----~------------~-------~--~----~
要在此论坛发帖,请发电子邮件到 tt...@googlegroups.com
要退订此论坛,请发邮件至 ttnn-uns...@googlegroups.com
更多选项,请通过 http://groups.google.com/group/ttnn访问本论坛
-~----------~----~----~----~------~----~------~--~---

Qing

unread,
Sep 22, 2008, 12:59:32 AM9/22/08
to tt...@googlegroups.com
我也觉得第四个东西有点意思,而前面几个,基本上是一种研究性而操作性不强的课题。(当然,如果从学术角度,可能不是这样认为。)因为,那三个得出的结论基本都是用于宏观决策的,而价格这个题目,相对微观点。

不过看起来franc的描述很官方,比如"更符合节约型社会...",建议可以从某个课题深入探讨。比如价格跟规模,应该是供需问题的衍生吧。你们的分析思路是怎样的呢?作些假设吧。

另外,这个肉鸡企业除了可以利用分析技术来辅助决策意外,也需要搞一些创新。搞出一些别的企业没有的东西,那是核心竞争力啊。平常的鸡只有两条腿,两只翅膀,突破一下,让鸡专门生四条腿,四只鸡翅的小鸡,这样效率就大大提高了。

2008/9/22 Franc Fu <happy...@gmail.com>
我来试着回答这些问题,...,...

Franc Fu

unread,
Sep 22, 2008, 1:48:59 AM9/22/08
to tt...@googlegroups.com
to George Zhang:
对的,业务模型最重要,这一点确实是,我们实际做得时候也是如此,并不局限于技术,能抓老鼠就好。
用最少的钱肯定的,成本越低越好嘛,但是也不是越多也不是越肥,而是生产不多不少的适合细分市场需求口味的鸡,这个够难了吧,多了卖不掉,也不好存储,贱卖就亏咯,少了就只能看着别人捞钱了,太肥了肉不好吃,太瘦了也不好吃没肉哈哈,你家的喜欢这个品种他就不一定了,对于养殖技术企业实力还是很强大,有博士站也有研究院。关键怎么抓住市场,这点就没那么容易了。
还有关于进展,学校的项目你别指望进展有多快,学校老师都是上课的带班的,并不是全力搞项目,而且还得写论文,能够应付企业的需求进度已经很ok了。其实项目不大的,毕竟这个行业不同,数据量不大的不到100g。
to qing:如果按照重要程度排序那就4 1 2 3了,难度也是4最大,看来一眼就可以看出官方的了,毕竟大家都讨厌虚头虚脑的东西,我是从项目书里拷贝的,没办法,你要得到省科技厅领导的钱就得这么写,。核心竞争力嘛,还不错,研究实力很强,不过真要搞出四条腿四只翅膀的鸡来大家也不敢吃了,变异的,哈哈。qing的想法就是怪,喜欢。哈哈
2008/9/22 Qing <happ...@gmail.com>
Reply all
Reply to author
Forward
0 new messages