下面是我想到的心得:所谓幂律分布、无尺度分布、分形分布、Zipf律分布等等,其实基本上都是一回事情,就是在双对数坐标系上面画出来是一条直线,简言之,x和y乘起来要是一个定值,这样取对数以后加起来才是定值,才会是一条直线。
在分布曲线上,x轴表示的是数量(概率),y轴表示的是大小,x和y乘起来是定值就是说大小乘上概率是定值。符合这个条件的分布就是无尺度的,这个意思不容易理解,现在举一个直观的例子:
取一叠圆形的纸,每一张都是一样大小的圆形。现在把这些纸剪开,第一张不动,第二张剪成两个半圆形,第三张剪成四个等大的扇形,第四张剪成八个扇形……
这样剪好以后再照原来样子叠在一起,再取一根长针,从上面戳下去,肯定每一层都有且只有一个分割被戳到。请注意:分割的大小乘上分割的数量为定值,(比如第三层,每一个扇面只有1/8的大小,被戳到的机会也是1/8,但是却有8个扇面,乘起来正好是1)所以在这种情况下面,无论分割大小,被选中的机会是相等的。
现在再把所有的这些大大小小的扇面全部摊平到一张大桌子上面,稍微想一想就知道,虽然只选一个,但是不管大小,被选中的机会还是相等的。(所以你不能通过观察得知分布的尺度)。这就是幂律分布!
各种大小的扇面被选中的机会相等,所以说是无尺度分布;每个扇面都是一个圆不断“分”分出来的,所以说是分形分布。至于Zipf律,你只要把圆的大小当成单词的长度理解,就可以得到了。(这也就是说单词的长度不包含信息)从记忆的角度说,也可以知道记长的单词肯定难记,所以长单词少,短单词多(最小化记单词的成本)。
也容易直观的知道,在这种情形底下,几何平均值是固定的(因为都是一个大圆的相等分割么,乘起来再开方,算来算去都是1,呵呵),所以限定几何平均值必然得到幂律分布。
继续再说分形的维度,所谓维度,就是上面剪纸片例子里面,上一层和下一层纸片数量的倍数(维度=2),维度是很有意思的东西。要能够以最短方式描述一个系统,你的描述维度一定要等于生成的维度,多了少了都不行。举个猜电话号码的例子,最好的办法是一次猜1个号码,每次有10个选项。至于实际情况维度为什么是一个确定的值,比如2.2,这是另外一个更加有意思的问题。这里就不多展开了。
--
You received this message because you are subscribed to the Google Groups "热力学与进化论" group.
To post to this group, send email to ci-en...@googlegroups.com.
To unsubscribe from this group, send email to ci-entropy+...@googlegroups.com.
For more options, visit this group at http://groups.google.com/group/ci-entropy?hl=en.
-----原始邮件-----
发件人:"东方隐" <dfy...@hotmail.com>
发送时间:2010年3月2日 星期二
收件人:ci-en...@googlegroups.com
主题:对幂律分布的一个介绍
--
You received this message because you are subscribed to the Google Groups "热力学与进化论" group.
To post to this group, send email toci-en...@googlegroups.com.
To unsubscribe from this group, send email to ci-entropy+unsub...@googlegroups.com.