遇到一个数值分析的技术问题,看看大家有没有遇到类似的,探讨一下解决方法。
通常我们可以通过肉眼可以直观地区分出一些数值序列的变化,将它们做成柱图或曲线图可以一眼看出其中差别,但如果要分析大数据,不能总是肉眼看,需要用“变量”来区分他们。现在我遇到两种情况需要用变量来区分数值变化的不同方面。
一种是反应数值变化的平稳度。比如一个数值序列,有24个值(一天里每个小时的度量),值的区间假设已经转换到在0和100之间了。于是,通过图形,可以直观地发现可能存在如下形态的平稳度变化。如下图:
平稳、起伏、突变和孤峰。这纯粹是从图形的形态人工区分的,但如何设计变量呢?有人告诉我可以用方差,说方差可以表明每个值对平均值的偏离程度,可是我拿不准方差真的能区分出这四种形态吗?还是只能区分出某一种?如果可以区分,是否有人可以用具体的例子来说明一下。
这是第一个问题。另一个问题是要反应数值序列的规律性。
假设一个数值序列,有30个值,通过曲线形态,可以明显看到有的呈现周期性规律,按周变化起伏,有的则没有那种起伏。如下图:
要说周期性变化,可能还有更丰富的,比如按照3天一周期,或10天一周期。但为了简化,可以先考虑如何用变量表示是否按周变化吧。在进一步考虑,如何表示是否存在周期性,周期是多少。
以上数值序列的两个方面,如何用一个变量(或多个)来表示?请大家出谋划策。