两种错误

我们应该相信白噪声还是怀疑白噪声?

下面谈论的观念可能是信息准则的一个朴素表达吧。

当数据量很小的时候,容易产生虚假的趋势,让我们认为不是白噪声。例如取白噪声里的两个点,就数值而言,第二个点要么比第一个大,要么比第一个小。如果我们只能观察到他们的实现,我们会判断他有增加或者降低的趋势。所以这时要怀疑不像是白噪声的数据是白噪声。当数据量很大的时候,每个数据点的贡献都很小,稀疏的季节性趋势可能被淹没在背景噪声里。 所以可能需要怀疑判定为白噪声的数据并非白噪声。并没有任何“通用的”、发现“合适的”数据量的方法。

对数据的对数和差分处理同样引入自相关,做何种处理完全是知识导向的,并且以建模的方便为原则。

对白噪声的信赖是操作意义上的,它无关模型的好坏,只关乎模型的可行性。

从实用主义的角度,我们还可能想问这样一个问题,那就是识别出白噪声中逻辑上或者真实世界中不是白噪声的微小组分,是否能对预测效果有任何提高。最近比较懒,事情也很多。所以不做仿真了,采用思想实验的方法来探讨这个问题。这个问题和带漂移项的随机游走很像,正着来可以,反着来就很难把漂移项提出来。但是用不用漂移项的预测效果和数据的性质有关。总之在对数据的内部逻辑知之甚少的情况下,即使预测效果有任何提高,也不能显著的检测出来。

看来问题的症结回到了令人苦恼的哲思:不显著的东西存不存在。应该警觉:显著的东西也只是大概率存在。这就是在事实真值和逻辑真值之间横亘的一道鸿沟。之前读到尼森古德曼关于反事实条件句的探讨,只觉得是胡说八道,现在联想到查尔默斯论科学哲学的时候对贝叶斯观点和归纳、推断、预测的联系的探讨,仿佛自己的理解又深了一层。

古德曼认为我们在归纳难题上成果甚微,而我感到不显著其实是在说人类在这个假设检验问题上的无能。所以存不存在,任君选择。当做不存在,世界更简单。如果复杂的“建模一通”能使人产生美妙的幻觉,增加效用函数的值,何乐而不为?只是如能平常对待个体和学派间的差异,便天下太平。但天下太平则世界终结,从这个意义上说,我尤为钦羡布莱克费雪的眼界——世人痛恨噪音,而依赖噪音生存。

发表评论

电子邮件地址不会被公开。 必填项已用*标注