作者:杨生
链接:https://www.zhihu.com/question/481002759/answer/2071357318
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
从中文看,"协"是什么意思?相互的意思,自己与自己就是方差,和别人就是协方差
即D(X)=Cov(X,X)
当然从数据角度看,因为D(X)=E(X-EX)^2,即变量X与其中心点EX距离的平方的均值,所以变量X的取值越分散,即X-EX越大,所以方差DX越大,即方差反应了X的离散程度。比如你班上同学的年龄,大家差不多大,所以你班上同学年龄的方差就小,但如果把你们任课老师加入其中,则年龄波动范围就大多了,此时方差也比原来大
至于协方差,其本意是用来描述两个随机变量之间关系的一个量。在概率中,学随机变量及分布的时候,我们都学过一个概念:随机变量的独立性。为什么要引入独立性概念呢?简单的说就是为了计算简单,否则高维时,计算量会呈指数增长。但要验证随机变量是否独立,是一个很难的事情,需要分布函数(分布律,或密度函数),那么概率学家就想能否用一个数值来判断两个随机变量是否独立?当然这个设想还是没有完全成功,但部分成功了(就像伟哥,本来是为了治疗心血管方面疾病的,没想到且有更伟大的应用)。那就是发现可以用协方差来反映两个随机变量是否存在线性关系?(很自然的结果,因为期望就是一个线性算子)。
打字好麻烦,想起来你是高中生,这些字应该是白打了,因为以你的数学基础,基本上不可能看懂