Statistics

Tell It by Myself…

前情提要

如果是 已知确定的, 是变量,这个函数叫做概率函数 (Probability Function),它描述对于不同的样本点 ,其出现概率是多少。

如果 是已知确定的, 是变量,这个函数叫做似然函数 (Likelihood Function), 它描述对于不同的模型参数,出现 这个样本点的概率是多少。

例题

假如有一个罐子,里面有黑白两种颜色的球,数目多少不知,两种颜色的比例也不知。我们想知道罐中白球和黑球的比例,那如何不全部倒出来数,就能知道它的总数呢?现在我们可以每次任意从已经摇匀的罐中拿一个球出来,记录球的颜色,然后把拿出来的球再放回罐中。这个过程可以重复,我们可以用记录的球的颜色来估计罐中黑白球的比例。假如在前面的一百次重复记录中,有七十次是白球,请问罐中白球所占的比例最有可能是多少?

现在令在一百次抽样中,七十次是白球的, 三十次为黑球事件的概率是 P (样本结果|Model)

P(样本结果|Model)&= P(x1,x2,…,x100|Model)\\ &= P(x1|M)P(x2|M)…P(x100|M)\\ &= p^{70}(1-p)^{30}. \end{align*}

MLE 看似复杂,实则只需对 求导,让这个样本结果出现的可能性最大,这就是 MLE 蕴含的意思。

承上启下,继续看 Box-Cox Transformation


Reference