机器学习算法之贝叶斯分类初探

贝叶斯分类

Posted by Mark on July 17, 2018

贝叶斯分类

理论

贝叶斯公式

如下所言:

所求为后验概率,是通过样本无法数出来的。

公式推导基于样本独立,变为都是可以通过样本数出来的数据。

这样就可以根据现有的样本,样本所属的分类,就可以推测出新来的一个样本,所属的哪个分类的概率最大了。

例子1:

数据源:

 postingList = [[
        'my', 'dog', 'has', 'flea', 'problems', 'help', 'please'
    ], ['maybe', 'not', 'take', 'him', 'to', 'dog', 'park',
        'stupid'], ['my', 'dalmation', 'is', 'so', 'cute', 'I', 'love', 'him'],
                   ['stop', 'posting', 'stupid', 'worthless', 'garbage'], [
                       'mr', 'licks', 'ate', 'my', 'steak', 'how', 'to',
                       'stop', 'him'
                   ], ['quit', 'buying', 'worthless', 'dog', 'food', 'stupid']]
    classVec = [0, 1, 0, 1, 0, 1]  # 1 is abusive, 0 not
如下:

目标:
['love', 'my', 'dalmation']
one-hot向量之后:

贝叶斯计算