本文继上篇介绍离散数据的生成模型之后,介绍针对连续数据的生成模型。本篇博文主要介绍五点:首先我们会介绍一下Gaussian Distribution的基础知识以及对于Gaussian分布的MLE估计,第二部分我们则会着重介绍Gaussian Discriminant Analysis,紧接该部分之后,第三部分我们会介绍基于Gaussian联合分布的Inference;第四部分我们介绍Linear Gaussian Systems,最后一部分我们给出针对高斯分布参数的估计方法。
Read More本文主要就分布式存储的相关基础知识进行了梳理,分部分分别介绍了分布式系统的基本问题,单机存储系统、分布式系统的相关性能指标、分布式协议等,本文仅作为分布式计算与存储的入门材料,之后我们将从论文和源码两方面对分布式计算与存储的相关理论与实践进行更为深入的探讨。
Read More二 04 三月 2014
Filed under Machine Learning
Tags Machine Learning Classfication Generative Models Mutual Information
本文为机器学习系列第二篇,主要研究一下离散数据生成模型。我们会介绍两种模型,一为Dirichlet-multinomial model,一为朴素贝叶斯分类器(Naive Bayes Classfier,NBC),最后我们介绍一下关于互信息的基本知识以及将其用于特征选择。
Read More本文作为本博客的第一篇博文,简单说明了创建这个博客的目的;同时作为机器学习系列的第一篇,对决策树中的ID3和C4.5算法进行了梳理,对于ID3算法,我们给出了Python源码实现。
Read More