ML_and_BA
机器学习与商业分析
Monsanto Example
- Func: 播种、施肥、灌溉、病虫害防治
- Data: 气象、天气、降雨、地质土壤调查==>预测未来对农业生成造成破坏的情况,帮助农民预测作物产量
Solve Problem
Generative Model
- 案例: 通过降水、温度、土壤情况等多维数据,来预测是否该浇水(施肥\灭虫)
- 数据收集与构成:
- 收集浇水前和未浇水前n天的降水, 温度 ,土壤生化信息, 形成
$X:{降水, 温度, 土壤生化信息} C:{是否病虫害}$
- 收集浇水前和未浇水前n天的降水, 温度 ,土壤生化信息, 形成
- 标签: $C={c_1,c_2}$
- 输入数据(特征): $X={x_1,x_2,…,x_n}$
- 目标: 二分类 $P(C|X)$
- 采用贝叶斯模型: $P(c_1|X)=\frac{P(X|c_1)P(c_1)}{P(X|c_1)P(c_1)+P(X|c_2)P(c_2)}$
- 假设$c_1$类别输入训练数据的分布:$X\sim N(\mu,\Sigma)$ 【独立同分布】(输入样本$X$的特征向量,输出从该分布中被取样出的概率,即$P(X|c_1)$)
- 极大似然估计: 通过极大似然估计找到数据处于某一分布概率最大的分布.
- $L(\mu,\Sigma)=\prod{k=1}^{n} f{\mu,\Sigma}(x^k)$
- $\mu^{},\Sigma^{}=argmax_{\mu,\Sigma}L(\mu,\Sigma)$【在这种参数情况下,产生$c_1$样本的概率是最大的】
- 由$\mu^{},\Sigma^{}$即可得$P(X|c_1)$
- 通过$P(c_1|X)=\frac{P(X|c_1)P(c_1)}{P(X|c_1)P(c_1)+P(X|c_2)P(c_2)}$计算类别概率
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!