ML_and_BA

机器学习与商业分析

Monsanto Example

  • Func: 播种、施肥、灌溉、病虫害防治
  • Data: 气象、天气、降雨、地质土壤调查==>预测未来对农业生成造成破坏的情况,帮助农民预测作物产量

Solve Problem

Generative Model
  • 案例: 通过降水、温度、土壤情况等多维数据,来预测是否该浇水(施肥\灭虫)
  • 数据收集与构成:
    • 收集浇水前和未浇水前n天的降水, 温度 ,土壤生化信息, 形成
      $X:{降水, 温度, 土壤生化信息} C:{是否病虫害}$
  • 标签: $C={c_1,c_2}$
  • 输入数据(特征): $X={x_1,x_2,…,x_n}$
  • 目标: 二分类 $P(C|X)$
  • 采用贝叶斯模型: $P(c_1|X)=\frac{P(X|c_1)P(c_1)}{P(X|c_1)P(c_1)+P(X|c_2)P(c_2)}$
  • 假设$c_1$类别输入训练数据的分布:$X\sim N(\mu,\Sigma)$ 【独立同分布】(输入样本$X$的特征向量,输出从该分布中被取样出的概率,即$P(X|c_1)$)
  • 极大似然估计: 通过极大似然估计找到数据处于某一分布概率最大的分布.
    • $L(\mu,\Sigma)=\prod{k=1}^{n} f{\mu,\Sigma}(x^k)$
    • $\mu^{},\Sigma^{}=argmax_{\mu,\Sigma}L(\mu,\Sigma)$【在这种参数情况下,产生$c_1$样本的概率是最大的】
  • 由$\mu^{},\Sigma^{}$即可得$P(X|c_1)$
  • 通过$P(c_1|X)=\frac{P(X|c_1)P(c_1)}{P(X|c_1)P(c_1)+P(X|c_2)P(c_2)}$计算类别概率

本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!