spark机器学习--假设检验

适配度检验:验证观察值得次数分配和理论值是否相等

独立性检验:两个变量抽样到的观察值是否相互独立

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
//性别与左右利手之间的关系
scala> val sexinfo=linalg.Matrices.dense(2,2,Array(127,19,147,10))
sexinfo: org.apache.spark.mllib.linalg.Matrix =
127.0 147.0
19.0 10.0

scala> stat.Statistics.chiSqTest(se)
second seqToCharSequence sexinfo
//相关性比较
scala> stat.Statistics.chiSqTest(sexinfo)
res39: org.apache.spark.mllib.stat.test.ChiSqTestResult =
Chi squared test summary:
method: pearson
degrees of freedom = 1
statistic = 3.8587031204632654
pValue = 0.049488567227318536
Strong presumption against null hypothesis: the occurrence of the outcomes is statistically independent..
打赏
  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!
  • Copyrights © 2018-2020 丁振莹
  • 访问人数: | 浏览次数:

你的每一分支持,是我努力下去的最大的力量 ٩(๑❛ᴗ❛๑)۶

支付宝
微信