内容字号:默认大号超大号

段落设置:段首缩进取消段首缩进

字体设置:切换到微软雅黑切换到宋体

主页 > CDN >

腾讯云_3年a班百度云_速度快

2021-07-16 21:03 出处:欧普曼云计算 人气: 评论(0

嗨,伙计们!

在这篇博文中,我们将学习如何使用标准差去除数据集中的异常值,我们可以有一个样本数据集,用于所有年份的产品销售。

在进入主题之前,我们应该知道什么是异常值以及为什么使用它。离群值是位于特定值范围之上或之下的值。例如,考虑数据集(20,10,15,40200,50),所以在这200是离群值,有许多技术被用来去除离群值,折扣返利,但我们将使用标准差技术。

我们已经知道标准差是方差的平方根。在HANA中,我们有一个聚合类型STDDEV来计算它。

我创建了一个样本数据,淘客分佣系统,其中包含一个产品和它在所有年份的销售数量。

创建一个计算视图并使用您创建的表。将产品和销售值添加到语义中sales是一个整数数据类型将聚合转换为标准偏差(stddev)。我们还需要计算平均销售额,创建一个计算列作为"sales\u average",在语义中聚合类型为average。

现在我们有了产品的标准偏差值和销售平均值。

通过使用这个计算值,我们必须构建一个可以用零代替异常值的方程。

为此,我们必须创建另一个计算视图,在投影中使用同一个表,在另一个投影中使用标准偏差计算的计算视图。

我们必须使用产品字段将两者连接起来。创建一个新的计算列作为"new\u SALES",如下表达式:

如果("SALES"=("AVERAGE\u SALES"+(-2*"SALES\u STD")),"SALES",0)

通过这个来比较超出或低于范围的值,大数据的应用,怎么做淘客推广,如果它不满足条件,它将被替换为零

现在我们可以看到在这种情况下,2003年的销售额被替换为零,并且可以去除。

结论:

我们有一些数据集可以用来训练预测模型。因此,我们可以使用异常值来删除这些值,并可用于有效的训练模型。

任何建议请发表意见以下

参考:

https://help.sap.com/viewer/4fe29514fd584807ac9f2a04f6754767/2.0.04/en-US/c0c42b56360144e99bd443db90847597.html

https://answers.sap.com/questions/13013398/how-is-the-hana-calculation-view-variance-measure.html

,开始云
分享给小伙伴们:
本文标签: 腾讯百度速度快

相关文章

评论

发表评论愿您的每句评论,都能给大家的生活添色彩,带来共鸣,带来思索,带来快乐。

签名: 验证码: 点击我更换图片

评论列表