题目内容
(请给出正确答案)
[多选题]
下列选项中,那些方法可以用于处理缺失值()
A.用一个样本统计量的值代替缺失值
B.用一个统计模型计算出来的值去代替缺失值
C.删除所有缺失值的记录
D.随机删除部分缺失值的记录
答案
ABC
如果结果不匹配,请 联系老师 获取答案
A.用一个样本统计量的值代替缺失值
B.用一个统计模型计算出来的值去代替缺失值
C.删除所有缺失值的记录
D.随机删除部分缺失值的记录
ABC
A.从加工程度看,可以将数据分为一次数据、二次数据和三次数据
B.一次数据中往往存在缺失值、噪声、错误或虚假数据等质量问题
C.二次数据是对一次数据进行深度处理或分析后得到的“增值数据”
D.三次数据是对二次数据进行洞察与分析后得到的、可以直接用于决策支持的“洞见数据”
A.preprocessing.Imputer()
B.preprocessing.PolynomialFeatures()
C.preprocessing.FunctionTransformer()
D.preprocessing.Binarizer()
A.混凝土拌和用水的pH值、不溶物应符合要求
B.拌和用水不应漂浮明显的油脂和泡沫
C.未经处理的海水可以用于钢筋混凝土
D.海水可以用于素混凝土,但不宜用于装饰混凝土
A.填补数据可以用中位数或者众数等
B.pandas.dropna可以用来填补缺失值
C.用平均值填补会引入相关性
D.哑变量填补是将缺失值当做一类新特征处理
A.把NaN直接作为一个特征,假设用0表示
B.用均值填充
C.用随机森林等算法预测填充
D.以上答案都不正确