简单
技术面试0 次浏览SHEIN 有大量的商品数据需要处理,假如你要对商品的价格数据进行清洗,去除其中的异常值,你会采用什么方法?请简要说明步骤。
SHEIN运营
数据处理异常值清洗商品价格
答题要点
推荐使用分层分析法来解答此题。首先明确整体目标,即去除商品价格数据中的异常值;然后分层阐述具体方法和步骤。关键要点如下:1. 数据探查:先对价格数据进行初步查看,了解数据的分布范围、均值、标准差等基本统计信息,以便确定异常值可能出现的区间。2. 确定异常值判断标准:可以采用常见的方法,如基于标准差,将偏离均值一定倍数标准差的数据视为异常值;或者使用箱线图法,将小于下四分位数减去 1.5 倍四分位距,或大于上四分位数加上 1.5 倍四分位距的数据定义为异常值。3. 数据清洗:根据确定的标准,筛选出异常值并进行处理,处理方式可以是删除、修正等。示例话术:首先我会对商品价格数据进行探查,计算其均值和标准差。接着,我会以均值加减 3 倍标准差作为异常值判断标准。对于超出这个范围的数据,我会将其标记为异常值并删除,从而完成价格数据的清洗。