简单
技术面试0 次浏览在 58 同城的招聘业务中,有一份求职者的简历数据,包含年龄、工作年限、期望薪资等信息。请简述如何使用 SQL 对这份数据进行清洗,去除重复值和缺失值。
58同城数据分析师
SQL数据清洗招聘业务
答题要点
本题推荐使用分层分析法,按照操作步骤依次阐述。关键要点如下:1. 去除重复值:使用 DISTINCT 关键字或者 GROUP BY 语句对表格进行筛选,将完全相同的行去除。2. 处理缺失值:可以使用 WHERE 子句筛选出非空的数据,或者使用函数对缺失值进行填充,如使用平均值、中位数等。3. 查看清洗后的数据:使用 SELECT 语句查看清洗后的数据,确保数据清洗成功。示例话术:首先,使用 DISTINCT 关键字去除重复值,如'SELECT DISTINCT * FROM resume_data'。接着,筛选出年龄、工作年限、期望薪资等关键列不为空的数据,使用'WHERE age IS NOT NULL AND work_years IS NOT NULL AND expected_salary IS NOT NULL'。最后,查看清洗后的数据,确认结果符合要求。