中等
技术面试0 次浏览58 同城的生活服务业务涉及多种服务类型和海量用户评价数据。请使用 Hive SQL 对用户评价数据进行分析,计算每种服务类型的平均评分,并找出平均评分最高的前 5 种服务类型。
58同城数据分析师
Hive SQL数据统计生活服务业务
答题要点
推荐答题框架:按照数据处理和分析的步骤进行阐述。关键要点如下:1. 数据准备:确定存储用户评价数据的 Hive 表,明确表中包含服务类型和评分字段。2. 分组计算:使用 GROUP BY 语句按服务类型对数据进行分组,使用 AVG 函数计算每种服务类型的平均评分。3. 排序筛选:使用 ORDER BY 语句对平均评分进行降序排序,使用 LIMIT 语句选取前 5 种服务类型。4. 结果输出:将最终结果展示出来。示例思路:假设用户评价数据存储在 'service_reviews' 表中,包含 'service_type' 和 'rating' 字段。首先编写分组计算的 SQL 语句:SELECT service_type, AVG(rating) AS avg_rating FROM service_reviews GROUP BY service_type; 然后对结果进行排序和筛选:SELECT service_type, avg_rating FROM (SELECT service_type, AVG(rating) AS avg_rating FROM service_reviews GROUP BY service_type) subquery ORDER BY avg_rating DESC LIMIT 5; 最后将结果输出。