中等
技术面试0 次浏览在微软的大数据平台上,有大量的用户行为日志数据。需要编写一个Python程序,统计不同类型用户行为的发生次数,并按次数降序排序。假设日志数据以JSON格式存储,每个JSON对象包含用户ID和行为类型字段。
微软中国数据分析师
Python编程大数据处理
答题要点
推荐答题框架:采用模块化编程思路,将程序分为数据读取、统计和排序三个模块。关键要点:1. 数据读取:使用Python的JSON库读取日志数据文件。2. 统计次数:遍历读取的数据,使用字典记录不同行为类型的发生次数。3. 排序输出:将字典按值降序排序,并输出结果。示例思路:首先,使用`json.load()`函数读取JSON格式的日志数据文件。然后,遍历数据中的每个JSON对象,将行为类型作为字典的键,出现一次就将对应的值加1。最后,使用`sorted()`函数按字典的值进行降序排序,输出排序后的结果。例如:python import json log_file = 'log.json' behavior_count = {} with open(log_file, 'r') as f: data = json.load(f) for entry in data: behavior = entry['行为类型'] if behavior in behavior_count: behavior_count[behavior] += 1 else: behavior_count[behavior] = 1 sorted_behavior = sorted(behavior_count.items(), key=lambda item: item[1], reverse=True) print(sorted_behavior)