中等
技术面试0 次浏览

百度搜索的日志系统每天会产生海量的搜索日志数据,请设计一个系统,能够高效地统计热门搜索关键词的Top 100,并支持实时更新。

百度后端工程师
系统设计大数据

答题要点

1. 使用MapReduce或流处理框架(如Flink)处理日志数据;2. 维护一个最小堆或优先队列来保存Top 100关键词;3. 考虑分片和分布式计算以提高处理效率;4. 使用滑动窗口或时间分片支持实时更新。