中等
技术面试0 次浏览

小米的电商平台上有大量的商品评论数据,你需要编写一个 Python 程序来统计评论中出现频率最高的 10 个关键词。

小米数据分析师
Python 编程文本分析关键词统计

答题要点

可按照以下步骤编写程序:1. 数据读取:使用 Python 的文件读取功能读取评论数据文件。2. 文本预处理:去除标点符号、停用词,进行分词处理。3. 关键词统计:使用字典或 Counter 类统计每个关键词的出现次数。4. 排序筛选:对统计结果按出现次数排序,选取前 10 个关键词。示例代码思路:首先读取评论文件,将内容存储为字符串。然后使用正则表达式去除标点,用 jieba 库分词,去除停用词。接着用 Counter 统计词频,最后使用 most_common(10) 方法获取出现频率最高的 10 个关键词。