简单
技术面试0 次浏览在华为的通信系统中,经常需要对海量的日志数据进行处理。请简述如何使用 Python 读取一个大日志文件,并统计其中包含特定关键词的行数。
华为后端工程师
Python日志处理数据统计
答题要点
推荐使用分层分析法来解答此题。首先明确整体的处理步骤,然后逐步细化每个步骤。关键要点如下:1. 文件读取:使用 Python 的 open 函数以合适的模式打开大文件,避免一次性将整个文件读入内存。2. 逐行处理:通过循环逐行读取文件内容,减少内存占用。3. 关键词匹配:使用字符串的 in 操作符判断当前行是否包含特定关键词。4. 计数统计:若匹配成功,则对计数器加 1。示例话术:可以这样实现,先使用 open 函数打开文件,然后通过 for 循环逐行读取文件内容,在循环中使用 if 语句判断当前行是否包含关键词,如果包含则将计数器加 1,最后返回计数器的值。