简单
技术面试1 次浏览

58 同城有海量的招聘信息,如何设计一个简单的招聘信息去重系统,确保用户看到的信息不重复?

58同城运营
招聘信息去重系统设计

答题要点

可采用 STAR 法则答题。S(情景)说明 58 同城招聘信息海量易重复的现状;T(任务)明确设计去重系统的目标;A(行动)阐述具体设计步骤;R(结果)说明去重系统达成的效果。关键要点:1. 特征提取:提取招聘信息的关键特征,如职位名称、公司名称、薪资范围等。2. 哈希算法:使用哈希算法将特征转换为哈希值,便于快速比较。3. 数据库存储:将哈希值存储在数据库中,每次新信息入库时进行比对。4. 定期清理:定期清理数据库中的无效或重复的哈希值。示例思路:在 58 同城招聘信息众多的情景下,为了让用户看到不重复的信息,我会先提取招聘信息的关键特征,通过哈希算法生成哈希值存储在数据库。新信息入库时比对哈希值,若重复则不展示。同时,定期清理数据库,保证系统高效运行。