简单
技术面试0 次浏览在一个图像分类项目中,数据集存在类别不平衡问题,你会采取哪些方法来解决?
商汤科技项目经理
图像分类类别不平衡
答题要点
采用分层分析法,从数据处理和模型训练两方面考虑。关键要点:1. 数据层面:可使用过采样,如复制少数类样本;或欠采样,减少多数类样本数量。2. 数据增强:对少数类样本进行旋转、翻转、缩放等操作,增加其多样性。3. 损失函数调整:使用加权损失函数,给少数类样本更高的权重。4. 模型评估指标:除准确率外,更关注召回率、F1 值等指标。示例思路:首先在数据层面,对少数类样本进行过采样,同时对这些样本进行数据增强。在模型训练时,使用加权交叉熵损失函数。评估模型时,重点看召回率和 F1 值,以更全面地衡量模型在不平衡数据集上的性能。