基于大模型的非均衡样本文本分类优化方法

  • 打印
  • 收藏
收藏成功


打开文本图片集

关键词:大模型;文本分类;样本不平衡

中图分类号:TP391 文献标志码:A

0引言(Introduction)

非均衡样本,亦称样本不平衡,是文本分类领域中常见的问题,其中某些类别的样本数量远远多于其他类别的样本数量。这种不均衡性导致模型偏向于预测数量较多的类别,从而忽视了数量较少的类别。为了解决样本不平衡的问题,在数据层面,传统的方法是使用过采样和欠采样等技术来平衡不同类别的样本数量。(剩余5955字)

monitor