基于知识融合的藏语安多方言数据增强方法

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘要:针对藏语安多方言数据稀缺的问题,文章提出一种基于知识融合的数据增强方法。该方法首先分析安多方言词汇特征,将其分为8种实体特征和5种非实体特征,并构建了藏语辞藻、敬语和反义词词典。然后,利用Tibetan-Llama2模型进行风格迁移,将藏语书面语转换为安多方言。最后,结合安多方言语法特征,对生成的方言文本进行多特征融合扩充。(剩余10340字)

目录
monitor