Ko-LLaMA：基于LLaMA的朝鲜语大语言模型

打印
收藏

收藏成功

微博 QQ空间微信

打开文本图片集

提要：在本文中，我们通过扩展LLaMA现有的词表，增加额外的20，000个朝鲜语Token，从而提高其对朝鲜语的编码和语义理解的能力；并且进一步使用朝鲜语数据进行继续预训练，使用朝鲜语指令微调数据集对模型进行SFT（Supervised Fine-Tuning），并分析不同数据量对指令精调效果的影响，经过继续预训练和指令微调后的模型显著提高了理解和遵循朝鲜语指令的能力。（剩余15089字）

试读结束

购买全文6.00元下一篇基于语料库的朝鲜语命名实体结构特征研究

外语学刊

2025年01期

¥4.80/本

关于龙源 关于我们联系我们龙源大事记诚聘英才用户守则 购刊指南 电子刊购买流程会员介绍常见问题 客服中心 联系客服开具发票 商务合作 商务合作 网络信息举报
违法和不良信息举报电话：400-106-1235

举报邮箱：longyuandom@163.com
网上有害信息举报专区 支付方式 支付宝在线支付公司转账邮局汇款 特色服务 刊社入口友情链接

关注微信公众号
获取更多资讯
北京龙源网通电子商务有限公司
（署）网出证（京）字第188号丨京公网安备 11011302003690号丨京ICP备18053758号-2