大家好,我是每天分享AI应用的萤火君!
本文聊聊 LLama-Factory,它是一个开源框架,这里头可以找到一系列预制的组件和模板,让你不用从零开始,就能训练出自己的语言模型(微调)。不管是聊天机器人,还是文章生成器,甚至是问答系统,都能搞定。而且,LLama-Factory 还支持多种框架和数据集,这意味着你可以根据项目需求灵活选择,把精力集中在真正重要的事情上——创造价值。
使用LLama-Factory,常见的就是训练LoRA模型,增强模型在某方面的生成能力。本教程将以增强 GLM-4-9B-Chat 模型的脑筋急转弯能力为例,演示LoRA模型的微调方法。
环境准备
本地使用
LLama-Factory 的安装比较简单,大家直接看官网页面就够了:
云镜像
如果你本地没有一张好显卡,也不想费劲的安装,就想马上开始训练。
可以试试我的云镜像,开箱即用:www.haoee.com/application…
平台注册就送一定额度,可以完成本教程的的演示示例。
镜像已经内置了几个基础模型,大都