最近实验课进行了chatbot的训练,挺有意思分享一下。
1,查看dialogbot文件夹中的内容
将闲聊数据命名为train.txt,并放在data文件夹,并检查文本样式
将gpt2-distil-chinese-cluecorpussmall模型放在model文件夹
2,检查gpt文件夹中的程序(preprocess.py的外参数表)
外部参数有3个:
--train_path:训练数据集的路径,默认为data/train.txt。
最近实验课进行了chatbot的训练,挺有意思分享一下。
1,查看dialogbot文件夹中的内容
将闲聊数据命名为train.txt,并放在data文件夹,并检查文本样式
将gpt2-distil-chinese-cluecorpussmall模型放在model文件夹
2,检查gpt文件夹中的程序(preprocess.py的外参数表)
外部参数有3个:
--train_path:训练数据集的路径,默认为data/train.txt。