ReadTimeoutError: HTTPSConnectionPool(host=‘cdn-lfs.huggingface.co‘, port=443)

当从huggingface下载SimCSE预训练模型时遇到ReadTimeoutError,可以手动下载模型文件。在官网搜索模型后,将下载的pytorch模型文件放入.cache/huggingface/hub的对应目录中,如果目录不存在,需按规则创建。这样能解决模型自动下载超时的问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

问题

最近遇到需要从hugging face下载并导入预训练模型SimCSE,然后进行计算文本相似度,代码如下:

from transformers import AutoModel, AutoTokenizer

import os

os.environ["KMP_DUPLICATE_LIB_OK"] = "TRUE"

tokenizer = AutoTokenizer.from_pretrained("princeton-nlp/sup-simcse-bert-base-uncased")
model = AutoModel.from_pretrained("princeton-nlp/sup-simcse-bert-base-uncased")

但是在下载SimCSE模型时候报错ReadTimeoutError,就是下载超时,运行多次都遇到这个问题
下载超时

解决办法

网上自动下载超时,就直接在手动下载,进入hugging face官网的预训练模型, 然后可以在搜索栏查询需要下载的模型,比如笔者这里是sup-simcse-bert-base-uncased模型
模型搜索结果

然后点击模型,进入到模型下载页面

模型下载
模型自动下载报错,一般来说,json文件,或者txt文件都已经下载好了,可以在这个路径下找到对应的文件夹(windows环境):

C:\Users\用户名\.cache\huggingface\hub

找到一个已经创建的文件夹,该文件夹的命名如下:
models–princeton-nlp–sup-simcse-bert-base-uncased(以笔者使用的预训练模型为例,一般都比较有规律)

然后将下载的pytorch模型放到该文件夹下snapshots下的文件夹即可

问题就可以解决了!!

如果说没有这个文件夹,那就按照上述规律自己手动创建一个文件夹,并把模型下载页面中所有文件都全部下载放进到相应的位置

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

肥宅程序员aka不会游泳的鱼

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值