ReadTimeoutError: HTTPSConnectionPool(host=‘cdn-lfs.huggingface.co‘, port=443)

原创已于 2023-05-16 08:30:22 修改 · 1.1w 阅读

·

8

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#自然语言处理 #深度学习 #人工智能

于 2023-02-06 18:42:19 首次发布

当从huggingface下载SimCSE预训练模型时遇到ReadTimeoutError，可以手动下载模型文件。在官网搜索模型后，将下载的pytorch模型文件放入.cache/huggingface/hub的对应目录中，如果目录不存在，需按规则创建。这样能解决模型自动下载超时的问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

问题

最近遇到需要从hugging face下载并导入预训练模型SimCSE，然后进行计算文本相似度，代码如下：

from transformers import AutoModel, AutoTokenizer

import os

os.environ["KMP_DUPLICATE_LIB_OK"] = "TRUE"

tokenizer = AutoTokenizer.from_pretrained("princeton-nlp/sup-simcse-bert-base-uncased")
model = AutoModel.from_pretrained("princeton-nlp/sup-simcse-bert-base-uncased")

但是在下载SimCSE模型时候报错ReadTimeoutError，就是下载超时，运行多次都遇到这个问题

解决办法

网上自动下载超时，就直接在手动下载，进入hugging face官网的预训练模型, 然后可以在搜索栏查询需要下载的模型，比如笔者这里是sup-simcse-bert-base-uncased模型
模型搜索结果

然后点击模型，进入到模型下载页面

模型下载
模型自动下载报错，一般来说，json文件，或者txt文件都已经下载好了，可以在这个路径下找到对应的文件夹（windows环境）：

C:\Users\用户名\.cache\huggingface\hub

找到一个已经创建的文件夹，该文件夹的命名如下：
models–princeton-nlp–sup-simcse-bert-base-uncased（以笔者使用的预训练模型为例，一般都比较有规律）

然后将下载的pytorch模型放到该文件夹下snapshots下的文件夹即可

问题就可以解决了！！

如果说没有这个文件夹，那就按照上述规律自己手动创建一个文件夹，并把模型下载页面中所有文件都全部下载放进到相应的位置

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

肥宅程序员aka不会游泳的鱼 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。