阿里天池学习赛新闻文本分类

甜辣uu

已于 2022-04-22 16:14:33 修改

阅读量2.3k

点赞数

CC 4.0 BY-SA版权

分类专栏： python从入门到精通自然语言处理-nlp-NLP 深度学习神经网络实战100例文章标签：自然语言处理神经网络深度学习 pytorch

于 2020-12-05 21:22:32 首次发布

本文链接：https://blog.csdn.net/qq_38735017/article/details/110727250

python从入门到精通同时被 3 个专栏收录

166 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

深度学习神经网络实战100例

110 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

自然语言处理-nlp-NLP

89 篇文章 ¥59.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍参与阿里天池学习赛的新闻文本分类项目，包括数据预处理、词向量训练、使用神经网络和深度学习模型进行文本分类。提供完整和简化版代码链接。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

当时我的成绩阿里天池

原始数据训练的词向量模型代码都在下面这两个链接里一个完整版一个不完整版

链接：https://pan.baidu.com/s/1I8l-5f0-IlrSPa3aP6nY2A
提取码：1111
复制这段内容后打开百度网盘手机App，操作更方便哦

链接：https://pan.baidu.com/s/1XNaM7fc96aSBi-sML-_vEw
提取码：1111
复制这段内容后打开百度网盘手机App，操作更方便哦

from gensim.models import KeyedVectors
from gensim.scripts.glove2word2vec import glove2word2vec
import pandas as pd
import numpy as np 
import torch
from torch import nn
import torch.utils.data as data
import torch.nn.functional as F
from torch import tensor
from sklearn.metrics import f1_score
from datetime import datetime 
import time 

#csv数据量的数目测试  一共有20000条
with open("train_set839.csv", 'r') as f: #计算长度
    hang_count