Hugging Face

hugging face

Uploaded by

yngy7kd9cq

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

21 views

Hugging Face

hugging face

Uploaded by

yngy7kd9cq

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 1

Here is a Python script that uses the Hugging Face transformers library to fine-tune a pre-trained BERT model for

text
classification using the Kaggle sentiment140 dataset:

python
Download
Copy code
import pandas as pd
import numpy as np
import torch
from torch.utils.data import Dataset, DataLoader
from transformers import BertTokenizer, BertForSequenceClassification, AdamW, get_linear_schedule_with_warmup
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, f1_score

# Load the Kaggle sentiment140 dataset

data = pd.read_csv('sentiment140.csv', encoding='latin-1', header=None)
data.columns = ['sentiment', 'id', 'date', 'query', 'user', 'text']
data = data[['sentiment', 'text']]

# Preprocess the data

data['text'] = data['text'].apply(lambda x: x.replace('@', ''))
data['text'] = data['text'].apply(lambda x: x.replace('#', ''))
data['text'] = data['text'].apply(lambda x: x.replace('\n', ' '))

# Split the data into training and validation sets

train_data, val_data = train_test_split(data, test_size=0.2, random_state=42)

# Tokenize the text data

tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
train_encodings = tokenizer(list(train_data['text']), truncation=True, padding=True)
val_encodings = tokenizer(list(val_data['text']), truncation=True, padding=True)

# Create custom dataset

class SentimentDataset(Dataset):
def __init__(self, encodings, labels):
self.encodings = encodings
self.labels = labels

def getitem(self, idx):

item = {key: torch.tensor(val[idx]) for key, val in self.encodings.items()}
item['labels'] = torch.tensor(self.labels[idx])
return item

def __len__(self):
return len(self.labels)

# Create DataLoaders for training and validation sets

train_dataset = SentimentDataset(train_encodings, train_data['sentiment'].values)
val_dataset = SentimentDataset(val_encodings, val_data['sentiment'].values)

train_loader = DataLoader(train_dataset, batch_size=16, shuffle=True)

val_loader = DataLoader(val_dataset, batch_size=16, shuffle=False)

# Load the pre-trained BERT model and adjust the number of classes
model = BertForSequenceClassification.from_pretrained('bert-base-uncased', num_labels=2)

# Set up the optimizer and learning rate scheduler

optimizer = AdamW(model.parameters(), lr=2e-5)
total_steps = len(train_loader) * 3
scheduler = get_linear_schedule_with_warmup(optimizer, num_warmup_steps=0, num_training_steps=total_steps)

# Fine-tune the model

device = torch.device('cuda') if torch.cuda.is_available() else torch.device('cpu')
model.to(device)
model.train()

for epoch in range(3):

for batch in train_loader:
optimizer.zero_grad()
input_ids = batch['input_ids'].to(device)
attention_mask = batch['attention_mask'].to(device)
labels = batch['labels'].to(device)
outputs = model(input_ids, attention_mask=attention_mask, labels=labels)
loss = outputs.loss

C1W3 Assignment
No ratings yet
C1W3 Assignment
7 pages
C1W2 Assignment
No ratings yet
C1W2 Assignment
5 pages
BERT - Assignment - Jupyter Notebook
0% (2)
BERT - Assignment - Jupyter Notebook
8 pages
Dsbda Mini Manav
No ratings yet
Dsbda Mini Manav
17 pages
bertweet tokenizer
No ratings yet
bertweet tokenizer
2 pages
Finetuning
No ratings yet
Finetuning
3 pages
NLP Exercise 10
No ratings yet
NLP Exercise 10
6 pages
Bert
No ratings yet
Bert
2 pages
Bert T
No ratings yet
Bert T
2 pages
gpt-2 code
No ratings yet
gpt-2 code
2 pages
566f0619-9145-4b8f-b12b-cb8a5b0cd30d
No ratings yet
566f0619-9145-4b8f-b12b-cb8a5b0cd30d
17 pages
1729401471516
No ratings yet
1729401471516
98 pages
miniProject_NLP
No ratings yet
miniProject_NLP
22 pages
Adobe Scan 08 Jan 2025
No ratings yet
Adobe Scan 08 Jan 2025
7 pages
Assignment3
No ratings yet
Assignment3
6 pages
Cv prince
No ratings yet
Cv prince
120 pages
Complex Engineering Activity
No ratings yet
Complex Engineering Activity
2 pages
NLP
No ratings yet
NLP
45 pages
DOC-20250104-WA0000.
No ratings yet
DOC-20250104-WA0000.
40 pages
DL_3
No ratings yet
DL_3
6 pages
cl12_huggingface
No ratings yet
cl12_huggingface
34 pages
PGI20S02J - LAB RECORD (3)
No ratings yet
PGI20S02J - LAB RECORD (3)
24 pages
sentiment analysis using LSTM (1)
No ratings yet
sentiment analysis using LSTM (1)
5 pages
Dl Lab Manual
No ratings yet
Dl Lab Manual
18 pages
PHASE 2 IBM
No ratings yet
PHASE 2 IBM
5 pages
Experiment 2
No ratings yet
Experiment 2
5 pages
QLSTMvs LSTM
No ratings yet
QLSTMvs LSTM
7 pages
GloVe Embedding code
No ratings yet
GloVe Embedding code
3 pages
COMP 4650 6490 Assignment 3 2023-v1.1
No ratings yet
COMP 4650 6490 Assignment 3 2023-v1.1
6 pages
Few-Shot Learning Tutorial - Medium
No ratings yet
Few-Shot Learning Tutorial - Medium
16 pages
Course 3 - Week 2 - Exercise - Answer - Ipynb - Colaboratory
No ratings yet
Course 3 - Week 2 - Exercise - Answer - Ipynb - Colaboratory
8 pages
3-Sentiment Analysis BERT
No ratings yet
3-Sentiment Analysis BERT
5 pages
21BCP167_AI_9
No ratings yet
21BCP167_AI_9
10 pages
Bert Fine Tuning (AutoRecovered)
No ratings yet
Bert Fine Tuning (AutoRecovered)
6 pages
bert_tokenizer
No ratings yet
bert_tokenizer
2 pages
Assignment 3 DS5620
No ratings yet
Assignment 3 DS5620
11 pages
Text Classification Using Hugging Face
No ratings yet
Text Classification Using Hugging Face
1 page
FineTune OPUS MT Engine
No ratings yet
FineTune OPUS MT Engine
9 pages
Final Assesment
No ratings yet
Final Assesment
1 page
hw1 2487155975100812
No ratings yet
hw1 2487155975100812
6 pages
NNProject t2
No ratings yet
NNProject t2
9 pages
NN From Scratch
No ratings yet
NN From Scratch
5 pages
Lab 9
No ratings yet
Lab 9
29 pages
Hugging Face
100% (1)
Hugging Face
11 pages
Keras For Beginners: Implementing A Recurrent Neural Network
No ratings yet
Keras For Beginners: Implementing A Recurrent Neural Network
13 pages
Deep Learning
No ratings yet
Deep Learning
46 pages
Intro To Pytorch
No ratings yet
Intro To Pytorch
12 pages
DL Programs
No ratings yet
DL Programs
12 pages
unit4 (1)
No ratings yet
unit4 (1)
23 pages
intent_recognizer
No ratings yet
intent_recognizer
5 pages
Assingment-3 NLP
No ratings yet
Assingment-3 NLP
5 pages
Shaurya DL file
No ratings yet
Shaurya DL file
75 pages
Dl lab answers batch 2
No ratings yet
Dl lab answers batch 2
27 pages
Deep Learning Practical File
No ratings yet
Deep Learning Practical File
36 pages
val
No ratings yet
val
9 pages
LLM_FINE_TUNE
No ratings yet
LLM_FINE_TUNE
11 pages
Final Code
No ratings yet
Final Code
16 pages
Deep DL Manual Deep
No ratings yet
Deep DL Manual Deep
8 pages
Hand on Day 2 Salinan_dari_2_Using_transformers
No ratings yet
Hand on Day 2 Salinan_dari_2_Using_transformers
10 pages
Deep Learning
No ratings yet
Deep Learning
43 pages
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
Models and Datasets
No ratings yet
Models and Datasets
1 page
How To Access A Phone Through Ip
No ratings yet
How To Access A Phone Through Ip
1 page
Exploiting Ios
No ratings yet
Exploiting Ios
1 page
Bulit Ios App
No ratings yet
Bulit Ios App
1 page
Pilot Study Using Decision Trees To Diagnose The Efficacy of Virtual Offshore Egress Training
No ratings yet
Pilot Study Using Decision Trees To Diagnose The Efficacy of Virtual Offshore Egress Training
15 pages
Alopex
No ratings yet
Alopex
12 pages
Paper
No ratings yet
Paper
19 pages
27786-Article Text-31840-1-2-20240324
No ratings yet
27786-Article Text-31840-1-2-20240324
9 pages
Colon Cancer
No ratings yet
Colon Cancer
63 pages
18059-Article Text-21554-1-2-20210521
No ratings yet
18059-Article Text-21554-1-2-20210521
12 pages
Emoji2vec: Learning Emoji Representations From Their Description
No ratings yet
Emoji2vec: Learning Emoji Representations From Their Description
8 pages
Dynamic_AI-Augmented_Firewall_for_Real-Time_Threat
No ratings yet
Dynamic_AI-Augmented_Firewall_for_Real-Time_Threat
5 pages
Privacy Technologies and Policy
No ratings yet
Privacy Technologies and Policy
218 pages
Ai Tools and Prompt Engineering Application in Management Assignment Ashish Joshi
No ratings yet
Ai Tools and Prompt Engineering Application in Management Assignment Ashish Joshi
15 pages
Intro To Machine Learning With PyTorch
No ratings yet
Intro To Machine Learning With PyTorch
48 pages
An Interpretable Approach With Explainable AI for the Detection of Cardiovascular Disease
No ratings yet
An Interpretable Approach With Explainable AI for the Detection of Cardiovascular Disease
6 pages
Predictive Maintenance System For Production Lines in Manufacturing (ESTE)
No ratings yet
Predictive Maintenance System For Production Lines in Manufacturing (ESTE)
10 pages
Download Complete Swarm Intelligence Trends and Applications: Trends and Applications 1st Edition Wellington Pinheiro Dos Santos (Editor) PDF for All Chapters
100% (1)
Download Complete Swarm Intelligence Trends and Applications: Trends and Applications 1st Edition Wellington Pinheiro Dos Santos (Editor) PDF for All Chapters
65 pages
Reflection Backdoor: A Natural Backdoor Attack On Deep Neural Networks
No ratings yet
Reflection Backdoor: A Natural Backdoor Attack On Deep Neural Networks
23 pages
Exploring The High Potential Factors That Affects Students' Academic Performance
No ratings yet
Exploring The High Potential Factors That Affects Students' Academic Performance
9 pages
LinRegDroid Detection of Android Malware Using Multiple Linear Regression Models-Based Classifiers
No ratings yet
LinRegDroid Detection of Android Malware Using Multiple Linear Regression Models-Based Classifiers
14 pages
Vehicle Pedestrian Collisions
No ratings yet
Vehicle Pedestrian Collisions
13 pages
Answer Key Sample Paper 3 AI Class 10
No ratings yet
Answer Key Sample Paper 3 AI Class 10
12 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
23 pages
Data Science and Machine Learning
100% (1)
Data Science and Machine Learning
190 pages
Thyroid Disease Detection_Using ML
No ratings yet
Thyroid Disease Detection_Using ML
8 pages
MLOps Interview QnA
No ratings yet
MLOps Interview QnA
19 pages
21ai63 Mod 1
No ratings yet
21ai63 Mod 1
38 pages
Lecture15 Decision Trees
No ratings yet
Lecture15 Decision Trees
67 pages
Sonos Voice Control Bias Assessment Dataset: A Methodology For Demographic Bias Assessment in Voice Assistants
No ratings yet
Sonos Voice Control Bias Assessment Dataset: A Methodology For Demographic Bias Assessment in Voice Assistants
20 pages
Linear Regression - Least-Squares
No ratings yet
Linear Regression - Least-Squares
5 pages
Schonlau Zou 2020 The Random Forest Algorithm For Statistical Learning
No ratings yet
Schonlau Zou 2020 The Random Forest Algorithm For Statistical Learning
27 pages
Machine Learning Syllabus - 1
No ratings yet
Machine Learning Syllabus - 1
52 pages