0% found this document useful (0 votes)

8 views

Exp 8 Machine Translation

Uploaded by

pranava

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

8 views

Exp 8 Machine Translation

Uploaded by

pranava

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 11

Building a model which translates English to

French
1.Importing the libraries
2.Reading the data
1.Initialization of Lists
2.Reading the File:
3.Processing Each Line:
3.Preparing input data for the Encoder
1.Collects and stores input sentences.
2.Tokenizes the sentences into sequences of integers.
3.Determines the maximum length of the input sequences.
4.add spaces to ensure they have the same length.
5: Create Input Word Dictionary and Determine Number of Tokens
4.Preparing input data for the Decoder
1.Collects Output Lines with Special Tokens
2.Tokenizes the Output Lines:
3.Determines Maximum Output Sequence Length:
4.add spaces to the Output Sequences:
5.Creates Output Word Dictionary and Determines Number of Tokens:

5.Preparing target data for the Decoder

1.Create Decoder Target Data
2.Pad the Target Sequences
3.One-Hot Encode the Target Sequences
4.Convert to NumPy Array:
6.Implement the Seq2Seq Model
1.Import Libraries:
2.Define Encoder:
1.input layer
2.embedding layer
3.LSTM layer

3.Define Decoder:
1.input layer
2.embedding layer
3.LSTM layer
4.output layer
4.Define the Model:

from tensorflow.keras.models import Model

from tensorflow.keras.layers import Input,LSTM,Dense
import numpy as np

from tensorflow.keras.models import Model

from tensorflow.keras.layers import Input,LSTM,Dense

batch_size=64
epochs=25
latent_dim=256
num_samples=10000

data_path=r'D:\KMIT\NLP_Lab\Experiments\Dataset\Exp7_MT/eng-fra.txt'

lines=[]
f = open(data_path, 'r', encoding="utf8")
for l in f:
lines.append(l)
lines[:20]

['Go.\tVa !\n',
'Run!\tCours\u202f!\n',
'Run!\tCourez\u202f!\n',
'Wow!\tÇa alors\u202f!\n',
'Fire!\tAu feu !\n',
"Help!\tÀ l'aide\u202f!\n",
'Jump.\tSaute.\n',
'Stop!\tÇa suffit\u202f!\n',
'Stop!\tStop\u202f!\n',
'Stop!\tArrête-toi !\n',
'Wait!\tAttends !\n',
'Wait!\tAttendez !\n',
'I see.\tJe comprends.\n',
"I try.\tJ'essaye.\n",
"I won!\tJ'ai gagné !\n",
"I won!\tJe l'ai emporté !\n",
'Oh no!\tOh non !\n',
'Attack!\tAttaque !\n',
'Attack!\tAttaquez !\n',
'Cheers!\tSanté !\n']

len(lines)

135842

Input/Output data preparation

input_texts = []
target_texts = []
input_characters = set()
target_characters = set()

for line in lines[:20000]:

input_text, target_text = line.split('\t')
# We use "tab" as the "start sequence" character
# for the targets, and "\n" as "end sequence" character.
#target_text = '\t' + target_text + '\n'
target_text = '\t' + target_text
input_texts.append(input_text)
target_texts.append(target_text)
for char in input_text:
if char not in input_characters:
input_characters.add(char)
for char in target_text:
if char not in target_characters:
target_characters.add(char)

print(input_texts[-1:]) # display last 2 samples

print(target_texts[-1:])

['I want to know now.']

['\tJe veux le savoir maintenant.\n']

print(input_texts[-3:-2]) # display last 2 samples

print(target_texts[-2:])

['I want to keep one.']

['\tJe veux embrasser Tom.\n', '\tJe veux le savoir maintenant.\n']

input_characters=sorted(list(input_characters))
target_characters=sorted(list(target_characters))
num_encoder_tokens=len(input_characters)
num_decoder_tokens=len(target_characters)

max_encoder_seq_length=max([len(txt) for txt in input_texts])

max_decoder_seq_length=max([len(txt) for txt in target_texts])

input_characters

[' ',
'!',
'"',
'$',
'&',
"'",
',',
'-',
'.',
'0',
'1',
'2',
'3',
'4',
'5',
'6',
'7',
'8',
'9',
':',
'?',
'A',
'B',
'C',
'D',
'E',
'F',
'G',
'H',
'I',
'J',
'K',
'L',
'M',
'N',
'O',
'P',
'Q',
'R',
'S',
'T',
'U',
'V',
'W',
'Y',
'Z',
'a',
'b',
'c',
'd',
'e',
'f',
'g',
'h',
'i',
'j',
'k',
'l',
'm',
'n',
'o',
'p',
'q',
'r',
's',
't',
'u',
'v',
'w',
'x',
'y',
'z',
'’']

print('Number of samples:', len(input_texts))

print('Number of unique input tokens:', num_encoder_tokens)
print('Number of unique output tokens:', num_decoder_tokens)
print('Max sequence length for inputs:', max_encoder_seq_length)
print('Max sequence length for outputs:', max_decoder_seq_length)

Number of samples: 20000

Number of unique input tokens: 73
Number of unique output tokens: 99
Max sequence length for inputs: 19
Max sequence length for outputs: 59

#The enumerate function takes the list target_characters and returns

pairs of the form (index, character)

input_token_index=dict([(char,i) for i, char in

enumerate(input_characters)])
target_token_index=dict([(char,i) for i, char in
enumerate(target_characters)])

#input_token_index

Summary of Process:
1) Turn the sentences into 3 Numpy arrays, encoder_input_data,
decoder_input_data, decoder_target_data:

* encoder_input_data: is a 3D array of shape (num_samples,

max_eng_sentence_length, num_eng_characters) containing a one-hot
vectorization of the English sentences.
* decoder_input_data is a 3D array of shape(num_samples,
max_fren_sentence_length, num_fren_characters) containing a one-hot
vectorization of the French sentences.
* decoder_target_data is the same as decoder_input_data but offset by
one timesteip. Decoder_target_data[:,t,:] will be the same as
decoder_input_data[:, t+1, :].

2) Train a basic LSTM-based seq2seq model to predict decoder_target_data

given encoder_input_data and decoder_input_data.
3) Decode some sentences to check that the model is working (i.e. turn
samples from encoder_input_data into corresponding samples from
decoder_target_data).

Initializing 3D arrays

encoder_input_data = np.zeros(
(len(input_texts), max_encoder_seq_length, num_encoder_tokens),
dtype='float32')
decoder_input_data = np.zeros(
(len(input_texts), max_decoder_seq_length, num_decoder_tokens),
dtype='float32')
decoder_target_data = np.zeros(
(len(input_texts), max_decoder_seq_length, num_decoder_tokens),
dtype='float32')

print(encoder_input_data.shape)
print(decoder_input_data.shape)
print(decoder_target_data.shape)

(20000, 19, 73)

(20000, 59, 99)
(20000, 59, 99)

One-Hot representation usng Numpy

for i, (input_text, target_text) in enumerate(zip(input_texts,

target_texts)):
for t, char in enumerate(input_text):
encoder_input_data[i, t, input_token_index[char]] = 1.
encoder_input_data[i, t + 1:, input_token_index[' ']] = 1.
for t, char in enumerate(target_text):
# decoder_target_data is ahead of decoder_input_data by one
timestep
decoder_input_data[i, t, target_token_index[char]] = 1.
if t > 0:
# decoder_target_data will be ahead by one timestep
# and will not include the start character.
decoder_target_data[i, t - 1, target_token_index[char]] =
1.
decoder_input_data[i, t + 1:, target_token_index[' ']] = 1.
decoder_target_data[i, t:, target_token_index[' ']] = 1.

encoder_input_data[:,:,50]
array([[0., 0., 0., ..., 0., 0., 0.],
[0., 0., 0., ..., 0., 0., 0.],
[0., 0., 0., ..., 0., 0., 0.],
...,
[0., 0., 0., ..., 0., 1., 0.],
[0., 0., 0., ..., 0., 0., 0.],
[0., 0., 0., ..., 0., 0., 0.]], dtype=float32)

Defining the encoder and decoder

encoder_inputs = Input(shape=(None, num_encoder_tokens))
encoder = LSTM(latent_dim, return_state=True)
encoder_outputs, state_h, state_c = encoder(encoder_inputs)

state_c

<KerasTensor shape=(None, 256), dtype=float32, sparse=False,

name=keras_tensor_3>

# Define an input sequence and process it.

encoder_inputs = Input(shape=(None, num_encoder_tokens))
encoder = LSTM(latent_dim, return_state=True)
encoder_outputs, state_h, state_c = encoder(encoder_inputs)
# We discard `encoder_outputs` and only keep the states.
encoder_states = [state_h, state_c]

# Set up the decoder, using `encoder_states` as initial state.

decoder_inputs = Input(shape=(None, num_decoder_tokens))
# We set up our decoder to return full output sequences,
# and to return internal states as well. We don't use the
# return states in the training model, but we will use them in
inference.
decoder_lstm = LSTM(latent_dim, return_sequences=True,
return_state=True)
decoder_outputs, _, _ = decoder_lstm(decoder_inputs,
initial_state=encoder_states)
decoder_dense = Dense(num_decoder_tokens, activation='softmax')
decoder_outputs = decoder_dense(decoder_outputs)

# Define the model that will turn

# `encoder_input_data` & `decoder_input_data` into
`decoder_target_data`
model = Model([encoder_inputs, decoder_inputs], decoder_outputs)

# Run training
model.compile(optimizer='rmsprop', loss='categorical_crossentropy',
metrics=['accuracy'])
model.fit([encoder_input_data, decoder_input_data],
decoder_target_data,
batch_size=batch_size,
epochs=epochs,
validation_split=0.2)

Epoch 1/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 55s 213ms/step - accuracy: 0.6764 -
loss: 1.5467 - val_accuracy: 0.6634 - val_loss: 1.2065
Epoch 2/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 51s 203ms/step - accuracy: 0.7281 -
loss: 0.9781 - val_accuracy: 0.7167 - val_loss: 0.9704
Epoch 3/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 49s 198ms/step - accuracy: 0.7712 -
loss: 0.7919 - val_accuracy: 0.7466 - val_loss: 0.8657
Epoch 4/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 52s 208ms/step - accuracy: 0.7904 -
loss: 0.7153 - val_accuracy: 0.7616 - val_loss: 0.8103
Epoch 5/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 51s 202ms/step - accuracy: 0.8031 -
loss: 0.6692 - val_accuracy: 0.7795 - val_loss: 0.7631
Epoch 6/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 50s 199ms/step - accuracy: 0.8150 -
loss: 0.6262 - val_accuracy: 0.7862 - val_loss: 0.7326
Epoch 7/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 49s 196ms/step - accuracy: 0.8240 -
loss: 0.5967 - val_accuracy: 0.7945 - val_loss: 0.7018
Epoch 8/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 50s 198ms/step - accuracy: 0.8316 -
loss: 0.5722 - val_accuracy: 0.7993 - val_loss: 0.6796
Epoch 9/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 49s 196ms/step - accuracy: 0.8369 -
loss: 0.5511 - val_accuracy: 0.8043 - val_loss: 0.6602
Epoch 10/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 49s 194ms/step - accuracy: 0.8427 -
loss: 0.5293 - val_accuracy: 0.8082 - val_loss: 0.6432
Epoch 11/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 47s 188ms/step - accuracy: 0.8469 -
loss: 0.5144 - val_accuracy: 0.8125 - val_loss: 0.6304
Epoch 12/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 41s 164ms/step - accuracy: 0.8502 -
loss: 0.5001 - val_accuracy: 0.8158 - val_loss: 0.6197
Epoch 13/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 49s 196ms/step - accuracy: 0.8553 -
loss: 0.4836 - val_accuracy: 0.8206 - val_loss: 0.6035
Epoch 14/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 652s 3s/step - accuracy: 0.8589 -
loss: 0.4720 - val_accuracy: 0.8244 - val_loss: 0.5906
Epoch 15/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 48s 194ms/step - accuracy: 0.8625 -
loss: 0.4610 - val_accuracy: 0.8270 - val_loss: 0.5818
Epoch 16/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 49s 197ms/step - accuracy: 0.8655 -
loss: 0.4502 - val_accuracy: 0.8290 - val_loss: 0.5748
Epoch 17/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 48s 193ms/step - accuracy: 0.8680 -
loss: 0.4411 - val_accuracy: 0.8309 - val_loss: 0.5674
Epoch 18/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 49s 195ms/step - accuracy: 0.8700 -
loss: 0.4343 - val_accuracy: 0.8338 - val_loss: 0.5591
Epoch 19/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 49s 196ms/step - accuracy: 0.8729 -
loss: 0.4250 - val_accuracy: 0.8361 - val_loss: 0.5537
Epoch 20/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 49s 194ms/step - accuracy: 0.8748 -
loss: 0.4193 - val_accuracy: 0.8374 - val_loss: 0.5482
Epoch 21/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 49s 195ms/step - accuracy: 0.8774 -
loss: 0.4099 - val_accuracy: 0.8399 - val_loss: 0.5403
Epoch 22/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 49s 196ms/step - accuracy: 0.8793 -
loss: 0.4029 - val_accuracy: 0.8422 - val_loss: 0.5343
Epoch 23/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 48s 192ms/step - accuracy: 0.8819 -
loss: 0.3945 - val_accuracy: 0.8423 - val_loss: 0.5335
Epoch 24/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 49s 195ms/step - accuracy: 0.8839 -
loss: 0.3877 - val_accuracy: 0.8443 - val_loss: 0.5276
Epoch 25/25
250/250 ━━━━━━━━━━━━━━━━━━━━ 49s 195ms/step - accuracy: 0.8856 -
loss: 0.3823 - val_accuracy: 0.8448 - val_loss: 0.5259

<keras.src.callbacks.history.History at 0x14ff8fb39d0>

model.save('eng2french.h5')

WARNING:absl:You are saving your model as an HDF5 file via

`model.save()` or `keras.saving.save_model(model)`. This file format
is considered legacy. We recommend using instead the native Keras
format, e.g. `model.save('my_model.keras')` or
`keras.saving.save_model(model, 'my_model.keras')`.

Solutions
No ratings yet
Solutions
11 pages
Transform Raw Texts Into Training and Development Data: Instructor: Nikos Aletras
No ratings yet
Transform Raw Texts Into Training and Development Data: Instructor: Nikos Aletras
2 pages
EncoderDecoderSeq2Seq DeepLSTM
No ratings yet
EncoderDecoderSeq2Seq DeepLSTM
7 pages
Dl-7
No ratings yet
Dl-7
6 pages
MACHINE TRANSLATION USING ENCODER
No ratings yet
MACHINE TRANSLATION USING ENCODER
2 pages
Assignment 7
No ratings yet
Assignment 7
10 pages
Cse425 Assignement - 20101257
No ratings yet
Cse425 Assignement - 20101257
12 pages
Neural Machine Translation: Shusen Wang
No ratings yet
Neural Machine Translation: Shusen Wang
57 pages
NLP
No ratings yet
NLP
15 pages
RNN_LSTM_from_scratch.ipynb
No ratings yet
RNN_LSTM_from_scratch.ipynb
55 pages
Tensor flow chat bot
No ratings yet
Tensor flow chat bot
44 pages
Chatbot Exp6
No ratings yet
Chatbot Exp6
1 page
DL 8
No ratings yet
DL 8
7 pages
Ass
No ratings yet
Ass
5 pages
Deep Learning Manual (1)
No ratings yet
Deep Learning Manual (1)
53 pages
Dl Lab 8 Excuted
No ratings yet
Dl Lab 8 Excuted
3 pages
DL 6th Exp Program
No ratings yet
DL 6th Exp Program
3 pages
Neural Translation Model (Capstone Project)
No ratings yet
Neural Translation Model (Capstone Project)
20 pages
RNN Text Generation
No ratings yet
RNN Text Generation
3 pages
Project Machine Translation
No ratings yet
Project Machine Translation
45 pages
Project Source
No ratings yet
Project Source
21 pages
Cs 224N: Assignment #4: 1. Neural Machine Translation With Rnns (45 Points)
No ratings yet
Cs 224N: Assignment #4: 1. Neural Machine Translation With Rnns (45 Points)
10 pages
AD3511-DEEP LEARNING-LAB MANUAL
No ratings yet
AD3511-DEEP LEARNING-LAB MANUAL
53 pages
Dl lab answers batch 2
No ratings yet
Dl lab answers batch 2
27 pages
Integer-Encoding-Simplernn - Ipynb - Colaboratory
No ratings yet
Integer-Encoding-Simplernn - Ipynb - Colaboratory
4 pages
unit 5 dl
No ratings yet
unit 5 dl
26 pages
Assignment4 – Deeplearning
No ratings yet
Assignment4 – Deeplearning
10 pages
Sequence Models-II
No ratings yet
Sequence Models-II
10 pages
sentiment analysis using LSTM (1)
No ratings yet
sentiment analysis using LSTM (1)
5 pages
566f0619-9145-4b8f-b12b-cb8a5b0cd30d
No ratings yet
566f0619-9145-4b8f-b12b-cb8a5b0cd30d
17 pages
AD3511 - Deep Learning Lab Manual - - Copy
No ratings yet
AD3511 - Deep Learning Lab Manual - - Copy
61 pages
assignment-9
No ratings yet
assignment-9
4 pages
Practical
No ratings yet
Practical
6 pages
CNN and RNN code
No ratings yet
CNN and RNN code
10 pages
GPT2 From Scratch in PyTorch
No ratings yet
GPT2 From Scratch in PyTorch
13 pages
Autoencoder Transformer
No ratings yet
Autoencoder Transformer
2 pages
AD3511 Deep Learning Lab Manual
No ratings yet
AD3511 Deep Learning Lab Manual
54 pages
Image_Captioning_with_Visual_Attention.pdf
No ratings yet
Image_Captioning_with_Visual_Attention.pdf
16 pages
NN & DL Lab Manual 1[1]
No ratings yet
NN & DL Lab Manual 1[1]
44 pages
Polynomial Expansion Paper
No ratings yet
Polynomial Expansion Paper
4 pages
nlp4
No ratings yet
nlp4
10 pages
Expt_5_Expt_6_
No ratings yet
Expt_5_Expt_6_
10 pages
748747019-ad3511-deep-learning-lab-manual-iii-yearjnn (1)-1
No ratings yet
748747019-ad3511-deep-learning-lab-manual-iii-yearjnn (1)-1
51 pages
DL Programs
No ratings yet
DL Programs
13 pages
Assignment 1
No ratings yet
Assignment 1
7 pages
Transformers Torch
No ratings yet
Transformers Torch
38 pages
Ad3511 Deep Learning Lab Manual
No ratings yet
Ad3511 Deep Learning Lab Manual
80 pages
rldl
No ratings yet
rldl
23 pages
Deep Learning Lab Manual
No ratings yet
Deep Learning Lab Manual
46 pages
Exp 6,7,8
No ratings yet
Exp 6,7,8
17 pages
Deep DL Manual Nainish
No ratings yet
Deep DL Manual Nainish
8 pages
Dinosaurus Island - Character-Level Language Model - (Final) - Learners - Ipynb
No ratings yet
Dinosaurus Island - Character-Level Language Model - (Final) - Learners - Ipynb
10 pages
DL_20-WordEmbeddings.ipynb - Colab
No ratings yet
DL_20-WordEmbeddings.ipynb - Colab
6 pages
Prak Robotika Cerdas M9
No ratings yet
Prak Robotika Cerdas M9
4 pages
Cv prince
No ratings yet
Cv prince
120 pages
Next Word Prediction With NLP and Deep Learning
No ratings yet
Next Word Prediction With NLP and Deep Learning
13 pages
Image Caption2
No ratings yet
Image Caption2
9 pages
DL
No ratings yet
DL
17 pages
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
Exp 11 NLI USING BERT
No ratings yet
Exp 11 NLI USING BERT
4 pages
DS Unit-2 Datastructures
No ratings yet
DS Unit-2 Datastructures
140 pages
DS Unit 2
No ratings yet
DS Unit 2
273 pages
DS C++ External Lab
No ratings yet
DS C++ External Lab
35 pages
Tegam
No ratings yet
Tegam
1 page
Phy130 Tutorial 8
No ratings yet
Phy130 Tutorial 8
3 pages
WC67K CNC Hydraulic Sheet Metal Press Brake Bender Machine With DA41s System
No ratings yet
WC67K CNC Hydraulic Sheet Metal Press Brake Bender Machine With DA41s System
7 pages
Complete Download of Designing Controls For The Process Industries 1st Seames Solution Manual Full Chapters in PDF
100% (4)
Complete Download of Designing Controls For The Process Industries 1st Seames Solution Manual Full Chapters in PDF
34 pages
Worksheet 2
No ratings yet
Worksheet 2
2 pages
1803 5561 3 PB
No ratings yet
1803 5561 3 PB
8 pages
Qualitative Tests For Carbohydrates
0% (1)
Qualitative Tests For Carbohydrates
6 pages
psat-8-9-student-guide 2025
No ratings yet
psat-8-9-student-guide 2025
29 pages
Coal Assignment 1
No ratings yet
Coal Assignment 1
11 pages
Data Sheet For Three-Phase Motors: 1PQ8355-4PB90-Z MLFB-Ordering Data
No ratings yet
Data Sheet For Three-Phase Motors: 1PQ8355-4PB90-Z MLFB-Ordering Data
1 page
Nitrogen Foodgrade - Linde - EN-PIB-0256
No ratings yet
Nitrogen Foodgrade - Linde - EN-PIB-0256
1 page
Interpreting and Preparing Visuals
60% (10)
Interpreting and Preparing Visuals
36 pages
Set 2
100% (1)
Set 2
23 pages
Social Media Data Analytics To Improve Supply Chain Management in Food Industries
No ratings yet
Social Media Data Analytics To Improve Supply Chain Management in Food Industries
18 pages
Hussain and Sachan 2017
No ratings yet
Hussain and Sachan 2017
10 pages
Tabular and Graphical Descriptive Techniques Using MS-Excel
No ratings yet
Tabular and Graphical Descriptive Techniques Using MS-Excel
20 pages
Heat Transfer Experiments 1 and 2 MANUAL
No ratings yet
Heat Transfer Experiments 1 and 2 MANUAL
16 pages
Losses in Optical Fiber
No ratings yet
Losses in Optical Fiber
13 pages
Excel Macro Examples
No ratings yet
Excel Macro Examples
23 pages
BSMSC MPhil PH DSyllabus
No ratings yet
BSMSC MPhil PH DSyllabus
108 pages
Data For Charcoaling
No ratings yet
Data For Charcoaling
1 page
Design Project 1 Content: Chapter 1 Process Background
No ratings yet
Design Project 1 Content: Chapter 1 Process Background
4 pages
The Common Ion Effect
No ratings yet
The Common Ion Effect
24 pages
Triangulation - Engineering Surveying
No ratings yet
Triangulation - Engineering Surveying
30 pages
LED Cube 8x8x8
No ratings yet
LED Cube 8x8x8
85 pages
Build A Cremation Cask
100% (1)
Build A Cremation Cask
7 pages
Expo, Metodos Numericos
No ratings yet
Expo, Metodos Numericos
3 pages
Shahin. Incidence, Prevention and Treatment of Pressure Ulcers in Intensive Care Patients
No ratings yet
Shahin. Incidence, Prevention and Treatment of Pressure Ulcers in Intensive Care Patients
10 pages
PDF Isuzu Flash Code DL
No ratings yet
PDF Isuzu Flash Code DL
3 pages
CH 5 Heat Exchanger Design Methods
100% (1)
CH 5 Heat Exchanger Design Methods
30 pages

Exp 8 Machine Translation

Uploaded by

Exp 8 Machine Translation

Uploaded by

Building a model which translates English to

5.Preparing target data for the Decoder

from tensorflow.keras.models import Model

from tensorflow.keras.models import Model

Input/Output data preparation

for line in lines[:20000]:

print(input_texts[-1:]) # display last 2 samples

['I want to know now.']

print(input_texts[-3:-2]) # display last 2 samples

['I want to keep one.']

max_encoder_seq_length=max([len(txt) for txt in input_texts])

print('Number of samples:', len(input_texts))

Number of samples: 20000

#The enumerate function takes the list target_characters and returns

input_token_index=dict([(char,i) for i, char in

* encoder_input_data: is a 3D array of shape (num_samples,

2) Train a basic LSTM-based seq2seq model to predict decoder_target_data

(20000, 19, 73)

One-Hot representation usng Numpy

for i, (input_text, target_text) in enumerate(zip(input_texts,

Defining the encoder and decoder

<KerasTensor shape=(None, 256), dtype=float32, sparse=False,

# Define an input sequence and process it.

# Set up the decoder, using `encoder_states` as initial state.

# Define the model that will turn

WARNING:absl:You are saving your model as an HDF5 file via

You might also like