0% found this document useful (0 votes)
32 views

13 - Machine Learning Model For Bitcoin Exchange Rate Prediction

dự đoán giá bitcoin bằng pp ML
Copyright
© © All Rights Reserved
Available Formats
Download as DOCX, PDF, TXT or read online on Scribd
0% found this document useful (0 votes)
32 views

13 - Machine Learning Model For Bitcoin Exchange Rate Prediction

dự đoán giá bitcoin bằng pp ML
Copyright
© © All Rights Reserved
Available Formats
Download as DOCX, PDF, TXT or read online on Scribd
You are on page 1/ 25

Mô hình học máy để dự đoán tỷ giá hối đoái Bitcoin

bằng cách sử dụng các yếu tố quyết định kinh tế và


công nghệ

Tóm tắt: Trong những năm gần đây, dự đoán tỷ giá hối đoái Bitcoin
đã thu hút được sự quan tâm của các nhà nghiên cứu và nhà đầu tư.
Một số nghiên cứu đã sử dụng các phương pháp thống kê và kinh tế
lượng truyền thống để hiểu các yếu tố quyết định kinh tế và công
nghệ của Bitcoin, một số nghiên cứu đã xem xét việc phát triển các
mô hình dự đoán sử dụng các yếu tố quyết định này. Trong nghiên
cứu này, chúng tôi đã phát triển phương pháp tiếp cận hai giai đoạn
để khám phá xem liệu thông tin ẩn trong các yếu tố quyết định kinh
tế và công nghệ có thể dự đoán chính xác tỷ giá hối đoái Bitcoin hay
không. Trong giai đoạn đầu tiên, hai phương pháp lựa chọn đặc điểm
phi tuyến bao gồm mạng lưới thần kinh nhân tạo và rừng ngẫu nhiên
được sử dụng để giảm tập hợp con của các yếu tố dự đoán tiềm
năng bằng cách đo lường tầm quan trọng của các yếu tố kinh tế và
công nghệ. Ở giai đoạn thứ hai, các công cụ dự đoán tiềm năng
được tích hợp vào bộ nhớ dài hạn ngắn hạn (LSTM) để dự đoán tỷ giá
hối đoái Bitcoin bất kể tỷ giá hối đoái trước đó như thế nào. Kết quả
của chúng tôi cho thấy rằng bằng cách sử dụng các yếu tố quyết
định kinh tế và công nghệ, LSTM có thể đạt được hiệu suất dự đoán
tốt hơn so với đường trung bình động tích hợp tự hồi quy, hồi quy
vectơ hỗ trợ, hệ thống suy luận mờ mạng thích ứng và các phương
pháp LSTM, tất cả đều sử dụng tỷ giá hối đoái trước đó. Do đó, thông
tin thu được từ các yếu tố quyết định kinh tế và công nghệ quan
trọng hơn để dự đoán tỷ giá hối đoái Bitcoin so với tỷ giá hối đoái
trước đó.
1. Giới thiệu
Thị trường tiền điện tử đã bùng nổ trong thập kỷ qua. So với các loại
tiền tệ truyền thống, cải tiến lớn nhất của tiền điện tử là việc thiết
lập một hệ thống thanh toán phân tán mới dựa trên các giao thức
mã hóa, đảm bảo các giao dịch ngang hàng ẩn danh, không tốn kém
và nhanh chóng. Bitcoin là ví dụ thành công đầu tiên về tiền điện tử
phi tập trung. Bitcoin không có nhà phát hành tập trung mà thay vào
đó nó được tạo ra bằng cách tính toán trên các nút mạng. Bitcoin
được phân phối trên toàn thế giới và nó có thể được mua và bán trên
bất kỳ máy tính nào có kết nối Internet. Ngoài ra, thiết kế dựa trên
mật mã cho phép Bitcoin chỉ được chuyển hoặc thanh toán bởi chủ
sở hữu thực sự, điều này cũng đảm bảo tính ẩn danh của quyền sở
hữu tiền tệ và các giao dịch lưu thông. Theo trang web ''coinmarket-
cap'' (tại https://coinmarketcap.com; truy cập ngày 1 tháng 8 năm
2018), Bitcoin chiếm hơn 48% giá trị thị trường của tiền điện tử. Hiện
tại, Bitcoin vẫn là người dẫn đầu trong thị trường tiền điện tử.
Do sự đổi mới và vị thế thị trường của Bitcoin, nhiều nghiên cứu đã
điều tra vấn đề dự đoán tỷ giá hối đoái của Bitcoin. Các phương
pháp dự đoán tỷ giá hối đoái Bitcoin khác nhau có thể được chia
thành các mô hình thống kê và mô hình trí tuệ nhân tạo (AI) (Wang,
Wang, Zhang, & Guo, 2012). Các mô hình thống kê như đường trung
bình động tích hợp tự hồi quy (ARIMA), tính không đồng nhất có điều
kiện tự hồi quy tổng quát và các mô hình đường trung bình động có
trọng số theo cấp số nhân là những công cụ phân tích được sử dụng
phổ biến nhất (Baur, Dimpfl, & Kuck, 2018; Demir, Gozgor, Chi, &
Vigne, 2018; Dyhrberg, 2015; Những cách tiếp cận này có
được sử dụng rộng rãi nhưng chúng chỉ có thể giải quyết các vấn đề
tuyến tính và các biến phải tuân theo phân phối chuẩn (Cheng,
Chen, & Wei, 2010). Để khắc phục những hạn chế này, các mô hình
AI như mạng nơ-ron nhân tạo (ANN), mạng nơ-ron Bayes và hồi quy
vectơ hỗ trợ (SVR) đã được sử dụng để dự đoán giá Bitcoin (Jang &
Lee, 2018; Kristjanpoller & Minutolo, 2018; Mcnally , Roche, & Caton,
2018; Albuquerque, de Sá, Padula, & Zbikowski, 2018; Các phương
pháp tiếp cận AI này cho phép trích xuất các mẫu mới, ẩn và thông
tin đặc biệt từ các tập dữ liệu lớn mà không yêu cầu bất kỳ kiến thức
nào trước đó về dữ liệu.
Nghiên cứu hiện tại về dự đoán tỷ giá hối đoái Bitcoin đã sử dụng tỷ
giá hối đoái trước đó làm công cụ dự đoán. Tuy nhiên, trình tự Bitcoin
thể hiện hành vi phức tạp và rất không ổn định. Vì vậy, cần phải xem
xét các yếu tố quyết định khác nhau của tỷ giá hối đoái Bitcoin
(Kristoufek, 2013). Các yếu tố quyết định tỷ giá hối đoái Bitcoin đã
được khám phá bằng cách sử dụng các kỹ thuật kinh tế lượng như tự
hồi quy vectơ (VAR), bình phương tối thiểu thông thường (OLS) và
hồi quy lượng tử (QR) để hiểu tác động của các yếu tố quyết định
kinh tế và công nghệ đối với Bit. - tỷ giá hối đoái. Kristoufek (2013)
tuyên bố rằng có mối tương quan giữa tỷ giá hối đoái Bitcoin và các
truy vấn tìm kiếm trên Google Trends và Wikipedia. Polasik,
Piotrowska, Wisniewski, Kotkowski và Lightfoot (2015) nhận thấy
rằng tỷ giá hối đoái Bitcoin phụ thuộc vào mức độ phổ biến chung,
tâm lý truyền thông và tổng số giao dịch. Yang và Kim (2015) nhận
thấy rằng thước đo độ phức tạp cụ thể đối với luồng mạng giao dịch
Bitcoin có mối tương quan đáng kể với lợi nhuận và biến động của
thị trường Bitcoin. Dyhrberg (2015) chỉ ra rằng có một số điểm tương
đồng giữa vàng và đồng đô la Mỹ. Xin và Chong (2016) ước tính rằng
các yếu tố ảnh hưởng đến Bitcoin sẽ thay đổi từ cả góc độ dài hạn
và ngắn hạn. Balcilar, Bouri, Gupta và Roubaud (2017) kết luận rằng
khối lượng giao dịch Bitcoin có thể dự đoán lợi nhuận, nhưng nó
không thể giúp dự đoán sự biến động của lợi nhuận. Baur và cộng
sự. (2018) đã mở rộng nghiên cứu do Dyhrberg (2015) thực hiện và
cho thấy Bitcoin thể hiện các đặc điểm lợi nhuận, biến động và
tương quan khác nhau so với các tài sản khác, bao gồm vàng và đô
la Mỹ. Wei, Wang, Xiao và Shen (2018) đề xuất rằng tỷ giá hối đoái
Bitcoin có mối tương quan chéo chặt chẽ với số lượng giao dịch và
phí giao dịch. Nhìn chung, nghiên cứu gần đây chủ yếu tập trung
vào tác động của nhiều yếu tố quyết định khác nhau đến tỷ giá hối
đoái Bitcoin, thay vì khả năng dự đoán hoặc phân loại của một mô
hình. Tuy nhiên, cần lưu ý rằng mặc dù có thể thu được kết quả dự
đoán tốt bằng cách xem xét một số yếu tố quyết định tỷ giá hối đoái
Bitcoin (Brandvold, Molnár, Vagstad, & Valstad, 2015; Demir et al.,
2018; Kristoufek, 2014), nhiều nghiên cứu trước đây được dựa trên
những điều sau: (a) chỉ xem xét mối quan hệ tuyến tính giữa Bitcoin
và các yếu tố liên quan, mặc dù việc bao gồm các biến này có thể
dẫn đến những dự đoán tồi tệ hơn vì tác động của chúng có thể phi
tuyến tính; (b) sử dụng cả hai yếu tố quyết định và tỷ giá hối đoái
trước đó làm yếu tố dự báo, và do đó không biết liệu các yếu tố này
có thể dự đoán tỷ giá hối đoái trong tương lai hay không
tỷ lệ; và (c) chỉ điều tra tỷ giá hối đoái Bitcoin trong một khoảng thời
gian nhất định và do đó không rõ liệu kết quả có bao gồm tất cả các
khoảng thời gian có thể hay không. Do đó, trong nghiên cứu hiện tại,
chúng tôi đã điều tra xem liệu thông tin ẩn trong các yếu tố quyết
định kinh tế và công nghệ có thể dự đoán chính xác tỷ giá hối đoái
Bitcoin hay không.
Những đóng góp chính của bài viết này được tóm tắt như sau.
• Chúng tôi đã sử dụng hai phương pháp học máy, bao gồm ANN và
rừng ngẫu nhiên (RF), để giảm tập hợp con các yếu tố dự đoán tiềm
năng bằng cách đo lường tầm quan trọng của các yếu tố kinh tế và
công nghệ.
• Chúng tôi đã tích hợp các yếu tố dự đoán tiềm năng vào bộ nhớ
dài hạn ngắn hạn (LSTM) để thu được các dự đoán và so sánh hiệu
suất của nó với bốn mô hình sử dụng tỷ giá hối đoái trước đó, tức là
ANFIS, SVR, ARIMA và LSTM, để xác minh tính hợp lệ của những yếu
tố quyết định.
Phần còn lại của bài viết này được tổ chức như sau. Trong Phần 2,
chúng tôi mô tả dữ liệu được sử dụng trong nghiên cứu này. Trong
Phần 3, chúng tôi giải thích phương pháp được đề xuất. Trong Phần
4, chúng tôi trình bày các phân tích của mình và thảo luận về kết
quả. Cuối cùng, trong Phần 5, chúng tôi đưa ra kết luận của mình.
2. Chuẩn bị dữ liệu
Tỷ giá hối đoái Bitcoin là mục tiêu đầu ra của tất cả các mô hình dự
đoán được xem xét trong nghiên cứu này. Dữ liệu tỷ giá hối đoái
bitcoin được lấy từ:, hai yếu tố là yếu tố kinh tế và yếu tố công nghệ
ảnh hưởng đến sự thay đổi của tỷ giá hối đoái Bitcoin.
2.1. Hạng mục công nghệ
(1) Thông tin về blockchain Điểm khác biệt lớn nhất giữa Bitcoin
và truyền thống
tiền tệ là thị trường Bitcoin xây dựng niềm tin thông qua chuỗi khối.
Trong nghiên cứu này, chúng tôi lấy thông tin blockchain từ
https://blockchain.info/. Hơn nữa, các yếu tố blockchain sau đây cần
được xem xét như sau.
Kích thước khối (MB): kích thước của dữ liệu trong mạng
blockchain chứa dữ liệu được ghi lại vĩnh viễn.
Thời gian xác nhận: thời gian trung bình cần thiết để hoàn thành
một giao dịch phi tập trung và thêm nó vào chuỗi khối để xác thực
thành công.
Độ khó: độ khó của việc khai thác thành công các khối dữ liệu trong
thông tin giao dịch.
Tỷ lệ băm: thước đo khả năng xử lý mạng khai thác Bitcoin.
Lợi nhuận khai thác: tổng giá trị phần thưởng khối cơ sở tiền xu và
phí giao dịch được trả cho người khai thác.
Phí giao dịch trung bình: phí xử lý trung bình cho tất cả các giao
dịch diễn ra trong ngày.
Giá trị giao dịch trung bình: giá trị trung bình có được từ tất cả
các giao dịch diễn ra trong ngày.
Khối lượng giao dịch: số lượng giao dịch được ký kết giữa người
mua và người bán Bitcoin.
Vốn hóa thị trường: giá trị được tính bằng cách nhân giá với lượng
cung lưu thông.
Sự chú ý của công chúng Các biện pháp chú ý của công chúng
như lượt xem Wikipedia
và các tìm kiếm trên Google rất quan trọng để dự đoán tỷ giá hối
đoái Bitcoin (Dastgir, Demir, Downing, Gozgor, & Chi, 2018; Polasik
và cộng sự, 2015; Zhang, Wang, Li, & Shen, 2018). Trong nghiên cứu
này, chúng tôi sử dụng các dòng tweet trên Google Trends và Twitter
làm thước đo sự chú ý của công chúng. Cả hai yếu tố đều phản ánh
sự chú ý của công chúng nhưng chúng có những khác biệt nhỏ.
Google Trends cho biết ý định tìm hiểu về Bitcoin của công chúng,
trong khi các dòng tweet có thể thể hiện ý định thảo luận về Bitcoin
của công chúng. Hơn nữa, chúng tôi đã sử dụng ''Bitcoin'' (không
phân biệt chữ hoa chữ thường) làm từ khóa để nắm bắt lượng tìm
kiếm lịch sử từ Google Trends (https://trends.google.com/trends/) và
để lấy dữ liệu Twitter (từ https:// bitinfocharts.com/).
2.2. Hạng mục kinh tế
(1) Các chỉ số kinh tế vĩ mô Người ta tin rằng tỷ giá hối đoái, hàng
hóa
và các yếu tố kinh tế vĩ mô toàn cầu sẽ ảnh hưởng đến các nền kinh
tế mới nổi (Gospodinov & Jamali, 2015; Kandil & Mirzaie, 2002;
Mensi, Beljid, Boubaker, & Managi, 2013). Đặc biệt, Gajardo,
Kristjanpoller và Minutolo (2018) và Laboissiere, Fernandes và Lage
(2015) nhận thấy rằng các chỉ số kinh tế vĩ mô ảnh hưởng đến giá
Bitcoin trong dài hạn. Trong nghiên cứu này, chúng tôi đã xem xét
một số yếu tố bao gồm FTSE100, DOW30, VIX, SSE, giá dầu thô, giá
vàng, S&P500 và NASDAQ.
(2) Tỷ lệ tiền tệ toàn cầu (USD) Điểm tương đồng giữa Bitcoin và
tiền tệ truyền thống
giá trị đã được nhiều nhà nghiên cứu (Dyhrberg, 2015; Jang & Lee,
2018; Kristjanpoller & Minutolo, 2018) nghiên cứu. Trong nghiên cứu
này, chúng tôi tính đến tỷ giá hối đoái giữa các thị trường tiền tệ
toàn cầu. Đặc biệt, chúng tôi đã sử dụng tỷ giá hối đoái giữa các loại
tiền tệ chính thống (CHF, EUR, GBP, JPY và CNY) và đồng đô la Mỹ.
Dữ liệu thị trường công khai có liên quan được lấy bằng API Yahoo
YQL Finance.
Các yếu tố công nghệ và kinh tế liên quan đến tỷ giá hối đoái Bitcoin
được tóm tắt trong Bảng 1.
3. Phương pháp luận
Các câu hỏi nghiên cứu sau đây được giải quyết để khám phá xem
liệu thông tin ẩn giấu trong các yếu tố quyết định kinh tế và công
nghệ có thể dự đoán chính xác tỷ giá hối đoái Bitcoin hay không.
• Q1: Liệu các yếu tố kinh tế và công nghệ có thể mang lại hiệu quả
dự đoán cao hơn không?
• Câu hỏi 2: Nếu câu trả lời cho Câu hỏi 1 là ''có'' thì các yếu tố
quyết định tỷ giá hối đoái Bitcoin thay đổi như thế nào theo thời
gian?
Để giải quyết những câu hỏi này, chúng tôi đã tiến hành thử nghiệm
hai giai đoạn trong bốn giai đoạn, như trong Hình 1.
Ở giai đoạn I, chúng tôi sử dụng hai phương pháp học máy là ANN
và RF để xác định các yếu tố kinh tế và công nghệ liên quan đến tỷ
giá hối đoái Bitcoin , nơi họ hình thành một tập hợp con của
yếu tố dự báo tiềm năng. Ở giai đoạn II, các yếu tố dự đoán tiềm
năng được đưa vào LSTM để dự đoán tỷ giá hối đoái Bitcoin, bất kể
tỷ giá hối đoái trước đó như thế nào. Ngoài ra, bốn mô hình, tức là
ARIMA, SVR, ANFIS và LSTM, đã được sử dụng để đưa ra dự đoán dựa
trên tỷ giá hối đoái trước đó. Hơn nữa, sai số bình phương trung bình
gốc (RMSE), sai số tuyệt đối trung bình (MAE), sai số phần trăm
tuyệt đối trung bình (MAPE) và độ chính xác định hướng (DA) đã
được sử dụng để so sánh hiệu suất dự đoán của các mô hình. Việc
đạt được hiệu suất tốt hơn với LSTM bằng cách sử dụng các yếu tố
dự báo kinh tế và công nghệ sẽ cho thấy rằng thông tin ẩn trong các
yếu tố quyết định kinh tế và công nghệ quan trọng hơn mức giá
trước đó.
3.1. Tiền xử lý dữ liệu
(1) Làm sạch dữ liệu Dữ liệu được sử dụng trong nghiên cứu này
được thu thập thông qua API
và các trang web, do đó một số giá trị bị thiếu hoặc vô nghĩa. Do đó,
giá trị trung bình thống kê được tính toán như một quan sát khi thích
hợp để thay thế dữ liệu bị thiếu; mặt khác, ngày tương ứng của giá
trị bị thiếu sẽ bị xóa khỏi tập dữ liệu. Theo đề xuất của Serneels, De
và Van Espen (2006), chúng tôi đã sử dụng quy trình ký hiệu khoảng
trắng để xóa điểm dữ liệu tương ứng cho các giá trị ngoại lệ.
(2) Phân chia dữ liệu Chúng tôi đã điều tra bốn giai đoạn quan trọng
đối với Bitcoin.
Giai đoạn đầu tiên là từ ngày 1 tháng 8 năm 2011 đến ngày 31
tháng 12 năm 2013. Trong giai đoạn này, Mt. Gox là nhà điều hành
sàn giao dịch Bitcoin lớn nhất và tỷ giá hối đoái Bitcoin vượt quá 1
ounce vàng. Giai đoạn thứ hai là từ ngày 1 tháng 8 năm 2013 đến
ngày 31 tháng 12 năm 2014. Trong giai đoạn này, ba nhà điều hành
sàn giao dịch Bitcoin lớn là BitStamp, BTCe và BiFinex thống trị các
giao dịch Bitcoin. Giai đoạn thứ ba là từ ngày 1 tháng 7 năm 2014
đến ngày 31 tháng 12 năm 2017. Trong giai đoạn này, hàng chục
sàn giao dịch Bitcoin hoạt động trên khắp thế giới và số lượng giao
dịch Bitcoin tăng vọt ở hầu hết các quốc gia và khu vực. Giai đoạn
thứ tư là từ ngày 1 tháng 7 năm 2015 đến ngày 31 tháng 7 năm
2018. Trong giai đoạn này, tỷ giá hối đoái Bitcoin sắp vượt qua
20.000 USD nhưng nó đột ngột giảm xuống dưới 4500 USD. Việc
chia phân tích thực nghiệm thành bốn giai đoạn này cho phép chúng
tôi kiểm tra xem các yếu tố quyết định tỷ giá hối đoái Bitcoin thay
đổi như thế nào theo thời gian.
Ngoài ra, việc phân chia tập huấn luyện và tập kiểm tra là một bước
quan trọng để dự báo. Chúng tôi sử dụng dữ liệu từ 2 tháng qua làm
tập kiểm tra và tất cả dữ liệu còn lại làm tập huấn luyện.
(3) Chuyển đổi dữ liệu Mô hình được sử dụng trong nghiên cứu này
yêu cầu tính năng chia tỷ lệ
quy trình để tránh các thuộc tính có phạm vi giá trị lớn hơn chi phối
phạm vi thuộc tính nhỏ hơn (Rezakazemi, Ghafarinazari, Shirazian, &
Khoshsima, 2013). Vì vậy, chúng tôi đã sử dụng một phương pháp
tiêu chuẩn hóa để chia tỷ lệ các biến đầu vào. Công thức cụ thể
được thể hiện như sau:
Xn = X − Xmin Xmax − Xmin, (1)
trong đó Xmin, Xmax và Xn lần lượt là các giá trị tối thiểu, tối đa và
chuẩn hóa của dữ liệu mẫu. Hình 2 hiển thị dữ liệu lịch sử được
chuẩn hóa về tỷ giá hối đoái Bitcoin, các yếu tố kinh tế và yếu tố
công nghệ

3.2. Lập mô hình: Giai đoạn I


Các yếu tố kinh tế và công nghệ được lựa chọn trong nghiên cứu này
chủ yếu được lấy từ các phân tích thống kê trước đó. Việc tích hợp
chúng vào các mô hình AI có thể dẫn đến hiệu suất dự đoán kém
hơn. Do đó, trong Giai đoạn I, chúng tôi đã sử dụng các phương pháp
lựa chọn đặc điểm để xác định các yếu tố có giá trị dự đoán lớn nhất
trước khi loại bỏ các yếu tố dư thừa. Vì vậy, giai đoạn đầu tiên được
chia thành ba bước sau. Ở bước đầu tiên, hai mô hình học máy là RF
và ANN đã được sử dụng. Các nghiên cứu trước đây đã chứng minh
rằng những mô hình này có tính chọn lọc đặc tính tốt (Enke &
Thawornwong, 2005; Tsai & Hsiao, 2011). Tiếp theo, tầm quan trọng
của các yếu tố khác nhau được đo lường bằng phương pháp phân
tích độ nhạy (Dag, Oztekin, Yucel, Bulur, & Megahed, 2016). Giá trị
tầm quan trọng của các biến được đo bằng RF và ANN đã được
chuẩn hóa thành [0,1]. Trong bước thứ ba, như Tsai và Hsiao (2011)
đã chỉ ra, có thể đạt được hiệu suất dự đoán tốt hơn bằng cách kết
hợp nhiều phương pháp lựa chọn đặc điểm thay vì sử dụng một
phương pháp duy nhất. Do đó, trong nghiên cứu này, sự kết hợp của
các biến không đại diện đã được lọc bằng chiến lược chéo và bộ tính
năng ứng cử viên cuối cùng đã được tạo cho giai đoạn II. Gói caret
được triển khai trong
ngôn ngữ thống kê R được sử dụng để phát triển mô hình ANN và RF
(xem Kuhn (2015)).
3.2.1. Rừng ngẫu nhiên
RF là một phương pháp học máy tổng hợp sử dụng kỹ thuật khởi
động và tách nút ngẫu nhiên để xây dựng nhiều cây quyết định và
thu được kết quả phân loại cuối cùng bằng cách bỏ phiếu. So với cây
hồi quy đơn, RF có khả năng xử lý nhiễu dữ liệu và thiếu giá trị tốt
hơn, đồng thời nó có khả năng phân tích các đặc điểm phân loại
tương tác phức tạp (Breiman, 2001; Svetnik và cộng sự, 2003). Trong
RF, tầm quan trọng của yếu tố x có thể được tính như sau (Lahouar
& Slama, 2017).
(i) Đối với mỗi cây quyết định trong RF, n dữ liệu xuất xuất được sử
dụng để tính toán lỗi xuất xuất (OOBE), được ký hiệu là OOBE1.
OOBE được thể hiện như sau:
OOBE = 1 n
n∑
i=1 (Yi − ˆYi),
(2)
trong đó Yi là giá trị quan sát được, ˆYi là giá trị ước tính và n là số kỳ
dự báo.
(ii) Thêm ngẫu nhiên nhiễu vào hệ số x trong dữ liệu xuất xưởng và
tính toán lại OOBE, ký hiệu là OOBE2.
Hình 2. Dữ liệu lịch sử được chuẩn hóa về tỷ giá hối đoái Bitcoin, các
yếu tố kinh tế và yếu tố công nghệ.

Thông tin chi tiết hơn về phương pháp RF có thể được tìm thấy trong
Cutler, Cutler và Stevens (2004). Trong nghiên cứu này, chúng tôi đã
sử dụng 500 cây để triển khai RF.
3.2.2. Mạng lưới thần kinh nhân tạo
ANN được sử dụng rộng rãi trong các vấn đề phân tích dữ liệu tính
toán khác nhau, bao gồm phân loại, hồi quy và nhận dạng mẫu. ANN
bao gồm các lớp đầu vào, lớp ẩn và lớp đầu ra và mỗi lớp bao gồm
một số nơ-ron, còn được gọi là các phần tử xử lý (PE). Ngoài ra, ANN
có thể được sử dụng để đo lường tầm quan trọng của yếu tố đầu vào
x bằng cách đo sự thay đổi của sai số bình phương trung bình (COE)
khi đầu vào tương ứng bị xóa khỏi mạng (Xu, Wong, & Chin, 2013).
COE được định nghĩa như sau:

và MSE1 và MSE2 lần lượt biểu thị sai số bình phương trung bình khi
có và không có x.
Để biết phần giới thiệu về ANN, vui lòng tham khảo các nghiên cứu
của Elhewy, Mesbahi và Pu (2006) và Gomes và Awruch (2004).
Trong nghiên cứu hiện tại, chúng tôi đã sử dụng cấu trúc mạng nơ-
ron truyền thẳng nhiều lớp được huấn luyện bằng phương pháp lan
truyền ngược.
3.3. Lập mô hình: Giai đoạn II
Trong giai đoạn này, chúng tôi giả định rằng các yếu tố quyết định
quan trọng có thể mang lại hiệu suất dự đoán cao hơn trong các giai
đoạn khác nhau. Để đánh giá giả thuyết này, chúng tôi đã kết hợp
các yếu tố dự đoán đã chọn vào LSTM để dự đoán tỷ giá hối đoái
Bitcoin. Ngoài ra, bốn mô hình dự đoán, tức là ARIMA, SVR, ANFIS và
LSTM, đã được sử dụng để dự đoán tỷ giá hối đoái Bitcoin dựa trên tỷ
giá hối đoái trước đó. Hơn nữa, chúng tôi đã sử dụng bốn số liệu, tức
là MAPE, MAE, RMSE và DA, để đo lường hiệu suất của các mô hình
khác nhau.
3.3.1. Trí nhớ ngắn hạn dài
LSTM do Hochreiter và Schmidhuber (1997) đề xuất là mô hình được
sử dụng phổ biến nhất trong các mạng thần kinh đệ quy (RNN).
LSTM có thể thu được các dự đoán chuỗi thời gian tốt hơn vì rất khó
để áp dụng nhiều phương pháp tuyến tính cổ điển cho các vấn đề dự
đoán đa biến hoặc đa đầu vào. So với RNN, LSTM được đặc trưng bởi
việc bổ sung các ô nhớ để xử lý thông tin. Cấu trúc của ô nhớ được
minh họa trong Hình 3.
Như được hiển thị trong Hình 3, tại mỗi dấu thời gian t, mỗi ô nhớ có
ba cổng duy trì và điều chỉnh trạng thái ô của chúng: cổng quên (ft ),
cổng đầu vào (it ) và cổng đầu ra (ot ). Mỗi cổng phục vụ một mục
đích khác nhau, như sau.
Cổng đầu vào nó điều khiển thông tin đầu vào chảy vào ô nhớ, ở đó

trong đó Wt là ma trận chiếu để giảm kích thước của ht.


Do kích thước mẫu tương đối nhỏ, chúng tôi đã sử dụng cấu trúc
LSTM đơn giản bao gồm lớp đầu vào, lớp ẩn và lớp đầu ra. Ngoài ra,
chúng tôi đã áp dụng chính quy hóa bỏ học trong lớp lặp lại để giảm
nguy cơ trang bị quá mức và sử dụng tính năng dừng sớm để tự
động rút ra số lượng kỷ nguyên cho việc đào tạo trong mỗi giai đoạn
nghiên cứu. LSTM được triển khai bằng gói ''keras'' trong Python.
3.3.2. Đường trung bình động tích hợp tự hồi quy
Mô hình ARIMA là mô hình chuỗi thời gian thống kê cổ điển. Mô hình
này thường được biểu thị dưới dạng ARIMA (p,d,q), trong đó p là số
thuật ngữ tự hồi quy, d là số lượng khác biệt không theo mùa và q là
số lỗi dự đoán độ trễ có trong đó. Thông tin chi tiết hơn về mô hình
ARIMA được cung cấp bởi Patle et al. (2015). Trong nghiên cứu này,
chúng tôi đã sử dụng gói ''statsmodel'' trong Python để phù hợp với
mô hình và Tiêu chí thông tin Akaike (AIC) do Bozdogan (1987) giới
thiệu đã được sử dụng để chọn các tham số của mô hình ARIMA.
3.3.3. Hỗ trợ hồi quy vector
SVR là mô hình AI mạnh mẽ đã được áp dụng thành công trong
nhiều lĩnh vực để dự đoán chuỗi thời gian như dự đoán luồng giao
thông (Castro-Neto, Jeong, Jeong, & Han, 2009) và dự báo chuỗi thời
gian tài chính (Guo et al., 2018) . Để thảo luận thêm về SVR, xem
Brereton và Lloyd (2010). Lưu ý rằng SVR sử dụng hạt nhân để tăng
tính chiều của dữ liệu, từ đó phân tách chúng theo cách tuyến tính.
Do đó, trong bài báo này, chúng tôi sử dụng hàm cơ sở xuyên tâm
làm hàm hạt nhân vì khả năng của nó và cách thực hiện đơn giản
(Huang, Chuang, Wu, & Lai, 2010). SVR được triển khai bằng gói
''sklearn'' trong Python.

3.3.4. Hệ thống suy luận mờ mạng thích ứng (ANFIS)


ANFIS do Jang (1993) đề xuất là một phương pháp rất thành công để
kết hợp ANN với hệ thống suy luận mờ. ANFIS đã được áp dụng
thành công trong nhiều lĩnh vực như phân loại dữ liệu, phân tích
quyết định, hệ thống chuyên gia và thị giác máy tính (Chang &
Chang, 2006). Việc sử dụng logic mờ trong mạng đạt được nhờ chức
năng thành viên và số mờ được sử dụng cho toàn bộ mạng. Để thảo
luận thêm về ANFIS, xem Hong và Lee (1996). Trong nghiên cứu này,
chúng tôi đã sử dụng hộp công cụ logic mờ Matlab để triển khai
ANFIS. Cụ thể, chúng tôi đã sử dụng phương pháp phân cụm c-mean
mờ để giảm và đơn giản hóa chiều dữ liệu. Hơn nữa, sự kết hợp giữa
thuật toán lan truyền ngược và thuật toán bình phương tối thiểu đã
được sử dụng để điều chỉnh các tham số của các hàm thành viên
(Chen, 2013). Chúng tôi đã sử dụng hàm Gaussian làm hàm thành
viên mờ (MF).
3.3.5. Thuật toán di truyền (GA)
GA đã được sử dụng trong nhiều nghiên cứu làm công cụ tìm kiếm
và tối ưu hóa và GA vẫn là phương pháp phổ biến nhất cho những
mục đích này (Aguilar-Rivera, Valenzuela-Rendón, & Rodríguez-Ortiz,
2015). GA chủ yếu được sử dụng để giải quyết các vấn đề tối ưu hóa,
trong đó mục tiêu quan trọng thường là nhanh chóng đạt được giải
pháp thỏa đáng, mặc dù nó có thể chưa tối ưu. Do đó, như trong
Ong, Huang và Tzeng (2005) và García và Kristjanpoller (2019), GA
đã được sử dụng để đạt được cùng số lượng thử nghiệm dựa trên
cùng một số giá trị tham số khác nhau trong nghiên cứu này. Đặc
biệt, chúng tôi đã sử dụng GA để xác định độ trễ thời gian cho các
yếu tố đầu vào trong mô hình và các tham số trong các mô hình
khác nhau.
4. Kết quả thực nghiệm
4.1. Giai đoạn I: Lập mô hình cho Q1
Trong giai đoạn này, chúng tôi hướng đến việc xác định khả năng dự
đoán của các yếu tố kinh tế và công nghệ, đồng thời sàng lọc các
yếu tố dự đoán hiệu quả hơn. Đầu tiên, chúng tôi giả định rằng các
yếu tố kinh tế và công nghệ quyết định tỷ giá hối đoái Bitcoin sẽ
thay đổi trong các thời kỳ khác nhau. Như đã đề cập trong Phần 3.2,
RF và ANN được sử dụng để lựa chọn tính năng. Phương pháp phân
tích độ nhạy được áp dụng
các mô hình này để đo lường tầm quan trọng của các yếu tố kinh tế
và công nghệ. Quả sung. 4–7 hiển thị thứ hạng của điểm quan trọng
cho từng yếu tố trong bốn giai đoạn. Từ quả sung. 4–7 chúng ta có
thể thấy như sau.
(a) Tỷ giá hối đoái Bitcoin trong bốn giai đoạn bị ảnh hưởng bởi các
yếu tố kinh tế và công nghệ khác nhau, từ đó hỗ trợ cho các giả định
của chúng tôi.
(b) Từ góc độ công nghệ, khi tỷ giá hối đoái Bitcoin tăng và giảm
mạnh, sự chú ý của công chúng dường như đóng vai trò quan trọng
hơn. Hai biến số này nhìn chung gây ra những cú sốc ngắn hạn đối
với lợi ích công chúng và ảnh hưởng đến tâm lý nhà đầu tư. Về thông
tin blockchain, chúng tôi nhận thấy mặc dù vốn hóa thị trường luôn
có tác động lớn đến tỷ giá hối đoái Bitcoin nhưng các yếu tố quan
trọng nhất ảnh hưởng đến đồng tiền này lại thay đổi liên tục. Ngược
lại, ảnh hưởng của thời gian tạo khối thấp hơn đáng kể so với các chỉ
báo khác, gần bằng 0. Ngoài ra, phí giao dịch trung bình là một yếu
tố dự báo mạnh mẽ về tỷ giá hối đoái Bitcoin và tầm quan trọng của
nó luôn vượt quá 0,75. Điều thú vị là, mặc dù giá thị trường gắn liền
với chi phí khai thác nhưng ảnh hưởng của độ khó khai thác sẽ giảm
dần theo thời gian khi hiệu quả của công nghệ khai thác tăng lên.
(c) Từ góc độ kinh tế, tỷ giá hối đoái Bitcoin chủ yếu là phản ứng đối
với các hoạt động thị trường, qua đó chỉ ra rằng sự phát triển kinh tế
vĩ mô có thể gây ra những biến động ngắn hạn trên thị trường
Bitcoin. Mặt khác, mặc dù tầm quan trọng của ngoại hối không cao
nhưng nó luôn có tác dụng nhất định.
(d) Số lượng các yếu tố quan trọng cao hơn đáng kể trong giai đoạn
biến động của tỷ giá Bitcoin (từ 01/07/2014 đến 31/12/2017) so với
giai đoạn ổn định (từ 01/07/2013 đến 31/12/2014) ), qua đó chỉ ra
rằng khi tỷ giá Bitcoin không ổn định, các yếu tố kinh tế và công
nghệ có nhiều khả năng trực tiếp quyết định sự thay đổi của tỷ giá.
Hơn nữa, dựa trên phân tích độ nhạy, phương pháp chéo được sử
dụng để loại bỏ các yếu tố có điểm quan trọng nhỏ hơn 0,6 và thu
được một bộ các yếu tố dự đoán tiềm năng. Bảng 2 tóm tắt các yếu
tố dự báo kinh tế và công nghệ được lựa chọn bằng phương pháp lựa
chọn đặc điểm cho bốn giai đoạn.
4.2. Giai đoạn II: Lập mô hình cho Q2
Trong phần này, chúng tôi giả định rằng các yếu tố quyết định kinh
tế và công nghệ có thể thúc đẩy những thay đổi trong tỷ giá hối đoái
Bitcoin. Như đã đề cập trong Phần 3.3, các yếu tố dự đoán kinh tế và
công nghệ được xác định trong giai đoạn đầu tiên được sử dụng làm
đầu vào cho LSTM, trong khi tỷ giá hối đoái Bitcoin trước đó được sử
dụng làm đầu vào cho ARIMA, SVR, ANFIS và LSTM.
RMSE, MAPE, MAE và DA được sử dụng làm số liệu để đánh giá hiệu
suất dự đoán của các mô hình khác nhau. Ba số liệu đầu tiên được
sử dụng phổ biến nhất
cho các vấn đề hồi quy. Giá trị thấp hơn của các chỉ số này cho thấy
các mô hình phù hợp hơn. Ngoài ra, do mục đích của dự báo là hỗ
trợ hoặc cải thiện việc ra quyết định của những người thực hành kinh
doanh nên chúng tôi cũng sử dụng DA để đo lường khả năng dự
đoán hướng thay đổi. Giá trị DA cao hơn cho thấy hiệu suất dự báo
tốt hơn. Bốn số liệu được xác định như sau:
Hơn nữa, chúng tôi đã sử dụng thử nghiệm tập hợp độ tin cậy mô
hình (MCS) do Hansen, Lunde và Nason (2003) và Hansen, Lunde và
Nason (2011) giới thiệu để tiến hành các thử nghiệm thống kê về
hiệu suất. Thử nghiệm MCS đã được sử dụng rộng rãi để đánh giá
khả năng dự đoán của các mô hình khác nhau (García &
Kristjanpoller, 2019; Qiao, Teng, Li, & Liu, 2019; Tian, Yang, & Chen,
2017). Trong nghiên cứu này, chúng tôi sử dụng thử nghiệm

Trong đó dij biểu thị sự chênh lệch tổn thất giữa các mô hình i và j,
di,. là tổn thất đơn giản của mô hình thứ i so với tổn thất trung bình
giữa các mô hình trong M và ˆvar( ̄dij) và ˆvar( ̄di,.) lần lượt là các
ước tính khởi động của var( ̄dij) và var( ̄di,.).

ban đầu. Đối với một mô hình nhất định i ∈ M, giá trị p MCS ˆp∗i là
Quy trình kiểm tra MCS gán giá trị p cho từng mô hình trong tập hợp

không. Nó cho rằng i ∈ M∗1−α chỉ khi ˆp∗i ≥ α.


mức tin cậy ngưỡng α xác định liệu một mô hình có thuộc MCS hay

4.2.1. Đánh giá hiệu suất dự đoán


GA được áp dụng trong nghiên cứu này nhằm thu được các giá trị
tham số cho các mô hình khác nhau trong cùng một số thí nghiệm.
Các tham số cho GA được đặt như sau: kích thước quần thể = 30,
thứ nguyên hàm = 1,0, xác suất chéo = 0,9, xác suất đột biến = 0,1
và số thế hệ tối đa = 100. Chúng tôi đã thu được các giá trị của
tham số điều khiển được sử dụng cho các mô hình khác nhau bằng
cách sử dụng GA. Kết quả được thể hiện ở Bảng 3.
Ngoài ra, để có thêm thông tin về phân bổ tổng thể của kết quả, mỗi
mô hình thu được bằng GA được chạy độc lập 20 lần. Bảng 4–7 tóm
tắt số liệu hiệu suất cho các mô hình khác nhau về RMSE, MAPE,
MAE và DA dựa trên bốn chỉ số thống kê bao gồm độ lệch tối đa, tối
thiểu, trung bình và độ lệch chuẩn (SD). Các kết quả tốt nhất được
thể hiện bằng chữ in đậm. Quả sung. 8–11 so sánh hiệu suất tổng
thể của các mô hình khác nhau dựa trên sơ đồ hình hộp.
Từ Bảng 4–7 và Hình. 8–11, chúng ta có thể rút ra kết luận sau đây.

Đầu tiên, đối với bốn mô hình điểm chuẩn dựa trên tỷ giá hối đoái
trước đó, tức là ARIMA, ANFIS, SVR và LSTM, các mô hình AI có thể
khớp với chuỗi thời gian ban đầu theo cách phi tuyến tính và ARIMA
không đạt được hiệu suất kém hơn. Ví dụ: trong khoảng thời gian từ
ngày 1 tháng 7 năm 2013 đến ngày 31 tháng 12 năm 2014, xét về
giá trị trung bình và tối thiểu, MAPE thu được bởi ARIMA vượt trội
hơn so với MAPE thu được bởi SVR, ANFIS và LSTM.
Thứ hai, LSTM thu được DA cao hơn bằng cách sử dụng các yếu tố
dự báo kinh tế và công nghệ. SD mà LSTM thu được bằng cách sử
dụng các yếu tố dự đoán là tương đối lớn, nhưng nó cũng có giá trị
trung bình, giá trị tối thiểu và giá trị tối đa lớn hơn. Đặc biệt, Bitcoin
giảm mạnh trong khoảng thời gian từ ngày 1/7/2015 đến ngày
31/7/2018. Hơn nữa, đối với các mô hình chuẩn dựa trên tỷ giá hối
đoái trước đó, các giá trị tối đa, tối thiểu và trung bình của DA đều
nhỏ hơn 50. , nhưng các giá trị tương ứng lớn hơn 50 với LSTM sử
dụng các yếu tố dự đoán.
Thứ ba, trong mỗi giai đoạn, các giá trị RMSE, MAPE và MAE mà
LSTM thu được bằng cách sử dụng các yếu tố dự đoán kinh tế và
công nghệ cho thấy hiệu suất tốt hơn về mặt bốn chỉ số thống kê
bao gồm giá trị tối thiểu, tối đa, trung bình và SD. Nói cách khác,
LSTM sử dụng các yếu tố dự đoán có hiệu suất dự đoán vượt trội về
độ chính xác, tính ổn định và độ tin cậy so với các mô hình sử dụng
tỷ giá hối đoái trước đó.
4.2.2. Kiểm tra độ tin cậy
Thử nghiệm MCS được thực hiện để phân tích ý nghĩa của kết quả.
Theo khuyến nghị của Hansen et al. (2011), độ dài khối và số lượng
mẫu bootstrap được đặt tương ứng là 2 và 10.000. Bảng 8–10 trình
bày tập hợp mô hình (SSM) tối ưu và giá trị p tương ứng ở mức ý
nghĩa 20%. Trong các bảng này, RankM và RankR là các mô hình
được sắp xếp
theo hai thống kê lần lượt bao gồm TR,M và Tmax,M và pM và pR là
các giá trị p tương ứng cho toàn bộ bảng xếp hạng. Bảng 8–10
chứng minh rõ ràng rằng việc bao gồm các yếu tố quyết định kinh tế
và công nghệ có thể mang lại hiệu suất dự đoán tốt hơn. Ví dụ: theo
ba chỉ số đánh giá, các mô hình chuẩn dựa trên tỷ giá hối đoái trước
đó không thể vượt qua các bài kiểm tra MCS trong một số trường
hợp, trong khi LSTM sử dụng các yếu tố dự đoán đã vượt qua tất cả
các bài kiểm tra. Cần lưu ý rằng các giá trị TR,M và Tmax,M mà
LSTM thu được bằng cách sử dụng các yếu tố dự đoán là 1, qua đó
khẳng định lợi thế vượt trội của mô hình được xây dựng để dự báo tỷ
giá hối đoái Bitcoin.
Nhìn chung, các kết quả thử nghiệm được trình bày trong Phần 4.2.1
và 4.2.2 ủng hộ giả định chung của chúng tôi rằng: ''Tỷ giá hối đoái
Bitcoin được thúc đẩy bởi các yếu tố kinh tế và công nghệ khác nhau
trong các giai đoạn khác nhau''. Như vậy, Hiệu suất dự đoán tốt hơn
có thể đạt được bằng cách sử dụng thông tin ẩn trong các yếu tố
quyết định kinh tế và công nghệ thay vì sử dụng tỷ giá hối đoái trước
đó.
5. Kết luận
Bitcoin là một loại tiền điện tử thành công và nó đã được nghiên cứu
rộng rãi trong lĩnh vực kinh tế và khoa học máy tính. Trong nghiên
cứu này, chúng tôi đã kiểm tra xem liệu các yếu tố quyết định kinh
tế và công nghệ có thể dự đoán chính xác tỷ giá hối đoái Bitcoin hay
không. Chúng tôi đã thu thập và xử lý trước dữ liệu từ ngày 1 tháng
8 năm 2011 đến ngày 31 tháng 7 năm 2018, bao gồm 24 yếu tố
được xem xét trong các nghiên cứu trước đây. Ngoài ra, để tiết lộ
những thay đổi năng động trên thị trường Bitcoin, chúng tôi đã chia
bộ dữ liệu thành bốn giai đoạn. Sau đó, một mô hình dự đoán hai
giai đoạn đã được phát triển.
Trong giai đoạn đầu tiên, chúng tôi đã sử dụng hai phương pháp lựa
chọn tính năng bao gồm ANN và RF để đo lường tầm quan trọng của
các yếu tố kinh tế và công nghệ, đồng thời thu được một tập hợp
con các yếu tố dự đoán tiềm năng. Sau khi so sánh thứ hạng tầm
quan trọng của các yếu tố khác nhau trong bốn bộ dữ liệu, chúng tôi
nhận thấy rằng tỷ giá hối đoái Bitcoin bị ảnh hưởng bởi các yếu tố
kinh tế và công nghệ khác nhau trong các giai đoạn khác nhau.
Trong giai đoạn thứ hai, các yếu tố dự đoán đóng vai trò là đầu vào
cho dự đoán của LSTM nhưng không xem xét tỷ giá hối đoái Bitcoin
trước đó. Ngoài ra, các mô hình ANFIS, ARIMA, SVR và LSTM đưa ra
dự đoán dựa trên tỷ giá hối đoái Bitcoin trước đó. Kết quả đã chứng
minh rõ ràng rằng việc sử dụng các yếu tố quyết định kinh tế và
công nghệ có hiệu quả để dự đoán tỷ giá hối đoái Bitcoin.
Trong nghiên cứu trong tương lai, chúng tôi sẽ xem xét nhiều yếu tố
hơn trong mô hình dự đoán hai giai đoạn được đề xuất của chúng
tôi, chẳng hạn như tâm lý nhà đầu tư và quy định của chính phủ.
Hơn nữa, chúng tôi sẽ áp dụng mô hình đề xuất cho các vấn đề dự
đoán khác, chẳng hạn như xu hướng chứng khoán và luồng giao
thông

You might also like