13 - Machine Learning Model For Bitcoin Exchange Rate Prediction
13 - Machine Learning Model For Bitcoin Exchange Rate Prediction
Tóm tắt: Trong những năm gần đây, dự đoán tỷ giá hối đoái Bitcoin
đã thu hút được sự quan tâm của các nhà nghiên cứu và nhà đầu tư.
Một số nghiên cứu đã sử dụng các phương pháp thống kê và kinh tế
lượng truyền thống để hiểu các yếu tố quyết định kinh tế và công
nghệ của Bitcoin, một số nghiên cứu đã xem xét việc phát triển các
mô hình dự đoán sử dụng các yếu tố quyết định này. Trong nghiên
cứu này, chúng tôi đã phát triển phương pháp tiếp cận hai giai đoạn
để khám phá xem liệu thông tin ẩn trong các yếu tố quyết định kinh
tế và công nghệ có thể dự đoán chính xác tỷ giá hối đoái Bitcoin hay
không. Trong giai đoạn đầu tiên, hai phương pháp lựa chọn đặc điểm
phi tuyến bao gồm mạng lưới thần kinh nhân tạo và rừng ngẫu nhiên
được sử dụng để giảm tập hợp con của các yếu tố dự đoán tiềm
năng bằng cách đo lường tầm quan trọng của các yếu tố kinh tế và
công nghệ. Ở giai đoạn thứ hai, các công cụ dự đoán tiềm năng
được tích hợp vào bộ nhớ dài hạn ngắn hạn (LSTM) để dự đoán tỷ giá
hối đoái Bitcoin bất kể tỷ giá hối đoái trước đó như thế nào. Kết quả
của chúng tôi cho thấy rằng bằng cách sử dụng các yếu tố quyết
định kinh tế và công nghệ, LSTM có thể đạt được hiệu suất dự đoán
tốt hơn so với đường trung bình động tích hợp tự hồi quy, hồi quy
vectơ hỗ trợ, hệ thống suy luận mờ mạng thích ứng và các phương
pháp LSTM, tất cả đều sử dụng tỷ giá hối đoái trước đó. Do đó, thông
tin thu được từ các yếu tố quyết định kinh tế và công nghệ quan
trọng hơn để dự đoán tỷ giá hối đoái Bitcoin so với tỷ giá hối đoái
trước đó.
1. Giới thiệu
Thị trường tiền điện tử đã bùng nổ trong thập kỷ qua. So với các loại
tiền tệ truyền thống, cải tiến lớn nhất của tiền điện tử là việc thiết
lập một hệ thống thanh toán phân tán mới dựa trên các giao thức
mã hóa, đảm bảo các giao dịch ngang hàng ẩn danh, không tốn kém
và nhanh chóng. Bitcoin là ví dụ thành công đầu tiên về tiền điện tử
phi tập trung. Bitcoin không có nhà phát hành tập trung mà thay vào
đó nó được tạo ra bằng cách tính toán trên các nút mạng. Bitcoin
được phân phối trên toàn thế giới và nó có thể được mua và bán trên
bất kỳ máy tính nào có kết nối Internet. Ngoài ra, thiết kế dựa trên
mật mã cho phép Bitcoin chỉ được chuyển hoặc thanh toán bởi chủ
sở hữu thực sự, điều này cũng đảm bảo tính ẩn danh của quyền sở
hữu tiền tệ và các giao dịch lưu thông. Theo trang web ''coinmarket-
cap'' (tại https://coinmarketcap.com; truy cập ngày 1 tháng 8 năm
2018), Bitcoin chiếm hơn 48% giá trị thị trường của tiền điện tử. Hiện
tại, Bitcoin vẫn là người dẫn đầu trong thị trường tiền điện tử.
Do sự đổi mới và vị thế thị trường của Bitcoin, nhiều nghiên cứu đã
điều tra vấn đề dự đoán tỷ giá hối đoái của Bitcoin. Các phương
pháp dự đoán tỷ giá hối đoái Bitcoin khác nhau có thể được chia
thành các mô hình thống kê và mô hình trí tuệ nhân tạo (AI) (Wang,
Wang, Zhang, & Guo, 2012). Các mô hình thống kê như đường trung
bình động tích hợp tự hồi quy (ARIMA), tính không đồng nhất có điều
kiện tự hồi quy tổng quát và các mô hình đường trung bình động có
trọng số theo cấp số nhân là những công cụ phân tích được sử dụng
phổ biến nhất (Baur, Dimpfl, & Kuck, 2018; Demir, Gozgor, Chi, &
Vigne, 2018; Dyhrberg, 2015; Những cách tiếp cận này có
được sử dụng rộng rãi nhưng chúng chỉ có thể giải quyết các vấn đề
tuyến tính và các biến phải tuân theo phân phối chuẩn (Cheng,
Chen, & Wei, 2010). Để khắc phục những hạn chế này, các mô hình
AI như mạng nơ-ron nhân tạo (ANN), mạng nơ-ron Bayes và hồi quy
vectơ hỗ trợ (SVR) đã được sử dụng để dự đoán giá Bitcoin (Jang &
Lee, 2018; Kristjanpoller & Minutolo, 2018; Mcnally , Roche, & Caton,
2018; Albuquerque, de Sá, Padula, & Zbikowski, 2018; Các phương
pháp tiếp cận AI này cho phép trích xuất các mẫu mới, ẩn và thông
tin đặc biệt từ các tập dữ liệu lớn mà không yêu cầu bất kỳ kiến thức
nào trước đó về dữ liệu.
Nghiên cứu hiện tại về dự đoán tỷ giá hối đoái Bitcoin đã sử dụng tỷ
giá hối đoái trước đó làm công cụ dự đoán. Tuy nhiên, trình tự Bitcoin
thể hiện hành vi phức tạp và rất không ổn định. Vì vậy, cần phải xem
xét các yếu tố quyết định khác nhau của tỷ giá hối đoái Bitcoin
(Kristoufek, 2013). Các yếu tố quyết định tỷ giá hối đoái Bitcoin đã
được khám phá bằng cách sử dụng các kỹ thuật kinh tế lượng như tự
hồi quy vectơ (VAR), bình phương tối thiểu thông thường (OLS) và
hồi quy lượng tử (QR) để hiểu tác động của các yếu tố quyết định
kinh tế và công nghệ đối với Bit. - tỷ giá hối đoái. Kristoufek (2013)
tuyên bố rằng có mối tương quan giữa tỷ giá hối đoái Bitcoin và các
truy vấn tìm kiếm trên Google Trends và Wikipedia. Polasik,
Piotrowska, Wisniewski, Kotkowski và Lightfoot (2015) nhận thấy
rằng tỷ giá hối đoái Bitcoin phụ thuộc vào mức độ phổ biến chung,
tâm lý truyền thông và tổng số giao dịch. Yang và Kim (2015) nhận
thấy rằng thước đo độ phức tạp cụ thể đối với luồng mạng giao dịch
Bitcoin có mối tương quan đáng kể với lợi nhuận và biến động của
thị trường Bitcoin. Dyhrberg (2015) chỉ ra rằng có một số điểm tương
đồng giữa vàng và đồng đô la Mỹ. Xin và Chong (2016) ước tính rằng
các yếu tố ảnh hưởng đến Bitcoin sẽ thay đổi từ cả góc độ dài hạn
và ngắn hạn. Balcilar, Bouri, Gupta và Roubaud (2017) kết luận rằng
khối lượng giao dịch Bitcoin có thể dự đoán lợi nhuận, nhưng nó
không thể giúp dự đoán sự biến động của lợi nhuận. Baur và cộng
sự. (2018) đã mở rộng nghiên cứu do Dyhrberg (2015) thực hiện và
cho thấy Bitcoin thể hiện các đặc điểm lợi nhuận, biến động và
tương quan khác nhau so với các tài sản khác, bao gồm vàng và đô
la Mỹ. Wei, Wang, Xiao và Shen (2018) đề xuất rằng tỷ giá hối đoái
Bitcoin có mối tương quan chéo chặt chẽ với số lượng giao dịch và
phí giao dịch. Nhìn chung, nghiên cứu gần đây chủ yếu tập trung
vào tác động của nhiều yếu tố quyết định khác nhau đến tỷ giá hối
đoái Bitcoin, thay vì khả năng dự đoán hoặc phân loại của một mô
hình. Tuy nhiên, cần lưu ý rằng mặc dù có thể thu được kết quả dự
đoán tốt bằng cách xem xét một số yếu tố quyết định tỷ giá hối đoái
Bitcoin (Brandvold, Molnár, Vagstad, & Valstad, 2015; Demir et al.,
2018; Kristoufek, 2014), nhiều nghiên cứu trước đây được dựa trên
những điều sau: (a) chỉ xem xét mối quan hệ tuyến tính giữa Bitcoin
và các yếu tố liên quan, mặc dù việc bao gồm các biến này có thể
dẫn đến những dự đoán tồi tệ hơn vì tác động của chúng có thể phi
tuyến tính; (b) sử dụng cả hai yếu tố quyết định và tỷ giá hối đoái
trước đó làm yếu tố dự báo, và do đó không biết liệu các yếu tố này
có thể dự đoán tỷ giá hối đoái trong tương lai hay không
tỷ lệ; và (c) chỉ điều tra tỷ giá hối đoái Bitcoin trong một khoảng thời
gian nhất định và do đó không rõ liệu kết quả có bao gồm tất cả các
khoảng thời gian có thể hay không. Do đó, trong nghiên cứu hiện tại,
chúng tôi đã điều tra xem liệu thông tin ẩn trong các yếu tố quyết
định kinh tế và công nghệ có thể dự đoán chính xác tỷ giá hối đoái
Bitcoin hay không.
Những đóng góp chính của bài viết này được tóm tắt như sau.
• Chúng tôi đã sử dụng hai phương pháp học máy, bao gồm ANN và
rừng ngẫu nhiên (RF), để giảm tập hợp con các yếu tố dự đoán tiềm
năng bằng cách đo lường tầm quan trọng của các yếu tố kinh tế và
công nghệ.
• Chúng tôi đã tích hợp các yếu tố dự đoán tiềm năng vào bộ nhớ
dài hạn ngắn hạn (LSTM) để thu được các dự đoán và so sánh hiệu
suất của nó với bốn mô hình sử dụng tỷ giá hối đoái trước đó, tức là
ANFIS, SVR, ARIMA và LSTM, để xác minh tính hợp lệ của những yếu
tố quyết định.
Phần còn lại của bài viết này được tổ chức như sau. Trong Phần 2,
chúng tôi mô tả dữ liệu được sử dụng trong nghiên cứu này. Trong
Phần 3, chúng tôi giải thích phương pháp được đề xuất. Trong Phần
4, chúng tôi trình bày các phân tích của mình và thảo luận về kết
quả. Cuối cùng, trong Phần 5, chúng tôi đưa ra kết luận của mình.
2. Chuẩn bị dữ liệu
Tỷ giá hối đoái Bitcoin là mục tiêu đầu ra của tất cả các mô hình dự
đoán được xem xét trong nghiên cứu này. Dữ liệu tỷ giá hối đoái
bitcoin được lấy từ:, hai yếu tố là yếu tố kinh tế và yếu tố công nghệ
ảnh hưởng đến sự thay đổi của tỷ giá hối đoái Bitcoin.
2.1. Hạng mục công nghệ
(1) Thông tin về blockchain Điểm khác biệt lớn nhất giữa Bitcoin
và truyền thống
tiền tệ là thị trường Bitcoin xây dựng niềm tin thông qua chuỗi khối.
Trong nghiên cứu này, chúng tôi lấy thông tin blockchain từ
https://blockchain.info/. Hơn nữa, các yếu tố blockchain sau đây cần
được xem xét như sau.
Kích thước khối (MB): kích thước của dữ liệu trong mạng
blockchain chứa dữ liệu được ghi lại vĩnh viễn.
Thời gian xác nhận: thời gian trung bình cần thiết để hoàn thành
một giao dịch phi tập trung và thêm nó vào chuỗi khối để xác thực
thành công.
Độ khó: độ khó của việc khai thác thành công các khối dữ liệu trong
thông tin giao dịch.
Tỷ lệ băm: thước đo khả năng xử lý mạng khai thác Bitcoin.
Lợi nhuận khai thác: tổng giá trị phần thưởng khối cơ sở tiền xu và
phí giao dịch được trả cho người khai thác.
Phí giao dịch trung bình: phí xử lý trung bình cho tất cả các giao
dịch diễn ra trong ngày.
Giá trị giao dịch trung bình: giá trị trung bình có được từ tất cả
các giao dịch diễn ra trong ngày.
Khối lượng giao dịch: số lượng giao dịch được ký kết giữa người
mua và người bán Bitcoin.
Vốn hóa thị trường: giá trị được tính bằng cách nhân giá với lượng
cung lưu thông.
Sự chú ý của công chúng Các biện pháp chú ý của công chúng
như lượt xem Wikipedia
và các tìm kiếm trên Google rất quan trọng để dự đoán tỷ giá hối
đoái Bitcoin (Dastgir, Demir, Downing, Gozgor, & Chi, 2018; Polasik
và cộng sự, 2015; Zhang, Wang, Li, & Shen, 2018). Trong nghiên cứu
này, chúng tôi sử dụng các dòng tweet trên Google Trends và Twitter
làm thước đo sự chú ý của công chúng. Cả hai yếu tố đều phản ánh
sự chú ý của công chúng nhưng chúng có những khác biệt nhỏ.
Google Trends cho biết ý định tìm hiểu về Bitcoin của công chúng,
trong khi các dòng tweet có thể thể hiện ý định thảo luận về Bitcoin
của công chúng. Hơn nữa, chúng tôi đã sử dụng ''Bitcoin'' (không
phân biệt chữ hoa chữ thường) làm từ khóa để nắm bắt lượng tìm
kiếm lịch sử từ Google Trends (https://trends.google.com/trends/) và
để lấy dữ liệu Twitter (từ https:// bitinfocharts.com/).
2.2. Hạng mục kinh tế
(1) Các chỉ số kinh tế vĩ mô Người ta tin rằng tỷ giá hối đoái, hàng
hóa
và các yếu tố kinh tế vĩ mô toàn cầu sẽ ảnh hưởng đến các nền kinh
tế mới nổi (Gospodinov & Jamali, 2015; Kandil & Mirzaie, 2002;
Mensi, Beljid, Boubaker, & Managi, 2013). Đặc biệt, Gajardo,
Kristjanpoller và Minutolo (2018) và Laboissiere, Fernandes và Lage
(2015) nhận thấy rằng các chỉ số kinh tế vĩ mô ảnh hưởng đến giá
Bitcoin trong dài hạn. Trong nghiên cứu này, chúng tôi đã xem xét
một số yếu tố bao gồm FTSE100, DOW30, VIX, SSE, giá dầu thô, giá
vàng, S&P500 và NASDAQ.
(2) Tỷ lệ tiền tệ toàn cầu (USD) Điểm tương đồng giữa Bitcoin và
tiền tệ truyền thống
giá trị đã được nhiều nhà nghiên cứu (Dyhrberg, 2015; Jang & Lee,
2018; Kristjanpoller & Minutolo, 2018) nghiên cứu. Trong nghiên cứu
này, chúng tôi tính đến tỷ giá hối đoái giữa các thị trường tiền tệ
toàn cầu. Đặc biệt, chúng tôi đã sử dụng tỷ giá hối đoái giữa các loại
tiền tệ chính thống (CHF, EUR, GBP, JPY và CNY) và đồng đô la Mỹ.
Dữ liệu thị trường công khai có liên quan được lấy bằng API Yahoo
YQL Finance.
Các yếu tố công nghệ và kinh tế liên quan đến tỷ giá hối đoái Bitcoin
được tóm tắt trong Bảng 1.
3. Phương pháp luận
Các câu hỏi nghiên cứu sau đây được giải quyết để khám phá xem
liệu thông tin ẩn giấu trong các yếu tố quyết định kinh tế và công
nghệ có thể dự đoán chính xác tỷ giá hối đoái Bitcoin hay không.
• Q1: Liệu các yếu tố kinh tế và công nghệ có thể mang lại hiệu quả
dự đoán cao hơn không?
• Câu hỏi 2: Nếu câu trả lời cho Câu hỏi 1 là ''có'' thì các yếu tố
quyết định tỷ giá hối đoái Bitcoin thay đổi như thế nào theo thời
gian?
Để giải quyết những câu hỏi này, chúng tôi đã tiến hành thử nghiệm
hai giai đoạn trong bốn giai đoạn, như trong Hình 1.
Ở giai đoạn I, chúng tôi sử dụng hai phương pháp học máy là ANN
và RF để xác định các yếu tố kinh tế và công nghệ liên quan đến tỷ
giá hối đoái Bitcoin , nơi họ hình thành một tập hợp con của
yếu tố dự báo tiềm năng. Ở giai đoạn II, các yếu tố dự đoán tiềm
năng được đưa vào LSTM để dự đoán tỷ giá hối đoái Bitcoin, bất kể
tỷ giá hối đoái trước đó như thế nào. Ngoài ra, bốn mô hình, tức là
ARIMA, SVR, ANFIS và LSTM, đã được sử dụng để đưa ra dự đoán dựa
trên tỷ giá hối đoái trước đó. Hơn nữa, sai số bình phương trung bình
gốc (RMSE), sai số tuyệt đối trung bình (MAE), sai số phần trăm
tuyệt đối trung bình (MAPE) và độ chính xác định hướng (DA) đã
được sử dụng để so sánh hiệu suất dự đoán của các mô hình. Việc
đạt được hiệu suất tốt hơn với LSTM bằng cách sử dụng các yếu tố
dự báo kinh tế và công nghệ sẽ cho thấy rằng thông tin ẩn trong các
yếu tố quyết định kinh tế và công nghệ quan trọng hơn mức giá
trước đó.
3.1. Tiền xử lý dữ liệu
(1) Làm sạch dữ liệu Dữ liệu được sử dụng trong nghiên cứu này
được thu thập thông qua API
và các trang web, do đó một số giá trị bị thiếu hoặc vô nghĩa. Do đó,
giá trị trung bình thống kê được tính toán như một quan sát khi thích
hợp để thay thế dữ liệu bị thiếu; mặt khác, ngày tương ứng của giá
trị bị thiếu sẽ bị xóa khỏi tập dữ liệu. Theo đề xuất của Serneels, De
và Van Espen (2006), chúng tôi đã sử dụng quy trình ký hiệu khoảng
trắng để xóa điểm dữ liệu tương ứng cho các giá trị ngoại lệ.
(2) Phân chia dữ liệu Chúng tôi đã điều tra bốn giai đoạn quan trọng
đối với Bitcoin.
Giai đoạn đầu tiên là từ ngày 1 tháng 8 năm 2011 đến ngày 31
tháng 12 năm 2013. Trong giai đoạn này, Mt. Gox là nhà điều hành
sàn giao dịch Bitcoin lớn nhất và tỷ giá hối đoái Bitcoin vượt quá 1
ounce vàng. Giai đoạn thứ hai là từ ngày 1 tháng 8 năm 2013 đến
ngày 31 tháng 12 năm 2014. Trong giai đoạn này, ba nhà điều hành
sàn giao dịch Bitcoin lớn là BitStamp, BTCe và BiFinex thống trị các
giao dịch Bitcoin. Giai đoạn thứ ba là từ ngày 1 tháng 7 năm 2014
đến ngày 31 tháng 12 năm 2017. Trong giai đoạn này, hàng chục
sàn giao dịch Bitcoin hoạt động trên khắp thế giới và số lượng giao
dịch Bitcoin tăng vọt ở hầu hết các quốc gia và khu vực. Giai đoạn
thứ tư là từ ngày 1 tháng 7 năm 2015 đến ngày 31 tháng 7 năm
2018. Trong giai đoạn này, tỷ giá hối đoái Bitcoin sắp vượt qua
20.000 USD nhưng nó đột ngột giảm xuống dưới 4500 USD. Việc
chia phân tích thực nghiệm thành bốn giai đoạn này cho phép chúng
tôi kiểm tra xem các yếu tố quyết định tỷ giá hối đoái Bitcoin thay
đổi như thế nào theo thời gian.
Ngoài ra, việc phân chia tập huấn luyện và tập kiểm tra là một bước
quan trọng để dự báo. Chúng tôi sử dụng dữ liệu từ 2 tháng qua làm
tập kiểm tra và tất cả dữ liệu còn lại làm tập huấn luyện.
(3) Chuyển đổi dữ liệu Mô hình được sử dụng trong nghiên cứu này
yêu cầu tính năng chia tỷ lệ
quy trình để tránh các thuộc tính có phạm vi giá trị lớn hơn chi phối
phạm vi thuộc tính nhỏ hơn (Rezakazemi, Ghafarinazari, Shirazian, &
Khoshsima, 2013). Vì vậy, chúng tôi đã sử dụng một phương pháp
tiêu chuẩn hóa để chia tỷ lệ các biến đầu vào. Công thức cụ thể
được thể hiện như sau:
Xn = X − Xmin Xmax − Xmin, (1)
trong đó Xmin, Xmax và Xn lần lượt là các giá trị tối thiểu, tối đa và
chuẩn hóa của dữ liệu mẫu. Hình 2 hiển thị dữ liệu lịch sử được
chuẩn hóa về tỷ giá hối đoái Bitcoin, các yếu tố kinh tế và yếu tố
công nghệ
Thông tin chi tiết hơn về phương pháp RF có thể được tìm thấy trong
Cutler, Cutler và Stevens (2004). Trong nghiên cứu này, chúng tôi đã
sử dụng 500 cây để triển khai RF.
3.2.2. Mạng lưới thần kinh nhân tạo
ANN được sử dụng rộng rãi trong các vấn đề phân tích dữ liệu tính
toán khác nhau, bao gồm phân loại, hồi quy và nhận dạng mẫu. ANN
bao gồm các lớp đầu vào, lớp ẩn và lớp đầu ra và mỗi lớp bao gồm
một số nơ-ron, còn được gọi là các phần tử xử lý (PE). Ngoài ra, ANN
có thể được sử dụng để đo lường tầm quan trọng của yếu tố đầu vào
x bằng cách đo sự thay đổi của sai số bình phương trung bình (COE)
khi đầu vào tương ứng bị xóa khỏi mạng (Xu, Wong, & Chin, 2013).
COE được định nghĩa như sau:
và MSE1 và MSE2 lần lượt biểu thị sai số bình phương trung bình khi
có và không có x.
Để biết phần giới thiệu về ANN, vui lòng tham khảo các nghiên cứu
của Elhewy, Mesbahi và Pu (2006) và Gomes và Awruch (2004).
Trong nghiên cứu hiện tại, chúng tôi đã sử dụng cấu trúc mạng nơ-
ron truyền thẳng nhiều lớp được huấn luyện bằng phương pháp lan
truyền ngược.
3.3. Lập mô hình: Giai đoạn II
Trong giai đoạn này, chúng tôi giả định rằng các yếu tố quyết định
quan trọng có thể mang lại hiệu suất dự đoán cao hơn trong các giai
đoạn khác nhau. Để đánh giá giả thuyết này, chúng tôi đã kết hợp
các yếu tố dự đoán đã chọn vào LSTM để dự đoán tỷ giá hối đoái
Bitcoin. Ngoài ra, bốn mô hình dự đoán, tức là ARIMA, SVR, ANFIS và
LSTM, đã được sử dụng để dự đoán tỷ giá hối đoái Bitcoin dựa trên tỷ
giá hối đoái trước đó. Hơn nữa, chúng tôi đã sử dụng bốn số liệu, tức
là MAPE, MAE, RMSE và DA, để đo lường hiệu suất của các mô hình
khác nhau.
3.3.1. Trí nhớ ngắn hạn dài
LSTM do Hochreiter và Schmidhuber (1997) đề xuất là mô hình được
sử dụng phổ biến nhất trong các mạng thần kinh đệ quy (RNN).
LSTM có thể thu được các dự đoán chuỗi thời gian tốt hơn vì rất khó
để áp dụng nhiều phương pháp tuyến tính cổ điển cho các vấn đề dự
đoán đa biến hoặc đa đầu vào. So với RNN, LSTM được đặc trưng bởi
việc bổ sung các ô nhớ để xử lý thông tin. Cấu trúc của ô nhớ được
minh họa trong Hình 3.
Như được hiển thị trong Hình 3, tại mỗi dấu thời gian t, mỗi ô nhớ có
ba cổng duy trì và điều chỉnh trạng thái ô của chúng: cổng quên (ft ),
cổng đầu vào (it ) và cổng đầu ra (ot ). Mỗi cổng phục vụ một mục
đích khác nhau, như sau.
Cổng đầu vào nó điều khiển thông tin đầu vào chảy vào ô nhớ, ở đó
Trong đó dij biểu thị sự chênh lệch tổn thất giữa các mô hình i và j,
di,. là tổn thất đơn giản của mô hình thứ i so với tổn thất trung bình
giữa các mô hình trong M và ˆvar( ̄dij) và ˆvar( ̄di,.) lần lượt là các
ước tính khởi động của var( ̄dij) và var( ̄di,.).
ban đầu. Đối với một mô hình nhất định i ∈ M, giá trị p MCS ˆp∗i là
Quy trình kiểm tra MCS gán giá trị p cho từng mô hình trong tập hợp
Đầu tiên, đối với bốn mô hình điểm chuẩn dựa trên tỷ giá hối đoái
trước đó, tức là ARIMA, ANFIS, SVR và LSTM, các mô hình AI có thể
khớp với chuỗi thời gian ban đầu theo cách phi tuyến tính và ARIMA
không đạt được hiệu suất kém hơn. Ví dụ: trong khoảng thời gian từ
ngày 1 tháng 7 năm 2013 đến ngày 31 tháng 12 năm 2014, xét về
giá trị trung bình và tối thiểu, MAPE thu được bởi ARIMA vượt trội
hơn so với MAPE thu được bởi SVR, ANFIS và LSTM.
Thứ hai, LSTM thu được DA cao hơn bằng cách sử dụng các yếu tố
dự báo kinh tế và công nghệ. SD mà LSTM thu được bằng cách sử
dụng các yếu tố dự đoán là tương đối lớn, nhưng nó cũng có giá trị
trung bình, giá trị tối thiểu và giá trị tối đa lớn hơn. Đặc biệt, Bitcoin
giảm mạnh trong khoảng thời gian từ ngày 1/7/2015 đến ngày
31/7/2018. Hơn nữa, đối với các mô hình chuẩn dựa trên tỷ giá hối
đoái trước đó, các giá trị tối đa, tối thiểu và trung bình của DA đều
nhỏ hơn 50. , nhưng các giá trị tương ứng lớn hơn 50 với LSTM sử
dụng các yếu tố dự đoán.
Thứ ba, trong mỗi giai đoạn, các giá trị RMSE, MAPE và MAE mà
LSTM thu được bằng cách sử dụng các yếu tố dự đoán kinh tế và
công nghệ cho thấy hiệu suất tốt hơn về mặt bốn chỉ số thống kê
bao gồm giá trị tối thiểu, tối đa, trung bình và SD. Nói cách khác,
LSTM sử dụng các yếu tố dự đoán có hiệu suất dự đoán vượt trội về
độ chính xác, tính ổn định và độ tin cậy so với các mô hình sử dụng
tỷ giá hối đoái trước đó.
4.2.2. Kiểm tra độ tin cậy
Thử nghiệm MCS được thực hiện để phân tích ý nghĩa của kết quả.
Theo khuyến nghị của Hansen et al. (2011), độ dài khối và số lượng
mẫu bootstrap được đặt tương ứng là 2 và 10.000. Bảng 8–10 trình
bày tập hợp mô hình (SSM) tối ưu và giá trị p tương ứng ở mức ý
nghĩa 20%. Trong các bảng này, RankM và RankR là các mô hình
được sắp xếp
theo hai thống kê lần lượt bao gồm TR,M và Tmax,M và pM và pR là
các giá trị p tương ứng cho toàn bộ bảng xếp hạng. Bảng 8–10
chứng minh rõ ràng rằng việc bao gồm các yếu tố quyết định kinh tế
và công nghệ có thể mang lại hiệu suất dự đoán tốt hơn. Ví dụ: theo
ba chỉ số đánh giá, các mô hình chuẩn dựa trên tỷ giá hối đoái trước
đó không thể vượt qua các bài kiểm tra MCS trong một số trường
hợp, trong khi LSTM sử dụng các yếu tố dự đoán đã vượt qua tất cả
các bài kiểm tra. Cần lưu ý rằng các giá trị TR,M và Tmax,M mà
LSTM thu được bằng cách sử dụng các yếu tố dự đoán là 1, qua đó
khẳng định lợi thế vượt trội của mô hình được xây dựng để dự báo tỷ
giá hối đoái Bitcoin.
Nhìn chung, các kết quả thử nghiệm được trình bày trong Phần 4.2.1
và 4.2.2 ủng hộ giả định chung của chúng tôi rằng: ''Tỷ giá hối đoái
Bitcoin được thúc đẩy bởi các yếu tố kinh tế và công nghệ khác nhau
trong các giai đoạn khác nhau''. Như vậy, Hiệu suất dự đoán tốt hơn
có thể đạt được bằng cách sử dụng thông tin ẩn trong các yếu tố
quyết định kinh tế và công nghệ thay vì sử dụng tỷ giá hối đoái trước
đó.
5. Kết luận
Bitcoin là một loại tiền điện tử thành công và nó đã được nghiên cứu
rộng rãi trong lĩnh vực kinh tế và khoa học máy tính. Trong nghiên
cứu này, chúng tôi đã kiểm tra xem liệu các yếu tố quyết định kinh
tế và công nghệ có thể dự đoán chính xác tỷ giá hối đoái Bitcoin hay
không. Chúng tôi đã thu thập và xử lý trước dữ liệu từ ngày 1 tháng
8 năm 2011 đến ngày 31 tháng 7 năm 2018, bao gồm 24 yếu tố
được xem xét trong các nghiên cứu trước đây. Ngoài ra, để tiết lộ
những thay đổi năng động trên thị trường Bitcoin, chúng tôi đã chia
bộ dữ liệu thành bốn giai đoạn. Sau đó, một mô hình dự đoán hai
giai đoạn đã được phát triển.
Trong giai đoạn đầu tiên, chúng tôi đã sử dụng hai phương pháp lựa
chọn tính năng bao gồm ANN và RF để đo lường tầm quan trọng của
các yếu tố kinh tế và công nghệ, đồng thời thu được một tập hợp
con các yếu tố dự đoán tiềm năng. Sau khi so sánh thứ hạng tầm
quan trọng của các yếu tố khác nhau trong bốn bộ dữ liệu, chúng tôi
nhận thấy rằng tỷ giá hối đoái Bitcoin bị ảnh hưởng bởi các yếu tố
kinh tế và công nghệ khác nhau trong các giai đoạn khác nhau.
Trong giai đoạn thứ hai, các yếu tố dự đoán đóng vai trò là đầu vào
cho dự đoán của LSTM nhưng không xem xét tỷ giá hối đoái Bitcoin
trước đó. Ngoài ra, các mô hình ANFIS, ARIMA, SVR và LSTM đưa ra
dự đoán dựa trên tỷ giá hối đoái Bitcoin trước đó. Kết quả đã chứng
minh rõ ràng rằng việc sử dụng các yếu tố quyết định kinh tế và
công nghệ có hiệu quả để dự đoán tỷ giá hối đoái Bitcoin.
Trong nghiên cứu trong tương lai, chúng tôi sẽ xem xét nhiều yếu tố
hơn trong mô hình dự đoán hai giai đoạn được đề xuất của chúng
tôi, chẳng hạn như tâm lý nhà đầu tư và quy định của chính phủ.
Hơn nữa, chúng tôi sẽ áp dụng mô hình đề xuất cho các vấn đề dự
đoán khác, chẳng hạn như xu hướng chứng khoán và luồng giao
thông