A hidden Markov model for predicting global stock market index
Transcript of A hidden Markov model for predicting global stock market index
The Korean Journal of Applied Statistics2021, Vol. 34, No. 3, 461โ475
DOI: https://doi.org/10.5351/KJAS.2021.34.3.461Print ISSN1225-066X / Online ISSN 2383-5818
A hidden Markov model for predicting global stock marketindex
Hajin Kanga, Beom Seuk Hwang1,a
aDepartment of Applied Statistics, Chung-Ang University
Abstract
Hidden Markov model (HMM) is a statistical model in which the system consists of two elements, hiddenstates and observable results. HMM has been actively used in various fields, especially for time series data inthe financial sector, since it has a variety of mathematical structures. Based on the HMM theory, this research isintended to apply the domestic KOSPI200 stock index as well as the prediction of global stock indexes such asNIKKEI225, HSI, S&P500 and FTSE100. In addition, we would like to compare and examine the differencesin results between the HMM and support vector regression (SVR), which is frequently used to predict the stockprice, due to recent developments in the artificial intelligence sector.
Keywords: global stock market index, hidden Markov model, KOSPI200, stock index prediction, supportvector regression
1.์๋ก
์ฐ 1%๋์์ ๊ธ๋ฆฌ์๋๊ฐ๊ณ์๋๊ณ ,ํนํ์ต๊ทผ์ฝ๋ก๋19๋ก์ธํด๊ตญ๋ด๊ธฐ์ค๊ธ๋ฆฌ๊ฐ 1%๋ฏธ๋ง์ผ๋ก๋ณ๊ฒฝ๋ฐ์ ์ง๋๋ฉด์์์ฐ๋ณดํธ๋ฅผ์ํด์๋๊ธ๊ณผ๋ถ๋์ฐ๊ฐ์๋ค๋ฅธํ์คํ์์ ์์ฐ์ผ๋ก๋์ฒดํ๊ฑฐ๋,๋ฐ๋๋กํฌ์๋ฅผ์ํด์๋์ฑ๊ถ,์ฃผ์๋๋ํ์์ํ๋ฑ๊ณผ๊ฐ์๋ฆฌ์คํฌ๋ฅผ๋๋ฐํ๊ธ์ต์ํ์๋์ฒดํฌ์์๋จ์ผ๋กํ์ฉํ๋ ค๋๊ธ์ต์๋น์๋ค์ด ๋์ด๋๊ณ ์๋ค. ๋ํ, ํฌ์์ ๋ํ ๊ตญ์ ํ๊ฐ ์ฌํ๋๋ฉด์ ๊ธ์ต๊ธฐ๊ด๊ณผ ๊ธฐ์ ๋ฟ๋ง ์๋๋ผ ๊ฐ์ธ ํฌ์์๋ํ ์ํ์ ๊ฐ์ํ๋ฉด์๊น์ง๋ ํด์ธ ํฌ์์ ๋ํ ๊ด์ฌ์ด ๋์์ง๊ณ ์๋ค. ์ฃผ์ ์์ฅ์ ๊ฐ์ฅ ๊ฐ๋จํ๋ฉด์๋ ๋น ๋ฅด๊ฒ ๊ธ์ต ์์ฅ ์ํฉ์ ํ์ ํ ์ ์๋ ๊ณณ์ด๋ค. KOSPI200 ์ฃผ๊ฐ์ง์๋ ํ๊ตญ์ ๋ํํ๋ ์ฃผ์ 200๊ฐ ์ข ๋ชฉ์์๊ฐ์ด์ก์์ง์ํํ๊ฒ์ผ๋ก 1990๋ 1์ 3์ผ 100์๊ธฐ์ค์ผ๋ก์ผ๋ง๋๋ณ๋๋์๋์ง๋ฅผ๋ํ๋ด๋ฉฐ,ํฌ์์๋ํ๋ฒค์น๋งํฌ ์งํ๋ก ์ฌ์ฉ๋๋ ๊ตญ๋ด ๋ํ ์ง์์ด๋ค. ์ฃผ์ ์์ฅ์ด ์ด๋ค ํ๋ฆ์ ๋ํ๋ผ์ง ์์ธกํ๋ ๊ฒ์ ๊ฒฝ์ ๋ฐ๊ธ์ต์์ฅ์์ธก์๊ต์ฅํ์ค์ํ๋ถ๋ถ์ด๋ฉฐ,์ฌ๋ฌ๊ฐ์ง๋ฐฉ๋ฒ๋ค์ด์ฃผ๊ฐ์์ธก์ํ์ฉ๋์ดํ๋ฐํ์ฐ๊ตฌ๋๊ณ ์๋ค.
๋ณธ์ฐ๊ตฌ์์๋์ฃผ๊ฐ๋ฐํ์จ,์ด์์จ๋ฑ๊ณผ๊ฐ์์๊ณ์ด๋ฐ์ดํฐ์์ ํฉํ์๋๋ง๋ฅด์ฝํ๋ชจ๋ธ(hidden Markovmodel; HMM)์์ด์ฉํดํฅํ์์ธก์์ ์ฉํ๊ณ ์ํ๋ค.์ค์ ๊ตญ๋ด๋ฐํด์ธ์ฃผ๊ฐ์ง์๋ฅผ์ ์ฉํ์ฌ์ต์ ์๋ชจ๋ธ์์ถ์ ํ๋ค๋ฉด์ด๋ฅผํตํด์ํฅํ์์ผ์ ๊ธฐ๊ฐ์์ฃผ์์์ฅ์๋ํ์ถ์ด๋ฐ๋ฐฉํฅ์ฑ๊ทธ๋ฆฌ๊ณ ์์ง์์๋ํ์์ธก์ด
๊ฐ๋ฅํ ๊ฒ์ด๋ค.
This research was supported by the Chung-Ang University Research Scholarship Grants in 2020.1 Corresponding author: Department of Applied Statistics, Chung-Ang University, 84 Heukseok-ro, Dongjak-gu, Seoul
06974, Korea. E-mail: [email protected]
Published 30 June 2021 / journal homepage: http://kjas.or.krยฉ 2021 The Korean Statistical Society. All rights reserved.
462 Hajin Kang, Beom Seuk Hwang
์์ฑ์ธ์ ๋ถ์ผ์์ ์ฃผ๋ก ํ์ฉ๋๊ธฐ ์์ํ ์๋ ๋ง๋ฅด์ฝํ ๋ชจ๋ธ์ ์ ์ ํ๊ณผ ์๋ฌผ์ ๋ณดํ์ ํฌํจํ ๋ค์ํ
๋ถ์ผ์์ ์๊ณ์ด์ ํจํด์ ํ์ฉํ๋ ๋๊ตฌ๋ก ๋๋ฆฌ ์ด์ฉ๋๊ณ ์์ผ๋ฉฐ ๊ธ์ต ๊ด๋ จ ๋ฐ์ดํฐ ๋ถ์์์๋ ํ๋ฐํ๊ฒ
์ฌ์ฉ๋๊ณ ์๋ค (Zucchini๋ฑ, 2017).์ต์ ์๊ฐ๊ฒฉ๊ฒฐ์ ๊ณผ LIBOR์์ฅ์๋ชจ๋ธ์ฐ๊ตฌ๊ทธ๋ฆฌ๊ณ ์ด์์จ์๊ธฐ๊ฐ๊ตฌ์กฐ๋ชจ๋ธ ๊ตฌ์ถ๊ณผ ๊ด๋ จํด์๋ HMM์ด ํ๋ฐํ๊ฒ ์ด์ฉ๋์ด ์๋ค (Mamon๊ณผ Elliott, 2007). ๋ํ, HMM์ ํ์ฉํ์ฑ๊ถ๊ฐ๊ฒฉ์ฐ์ถ (Landen, 2000)๋ฐ์ํ๊ณ ๊ฐ์๊ตฐ์งํํ๋์ฐ๊ตฌ๋์งํ๋์์ผ๋ฉฐ (Knab๋ฑ, 2003),์ฃผ์๊ฐ๊ฒฉ์๋ํ์์ธก์๋ HMM์ดํ์ฉ๋์ด์๋ค (Hassan๊ณผ Nath, 2005).
๋ณธ๋ ผ๋ฌธ์์๋ HMM๋ฐฉ๋ฒ์๊ตญ๊ฐ๋ณ์ฃผ๊ฐ์ง์์์ธก์์ ์ฉํด๋ณด๊ณ ์ํ๋ค.๋จผ์ AIC, BIC, HQC (Hannan๊ณผQuinn, 1979), CAIC (Bozdogan, 1987)์๊ฐ์์ ๋ณด๊ธฐ์ค์์ฌ์ฉํ์ฌHMM์์ต์ ์์ํ์์๋ฅผ๊ฒฐ์ ํ๋ค.๊ทธํ HMM์๋ชจ์์ถ์ ์์ฌ์ฉ๋๋ํ๋ จ๋ฐ์ดํฐ์๋ํ์ฌ์ข ๊ฐ,์๊ฐ,๊ณ ๊ฐ,์ ๊ฐ๋ฅผ์ด์ฉํ์ฌ Hassan๊ณผ Nath(2005)์๋ฐฉ๋ฒ์์ ์ฉํ๊ณ ์ํ๋ค.์ค์ ๋ฐ์ดํฐ๋ก๋๊ตญ๋ด KOSPI200์ฃผ๊ฐ์ง์์์ผ๋ณธ์ NIKKEI225,ํ์ฝฉ์HSI, ๋ฏธ๊ตญ์ S&P500, ์๊ตญ์ FTSE100 ๋ฑ ์ฃผ๊ฐ์ฐ๊ณ์ฆ๊ถ(equity linked securities; ELS)์ ๊ธฐ์ด์์ฐ์ผ๋ก ์ฃผ๋ก์ฌ์ฉํ๋ ๋ํ์ ์ธ ํด์ธ ์ฃผ๊ฐ์ง์๋ฅผ ์ด์ฉํ๋ค. 2010๋ 1์๋ถํฐ 2019๋ 12์๊น์ง ์ด 10๋ ๋์์ ๋ฐ์ดํฐ๋ฅผ์ด์ฉํ์ฌ์ถ์ ํ๋ชจํ์ด์ค์ ๋ฐ์ดํฐ์์ธก์์ผ๋ง๋์ ํํ๊ฒ์ ์ฉ๋ ์์๋์ง์์๋ณด๋ ค๊ณ ํ๋ค.๋ํ,์ธ๊ณต์ง๋ฅ๋ถ์ผ์๋ฐ์ ์ผ๋ก์ธํด์ฃผ์๊ฐ๊ฒฉ์์ธก์๋๋ฆฌ์ฌ์ฉ๋๊ณ ์๋์ํฌํธ๋ฒกํฐํ๊ท(support vector regression;SVR)๋ฐฉ๋ฒ (Cao์ Tay, 2001)์๋น๊ต๊ตฐ์ผ๋ก์ฌ์ฉํ์ฌ๊ทธ๊ฒฐ๊ณผ๋ฅผ๋น๊ตํ๊ณ ์ํ๋ค.๋ณธ๋ ผ๋ฌธ์๊ตฌ์ฑ์๋ค์๊ณผ๊ฐ๋ค. 2์ฅ์์๋ ์๋ ๋ง๋ฅด์ฝํ ๋ชจ๋ธ ์ด๋ก ๊ณผ ๊ด๋ จ๋ ์ฃผ์ ๋ฌธ์ ๋ค์ ๋ํด ์๊ฐํ๋ค. 3์ฅ์์๋ ๊ตญ๋ด ๋ฐ ํด์ธ์ฃผ๊ฐ์ง์ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ ์์ธก ๋ฐฉ๋ฒ๊ณผ ๊ฒฐ๊ณผ๋ฅผ ์ ์ํ๋ฉฐ 4์ฅ์์๋ ๋ณธ ๋ ผ๋ฌธ์ ๊ฒฐ๋ก ๊ณผ ํ์ ์ฐ๊ตฌ์ ๋ฐฉํฅ์์ธ๊ธํ๋ฉฐ๋ง๋ฌด๋ฆฌํ๋ค.
2.์๋๋ง๋ฅด์ฝํ๋ชจ๋ธ(Hidden Markov model)
2.1.์๋๋ง๋ฅด์ฝํ๋ชจ๋ธ์๊ฐ
์๋๋ง๋ฅด์ฝํ๋ชจ๋ธ(hidden Markov model; HMM)์๋ง๋ฅด์ฝํ๋ชจ๋ธ์ํ๋๋ก,์๋๋์ํ์๊ด์ฐฐ๊ฐ๋ฅํ๊ฒฐ๊ณผ์๋๊ฐ์ง์์๋ก๊ตฌ์ฑ๋ํต๊ณ์ ๋ชจ๋ธ์ด๋ค.์๋์ํ๋ค์๋ง๋ฅด์ฝํ๊ณผ์ ์๋ฐ๋ฅด๊ณ ์ด๋ฅผ์ง์ ์ ์ธ์์ธ์ผ๋กํ์ฌ๊ด์ฐฐ๊ฐ๋ฅํ๊ฒฐ๊ณผ๊ฐ๋ฐ์ํ๋ค.์ํ๋ฅผ์ง์ ์ ์ผ๋ก๋ณผ์์๊ณ ์ด๋ก๋ถํฐ์ผ๊ธฐ๋๊ฒฐ๊ณผ๋ค๋ง๊ด์ฐฐํ ์์์ดโ์๋(hidden)โ์ด๋ผ๋๋จ์ด๊ฐ๋ถ๊ฒ๋์๋ค.๋ฐฉ๋ฒ๋ก ์ 1960๋ ๋์์๋ ค์ก์ง๋ง, 1970๋ ๋์๋ชจ๋ธ์ํ๋ผ๋ฏธํฐ์ถ์ ์์ํ๋ฐฉ๋ฒ๋ค์ด์ฐ๊ตฌ๋๋ฉด์์๋๋ง๋ฅด์ฝํ๋ชจ๋ธ์๋ํ์ฐ๊ตฌ๊ฐ๋์ฑํ๋ฐํ์งํ๋์๋ค (Baum๊ณผ Petrie,1966; Baum๋ฑ, 1970).์๋๋ง๋ฅด์ฝํ๋ชจ๋ธ์ 1970๋ ๋์์ฑ์ธ์๋ถ์ผ์์์์ฉ๋๊ธฐ์์ํ์ฌ,์๋ฌผ์ ๋ณดํ,์ํํ, ์ธ์ดํ, ํ๊ฒฝ, ํต์ ๋ฐ ๊ธ์ต ๋ฑ ๋ค์ํ ๋ถ์ผ์์ ์ฌ์ฉ๋๊ณ ์๋ค (Cappe ๋ฑ, 2006; Zucchini ๋ฑ, 2017).ํนํ ์๋ ๋ง๋ฅด์ฝํ ๋ชจ๋ธ์ ๊ด์ฐฐ ๊ฐ๋ฅํ ํ๋ฅ ๊ณผ์ ์ ๊ฒฝ์ฐ ๋ง๋ฅด์ฝํ ์ฐ์๊ฐ ์ฃผ์ด์ง ์ํฉ์์ ์กฐ๊ฑด๋ถ ๋ ๋ฆฝ์ด
๋ฉฐ,๊ฐ์์ ์์กฐ๊ฑด๋ถ๋ถํฌ๋์ค์งํด๋น์์ ์๋ง๋ฅด์ฝํ์ฐ์์๋ง์์กดํ๋๊ธฐ๋ณธ๊ตฌ์กฐ๋ฅผ๊ฐ์ง๊ณ ์๋๋ฐ,์ด๋์ฃผ๊ฐ์ง์์์ง์์์ ํฉํ๊ตฌ์กฐ๋ผ๊ณ ํ ์์๋ค.์์์์์ ์์ฃผ๊ฐ์ง์๊ฐ์๋๋์ฌ๋ฌ์ํ์์ํด์ํฅ์๋ฐ์ผ๋ฉฐ๋ง๋ฅด์ฝํ๊ณผ์ ์๋ฐ๋ฅธ๋ค๊ณ ๊ฐ์ ์ํ ์์๊ธฐ๋๋ฌธ์ด๋ค.๋ฐ๋ผ์์๋๋ง๋ฅด์ฝํ๋ชจ๋ธ์์ฃผ๊ฐ์ง์์๋ฃ๋ถ์์๋ง์ด์์ฉ๋๊ณ ์๋ค (Zucchini๋ฑ, 2017).
์๋ ๋ง๋ฅด์ฝํ ๋ชจ๋ธ์ ๊ตฌ์กฐ์ ์ด๋ฅผ ๋ํ๋ด๋ ๊ตฌ์ฑ ์์๋ค์ Figure 1๊ณผ Table 1์ ๊ฐ๊ฐ ๋ํ๋ด์๋ค. ๋ณธ๋ ผ๋ฌธ์์๋ Idvall๊ณผ Jonsson (2008)๊ณผ Nguyen (2018)์๋์์๋๊ธฐํธ๋ฅผ์ฐธ๊ณ ํ์ฌ์ฌ์ฉํ์๋ค.๊ด์ธก๋์ง์๋๋ง๋ฅด์ฝํ์ฐ์ Q๋์ ์ดํ๋ฅ ํ๋ ฌ A์์ด๊ธฐํ๋ฅ p๋ฅผ๊ฐ์ง๋ค.๊ด์ฐฐ๊ฐ๋ฅํํ๋ฅ ๊ณผ์ O๋๋ง๋ฅด์ฝํ์ฐ์๊ฐ์ฃผ์ด์ง์ํฉ์์์กฐ๊ฑด๋ถ๋ ๋ฆฝ์ด๋ฉฐ,๊ฐ์์ ์์กฐ๊ฑด๋ถ๋ถํฌ๋์ค์งํด๋น์์ ์๋ง๋ฅด์ฝํ์ฐ์์๋ง์์กดํ๋ค.
A hidden Markov model for predicting global stock market index 463
Figure 1: Illustration of hidden Markov model.
Table 1: Basic elements of HMM
Element Definition/NotationLength of observation data TNumber of states NNumber of symbols MObservation sequence O = {Ot , t = 1, 2, . . . ,T }Hidden states sequence Q = {qt , t = 1, 2, . . . ,T }Possible values of states {S i, i = 1, 2, . . . ,N}Possible symbols {vk , k = 1, 2, . . . ,M}Initial probability p = (pi), pi = P(q1 = S i), i = 1, 2, . . . ,NTransition probability matrix A = (ai j), ai j = P(qt = S j |qtโ1 = S i), i, j = 1, 2, . . . ,NEmission probability matrix B = (bik), bik = P(Ot = vk |qt = S i), i = 1, . . . ,N, k = 1, . . . ,M
์ด๋ฅผ์์์ผ๋กํํํ๋ฉด๋ค์๊ณผ๊ฐ๋ค.
P(qt |q1, q2, . . . , qtโ1) = P(qt |qtโ1), t = 2, 3, . . . ,
P(Ot |O1, . . . ,Otโ1, q1, . . . , qt) = P(Ot |qt), t = 1, 2, 3 . . . .
๋ง์ฝ๋ฅดํ ์ฐ์๊ฐ ์ฃผ์ด์ก์ ๋ ๊ด์ฐฐ ๊ฐ๋ฅํ ํ๋ฅ ๊ณผ์ ์ด์ด์ฐํ ๋ถํฌ๋ผ๋ฉด ์ด์ฐํ HMM์ด๊ณ , ์ฐ์ํ ๋ถํฌ๋ผ๋ฉด ์ฐ์ํ HMM์ด ๋๋ค. Table 1์ ์ฐธ๊ณ ํ๋ฉด, HMM๋ฅผ ๋ํ๋ด๊ธฐ ์ํด์ ํ์ํ ํ๋ผ๋ฏธํฐ๋ ฮป โก {A, B, p}์์์์์๋ค.์๋ฅผ๋ค์ด,์ฐ์ํ HMM์์๊ฐ์ฐ์์๋ถํฌ๋ฅผ๊ฐ์ ํ๋ค๋ฉด,ํ๋ผ๋ฏธํฐ๋๋ค์๊ณผ๊ฐ์ด๋ํ๋ผ์์๋ค.
ฮป โก {A, B, p} โก {A, ยต, ฯ, p}.
2.2.์๋๋ง๋ฅด์ฝํ๋ชจ๋ธ์์ฃผ์๋ฌธ์
HMM์์ค์ ๋กํ์ฉํ๊ธฐ์ํด์๋์ฐ์ 3๊ฐ์ง์ฃผ์๋ฌธ์ ์๋ํด์๊ฐํด๋ณด์์ผํ๋ค (Rabiner, 1989).์ฒซ๋ฒ์งธ๋ฌธ์ ๋๊ด์ฐฐ๊ฐ๋ฅํ์์ด {Ot}์๋ชจ๋ธ์ํ๋ผ๋ฏธํฐ ฮป โก {A, B, p}๊ฐ์ฃผ์ด์ก์๋,์ฃผ์ด์ง๋ชจ๋ธ์์๊ด์ธก์์ด์ํ๋ฅ ์ ๊ณ์ฐํ๋ ํ๊ฐ ๋ฌธ์ ์ด๋ค. ๊ฐ์ ์ํฉ์์ ๊ด์ธก ์์ด์ ๋ํ๋ผ ํ๋ฅ ์ด ๊ฐ์ฅ ํฐ ์๋ ์ํ ์์ด์ ์ฐพ๋
464 Hajin Kang, Beom Seuk Hwang
ํด๋ ๋ฌธ์ , ๊ทธ๋ฆฌ๊ณ ๊ด์ธก ์์ด๋ง ์ฃผ์ด์ง ๊ฒฝ์ฐ ์ด๋ฅผ ๊ฐ์ฅ ์ ๋ํ๋ด๋ ๋ชจ๋ธ ํ๋ผ๋ฏธํฐ๋ฅผ ์ฐพ๋ ํ์ต ์ถ์ ๋ฌธ์ ๊ฐ๋๋จธ์ง์ฃผ์๋ฌธ์ ์ด๋ค.
(i) ํ๊ฐ๋ฌธ์ (evaluation question)
(a) ๊ด์ฐฐ ๊ฐ๋ฅํ ์์ด O = {Ot, t = 1, 2, . . . ,T }์ ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ ฮป โก {A, B, p}๊ฐ ์ฃผ์ด์ก์ ๋, ๊ด์ธก์์ด์ํ๋ฅ P(O|ฮป)๋ฅผ๊ณ์ฐํ๋ค.
(ii) ํด๋ ๋ฌธ์ (decoding question)
(a) ๊ด์ฐฐ ๊ฐ๋ฅํ ์์ด O = {Ot, t = 1, 2, . . . ,T }์ ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ ฮป โก {A, B, p}๊ฐ ์ฃผ์ด์ก์ ๋, ๊ด์ธก์์ด์๋ํ๋ด๋๋ฐ๊ฐ์ฅ์ ํฉํ์๋์ํ์์ด์ํ์ธํ๋ค. argmaxQP(Q|O, ฮป)๋ฅผ๊ณ์ฐํ๋ค.
(iii) ํ์ต์ถ์ ๋ฌธ์ (learning question)
(a) ๊ด์ฐฐ๊ฐ๋ฅํ์์ดO = {Ot, t = 1, 2, . . . ,T }๋ง์ฃผ์ด์ง๊ฒฝ์ฐ,์ด๋ฅผ๊ฐ์ฅ์๋ํ๋ด๋HMM์ํ๋ผ๋ฏธํฐฮป๊ฐ๋ฌด์์ธ์งํ์ธํ๋ค. argmaxฮปP(O|ฮป)๋ฅผ๊ณ์ฐํ๋ค.
ํ๊ฐ ๋ฌธ์ ๋ ํ๋ฅ ์ ์ถ์ ๋ฌธ์ ์ ๊ฐ์ผ๋ฉฐ, ์ง์ ์ ์ธ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ ๊ณ์ฐ๋ณด๋ค๋ ์ ํฅ(forward) ๋๋ ํํฅ ์๊ณ ๋ฆฌ์ฆ(backward algorithm)์์ด์ฉํ์ฌ๋ฌธ์ ๋ฅผํด๊ฒฐํ๋ค.ํด๋ ๋ฌธ์ ๋์ต์ ์์ํ์์ด์์ฐพ๋๋ฌธ์ ์๊ฐ์ผ๋ฉฐ๋นํฐ๋น ์๊ณ ๋ฆฌ์ฆ(Viterbi algorithm)์ ์ด์ฉํ๋ค (Viterbi, 1967). ๋ง์ง๋ง์ผ๋ก ํ์ต ์ถ์ ๋ฌธ์ ๋ ๋ชจ์ ์ถ์ ๋ฐ์ฌ์ถ์ ์๋ฌธ์ ์๊ฐ์ผ๋ฉฐ,์ต์ ์๋ชจ๋ธ๋ก๊ฐ์ ํ๊ธฐ์ํด์๋ฐ๋ณต์ ์ธํด๋ฒ์ํ์๋กํ๋ค. EM์๊ณ ๋ฆฌ์ฆ์ํ๋์ธ๋ฐ์-์ฐ์น์๊ณ ๋ฆฌ์ฆ(Baum-Welch algorithm)์๊ตญ์์ต์ฐ์ถ์ ์น๋ก์์๋ ด์ด์๋๊ธฐ๋๋ฌธ์ HMM์์์ํ์ต ์ถ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉ๋๋ค (Welch, 2003). ์ฌ๊ธฐ์๋ ๋ฐ์-์ฐ์น ์๊ณ ๋ฆฌ์ฆ์ ๋ํด๊ฐ๋ตํ์๊ฐํ๋ค.๋จผ์ ์๊ณ ๋ฆฌ์ฆ์์ดํดํ๋๋ฐํ์ํํ๋ฅ ฮฑ, ฮฒ๋ฅผ๋ค์๊ณผ๊ฐ์ด์ ์ํ๋ค.
ฮฑ(l)t (i) = P
(O(l)
1 ,O(l)2 , . . . ,O
(l)t , qt = S i|ฮป
), t = 1, 2, . . . ,T and l = 1, 2, . . . , L,
ฮฒ(l)t (i) = P
(O(l)
t+1,O(l)t+2, . . . ,O
(l)T | qt = S i, ฮป
), t = 1, 2, . . . ,T and l = 1, 2, . . . , L.
ฮฑ(l)t (i)๋ l๋ฒ์งธ ์ํ์ ๋ํด ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ ฮป๊ฐ ์ฃผ์ด์ก์ ๋, t์์ ์ ์ํ๊ฐ S i์ด๋ฉด์ t์์ ๊น์ง์ ๊ด์ธก๋๋ฐ์ดํฐ๊ฐ ๋ํ๋ ํ๋ฅ ์ ์๋ฏธํ๊ณ , ฮฒ(l)
t (i)๋ t์์ ์ ์ํ๊ฐ S i๋ก ์ฃผ์ด์ก์ ๋, t์์ ์ดํ์ ๋ฐ์ดํฐ๊ฐ ๋ํ๋ ํ๋ฅ ์์๋ฏธํ๋ค.๋ํ,๋ชจ๋ธ์ํ๋ผ๋ฏธํฐ์๊ด์ธก์์ด์ด์ฃผ์ด์ก์๋, t์์ ์์ํ๊ฐ S i์ผํ๋ฅ ฮณ(l)
t (i)์๋ค์๊ณผ๊ฐ์ด์ ์ํ๋ค.
ฮณ(l)t (i) = P
(qt = S i|O(l), ฮป
)=ฮฑ(l)
t (i)ฮฒ(l)t (i)
P(O(l)|ฮป)=
ฮฑ(l)t (i)ฮฒ(l)
t (i)โNk=1 ฮฑ
(l)t (k)ฮฒ(l)
t (k).
t์์ ์ ์ํ๊ฐ S i์ด๊ณ t + 1์์ ์ ์ํ๊ฐ S j์ผ ํ๋ฅ ฮพ(l)t (i, j)์ ๋ค์๊ณผ ๊ฐ์ด ๋ํ๋ผ ์ ์๊ณ , ์ด๋ ฮณ(l)
t (i)์์๊ด๊ณ๋ํ๋ค์๊ณผ๊ฐ์ดํํํ ์์๋ค.
ฮพ(l)t (i, j) = P
(qt = S i, qt+1 = S j| O(l), ฮป
)=ฮฑ(l)
t (i)ai jb j(O(l)t+1)ฮฒ(l)
t+1( j)P(O(l)|ฮป)
,
ฮณ(l)t (i) =
Nโj=1
ฮพ(l)t (i, j).
๋ฐ์-์ฐ์น์๊ณ ๋ฆฌ์ฆ์๊ณผ์ ์๋ค์๊ณผ๊ฐ์ด๋ํ๋ผ์์๋ค.
A hidden Markov model for predicting global stock market index 465
Algorithm 1 Baum-Welch algorithm
1: ๊ธธ์ด๊ฐ T์ธ L๊ฐ์๋ ๋ฆฝ๊ด์ธก์์ด O = (O(1),O(2), . . . ,O(L))์๊ณ ๋ คํ๋ค.2: (ฮป, ฮด,โ)์๋ํ์ด๊ธฐ๊ฐ์์ค์ ํ๋ค.3: ๋ค์์กฐ๊ฑด์๋ง์กฑํ ๋๊น์ง์๋๊ณผ์ ์๋ฐ๋ณตํ๋ค.์ด๋, โ < ฮด.
(a) ์ ํฅ์๊ณ ๋ฆฌ์ฆ์์ด์ฉํด๋ค์์๊ณ์ฐํ๋ค.
P(O, ฮป) =
Lโl=1
P(O(l)|ฮป
),
(b) 1 โค i โค N์๋ํด์์๋ก์ดํ๋ผ๋ฏธํฐ ฮปโ = {Aโ, Bโ, pโ}๋ฅผ๊ณ์ฐํ๋ค.
pโi =1L
Lโl=1
ฮณ(l)1 (i),
aโi j =
โLl=1
โTโ1t=1 ฮพ
(l)t (i, j)โL
l=1โTโ1
t=1 ฮณ(l)t (i)
, 1 โค j โค N,
bโi (k) =
โLl=1
โTโ1t=1 I(O(l)
t = v(l)k )ฮณ(l)
t (i)โLl=1
โTโ1t=1 ฮณ
(l)t (i)
, 1 โค k โค M.
(c) โ = P(O, ฮปโ) โ P(O, ฮป)๋ฅผ๊ณ์ฐํ๋ค.
(d) ๋ค์์์ ๋ฐ์ดํธํ๋ค.
ฮป = ฮปโ.
4: ํ๋ผ๋ฏธํฐ๊ฒฐ๊ณผ๋ฅผํ์ธํ ์์๋ค.
2.3.๋ค๋ณ๋ Gaussian์๋๋ง๋ฅด์ฝํ๋ชจ๋ธ
์ฃผ๊ฐ์ง์ ๋ฐ์ดํฐ๋ ์ข ๊ฐ, ์๊ฐ, ๊ณ ๊ฐ, ์ ๊ฐ๋ฅผ ํฌํจํ๊ณ ์๋ค. 4๊ฐ์ ๊ด์ฐฐ ๊ฐ๋ฅํ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ์ฌ ์๋ ๋ง๋ฅด์ฝํ ๋ชจ๋ธ(HMM)์ ์ ์ฉํ ๋ ๊ด์ฐฐ ๊ฐ๋ฅํ ๋ฐ์ดํฐ๊ฐ ์ฐ์ํ ๋ณ์์ด๋ฏ๋ก ๊ฐ์ฅ ๊ธฐ๋ณธ์ด ๋๋ ๋ชจํ์ธ ๋ค๋ณ๋(multivariate) Gaussian์๋๋ง๋ฅด์ฝํ๋ชจ๋ธ์๊ณ ๋ คํด๋ณผ์์๋ค.๋ค๋ณ๋ Gaussian์๋๋ง๋ฅด์ฝํ๋ชจ๋ธ์๊ด์ฐฐ๊ฐ๋ฅํ ๋ฐ์ดํฐ์ ํ๋ฅ ๋ถํฌ๊ฐ ์ ๊ท๋ถํฌ๋ฅผ ๋ฐ๋ฅด๋ ์ ํ ์ํ๊ณต๊ฐ(finite state space)์ด๋ฉด์ ๋์ง์ ์ธ(homoge-neous) ์๋ ๋ง๋ฅด์ฝํ ๋ชจ๋ธ์ ํํ๋ฅผ ๋ ๊ณ ์๋ค. ๋ง๋ฅด์ฝํ ์ฐ์ ์ํ๊ฐ qt = S i๋ก ์ฃผ์ด์ง ๊ฒฝ์ฐ ๊ด์ธก์น Ot์
์กฐ๊ฑด๋ถ๋ถํฌ๋ํผํฉ๊ฐ์ฐ์์๋ถํฌ๋ฅผ๋ํ๋ด๋ฉฐํ๋ฅ ๋ฐ๋ํจ์๋๋ค์๊ณผ๊ฐ๋ค.
bi(Ot) =
Mโk=1
wikbik(Ot) =
Mโk=1
wikN(Ot; ยตik,ฮฃik), i = 1, 2, . . . ,N.
์ด๋, wik๋์ํ๊ฐ S i์ผ๋ k๋ฒ์งธํผํฉ๊ทธ๋ฃน์๋ํ๊ฐ์ค์น๋ฅผ๋ํ๋ด๋ฉฐ wik โฅ 0๊ณผ wi1 + wi2 + ยท ยท ยท + wiM = 1๋ฅผ๋ง์กฑํ๋ค.๊ทธ๋ฆฌ๊ณ , ยตik,ฮฃik๋๊ฐ๊ฐ i๋ฒ์งธ์ํ์ k๋ฒ์งธํผํฉ๊ทธ๋ฃน์ํ๊ท ๊ณผ๊ณต๋ถ์ฐํ๋ ฌ์๋ํ๋ธ๋ค.์ฆ,๋ค๋ณ๋Gaussian์๋๋ง๋ฅด์ฝํ๋ชจ๋ธ์๊ตฌ์ฑํ๋ํ๋ผ๋ฏธํฐ๋์ ์ดํ๋ฅ ํ๋ ฌ A์์ด๊ธฐํ๋ฅ p,ํ๊ท ยต,๊ณต๋ถ์ฐํ๋ ฌ ฮฃ๋ก
๊ตฌ์ฑ๋ ฮป = (A, ยต,ฮฃ, p)์ด๋ค.
466 Hajin Kang, Beom Seuk Hwang
Figure 2: Daily changes in KOSPI200 closing price.
3.์ค์ ๋ฐ์ดํฐ๋ถ์
3.1.์ฃผ๊ฐ์ง์๋ฐ์ดํฐ
์ฃผ๊ฐ์ง์๋๊ฑฐ๋์์์์ฅ๋ฐ๋ฑ๋ก๋์ฃผ์์์์ฅ๊ฐ๊ฒฉ์ํ ๋๋กํ์ฑ๋์ด์ ๋ฐ์ ์ธ์ฃผ๊ฐ์๋ํฅ์๋ํ๋ด๋
๋ํ์ ์ธ์ง์๋ก๊ฐ๋๋ผ์๋ฒค์น๋งํฌ์ง์๋ก์ฌ์ฉ๋๋ค.๋๋ผ๋ง๋ค์์ฅ์๋ํํ๋์ฃผ๊ฐ์ง์๋๋ค์ํ์ง๋ง,๋ณธ๋ ผ๋ฌธ์์๋ ์ฃผ๊ฐ์ฐ๊ณ์ฆ๊ถ(equity linked securities; ELS)์์ ์ฃผ๋ก ์ฌ์ฉ๋๋ ๊ธฐ์ด์์ฐ์ ๋ฐํ์ผ๋ก ๋ค์ฏ ๊ฐ์๊ตญ๊ฐ๋ณ ์ฃผ๊ฐ์ง์๋ฅผ ์ ํํ์๋ค. ํ๊ตญ์ KOSPI200 ์ง์, ์ผ๋ณธ์ NIKKEI225 ์ง์, ํ์ฝฉ์ HSI ์ง์, ๋ฏธ๊ตญ์S&P500์ง์,์๊ตญ์ FTSE100์ง์์ด๋ค.๋ฐ์ดํฐ๋ 2010๋ 1์๋ถํฐ 2019๋ 12์๋ง๊น์ง์ด 10๋ ๋์์์ผ๋ณ์ฃผ๊ฐ์ง์๋ฐ์ดํฐ์ด๋ฉฐ,์ถ์ฒ๋์ผํํ์ด๋ธ์ค(finance.yahoo.com)์ํ๊ตญ๊ฑฐ๋์(krx.co.kr)์ด๋ค.
Figure 2์ ๊ตญ๋ด KOSPI200 ๋ฐ์ดํฐ์ ์ผ๋ณ ๋ณํ ์ถ์ด๋ฅผ ๋ํ๋ด๋ฉฐ, ํด์ธ ์ฃผ๊ฐ์ง์๋ค์ ๋ฐ์ดํฐ ๊ทธ๋ํ๋Figure 3๋ฅผ ํตํด ํ์ธํ ์ ์๋ค. ๊ตญ๋ด KOSPI200 ๊ทธ๋ํ์ ํด์ธ ์ฃผ๊ฐ์ง์๋ค์ ๊ทธ๋ํ๋ฅผ ์ดํด๋ณด๋ฉด, 2010๋ ๋ถํฐ 2019๋ ๊น์ง 10๋ ๋์ ์ ๋ฐ์ ์ผ๋ก ์์นํ๋ ์ถ์ธ๊ฐ ์์์ ์ ์ ์๋ค. ๊ทธ๋ฌ๋ ๊ฐ ๊ตญ๊ฐ ์ฃผ๊ฐ์ง์๋ง๋ค์์ธํ์ถ์ด๋,์ ์ฒด์ ์ธํจํด์๋ค๋ฅธ์์์๋ํ๋ธ๋ค.์์์๊ถ์ง์๋ค์ธ KOSPI200๊ณผ HSI์ง์์๊ฒฝ์ฐ๊ทธ๋ํ์ํจํด์๋น์ทํด๋ณด์ด๋NIKKEI225์ง์์ํจํด์๋๊ณผ๋๋ค๋ฅธํจํด์๋ํ๋ธ๋ค.์๊ตญ์ง์์ธ FTSE100์๊ฒฝ์ฐ์์์๊ถ์ง์๋ค๊ณผ๋๋๋ค๋ฅธํจํด์๋ชจ์ต์์ง๋ 10๋ ๊ฐ๋ณด์ฌ์์ผ๋ฉฐ์ธ๊ณ์ ์ผ๋ก๊ธฐ์ค์ง์๊ฐ๋๋๋ฏธ๊ตญ์ S&P500์์ง์์์ ์ฒด์ ์ธ๋ณ๋ํญ์ด์์ฃผ์์์์ ์ ์ผ๋ก์์ง์ด๋๊ฒ์๋นํด,๋๋จธ์ง 4๊ฐ์ง์์๊ฒฝ์ฐ์๋์ ์ผ๋กํฐ๋ณ๋ํญ์ผ๋ก์์ง์ด๊ณ ์์์์์์๋ค.
3.2.์ฃผ๊ฐ์ง์์์ธก๋ฐฉ๋ฒ
์๋๋ง๋ฅด์ฝํ๋ชจ๋ธ์๊ฒฝ์ ์ ์ํฉ์์ธก์ด๋๋ณ๋์ฑ,์ฃผ์์์ง์์์ธก๋ฑ๊ณผ๊ฐ์ด๊ธ์ต๋ถ์ผ์์๋๋ฆฌ์ฌ์ฉ๋๊ณ ์๋ค (๋ฐํ์ค ๋ฑ, 2007; Lee์ Oh, 2007; Nguyen, 2018). ๋ณธ ๋ ผ๋ฌธ์์๋ HMM์ ์ด์ฉํด ์ธ๊ณ ์ฃผ๊ฐ์ง์๋ฅผ๋ถ์ํด๋ณด๊ณ , ๊ฐ ๊ตญ๊ฐ๋ณ ์ฃผ๊ฐ์ง์์ ์ถ์ด์ ์์ง์ ๊ทธ๋ฆฌ๊ณ ๊ฐ๊ฒฉ ๋ฑ์ ์์ธกํด ๋ณด๊ณ ์ ํ๋ค. ํนํ ๊ตญ๋ด ์์ฅ์๋ฒค์น๋งํฌ์ง์๋ก๊ฐ์ฅ๋๋ฆฌ์ด์ฉํ๋ KOSPI200์ง์๋ฅผ์์ธํ์ดํด๋ณด๊ณ ๋ชจ๋ธ์์ ์ฉํ๊ณ ์ํ๋ค. 2010๋ 1์๋ถํฐ 2019๋ 12์ ๋ง๊น์ง ์ ์ฒด ๋ฐ์ดํฐ ์ค์์ ๋ง์ง๋ง 100 ์์ ์ผ์ ํด๋นํ๋ ๋ฐ์ดํฐ๋ฅผ ์์ธกํ๊ณ ์ ํ๋๋ฐ์ดํฐ๋ก์จ์ ํํ์๋ค.
HMM์ ์ด์ฉํด์ ์ฃผ๊ฐ์ง์๋ฅผ ์์ธกํ๋ ๊ณผ์ ์ ๋ค์๊ณผ ๊ฐ๋ค. HMM ๋ชจ๋ธ์ ์ฑ๊ณผ๋ฅผ ํ๊ฐํ๊ธฐ ์ํด AIC,
A hidden Markov model for predicting global stock market index 467
Figure 3: Daily changes in NIKKEI225, HSI, S&P500 and FTSE100 closing prices.
BIC๋ฑ๊ณผ๊ฐ์๊ธฐ์ค์๋์ ํ๊ณ ,์ด๋ฅผ๋ฐํ์ผ๋ก๊ฐ๊ฐ์๋์ํ์์์๋ฐ๋ฅธ๋ชจ๋ธ์๋น๊ตํ์ฌ๋ฐ์ดํฐ๋ด์๋ด์ฌํ๋ ์ต์ ์ ์ํ์ ์๋ฅผ ์ ํํ๋ค. ์ถ์ ๋ ์ํ์ ์๋ฅผ ๋ฐํ์ผ๋ก ์๋ ๋ง๋ฅด์ฝํ ๋ชจ๋ธ์ ํ์ตํ๋ ๋ฐ์๋์ ์ฒด ๋ฐ์ดํฐ๋ฅผ ํ์ต ๋ฐ์ดํฐ์ ์คํ ๋ฐ์ดํฐ๋ก ๋๋์ด ์งํํ๋ค. ํ์ต ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํด ๊ตฌ์ถํ ๋ชจํ์ ์์ธก์ํ์ฉํ๊ณ , ์คํ ๋ฐ์ดํฐ์์ ์์ธก ์ค์ฐจ๋ฅผ ์ธก์ ํ์ฌ ์์ธก ๋ชจ๋ธ์ด ์ต์ ์ผ๋ก ์์ฑ๋์๋์ง ๊ฒฐ๊ณผ๋ฅผ ํ์ธํ๋ค. ๋ณธ๋ ผ๋ฌธ์์์ฌ์ฉ๋๋ชจ๋ ๋ถ์์๋ Python hmmlearnํจํค์ง๋ฅผ์ด์ฉํ์๋ค (Lebedev๋ฑ, 2017).
3.2.1.๋ชจ๋ธ์ ํ:์ํ์์๊ฒฐ์
์๋๋ง๋ฅด์ฝํ๋ชจ๋ธ์์์๋์ํ์์๋ฅผ๊ฒฐ์ ํ๋๊ฒ์๊ต์ฅํ์ค์ํ๋ค.์๋์ํ์์๊ฐ๋ง์์๋ก๋ชจ๋ธ์ด๋์ ์ ํ๊ฒ์ฒ๋ผ๋ณด์ผ์๋์์ผ๋,์ด๋ด๊ฒฝ์ฐ๋ชจ๋ธ์๊ตฌ์ถํ๊ธฐ์ํด์ถ์ ํด์ผํ ๋ชจ์์์๊ฐ์ฆ๊ฐํ๋ฏ๋ก๊ฐ๊ฒฐ์ฑ์ ์์น์์ ๋ฒ์ด๋๊ฑฐ๋ ๊ณ์ฐ ๊ณผ์ ์ด ์ค๋ ๊ฑธ๋ฆฌ๋ ๋ฑ ๋นํจ์จ์ ์ธ ๋ชจ์ต์ ๋ํ๋ด๊ธฐ๋ ํ๋ค. ์ํ ์์๋ฐ๋ฅธ๋ชจ๋ธ์์ฑ๋ฅ์ํ๊ฐํ๊ธฐ์ํด๋ค์๋ค๊ฐ์ง์ ๋ณด๊ธฐ์ค์์ฌ์ฉํ๋ค. L์๋ชจ๋ธ์๊ฐ๋ฅ๋ํจ์๋ฅผ๋ํ๋ด๊ณ ,M์์ ์ฒด๊ด์ธกํ๊ธฐ๊ฐ์๋ฐ์ดํฐ์์๋ฅผ์๋ฏธํ๋ฉฐ, k๋๋ชจ๋ธ์์์ถ์ ๋๋ชจ์์์๋ฅผ๋ํ๋ธ๋ค.๋ค๊ฐ์ง์งํ๋ชจ๋๊ฐ๊ฐ์๊ธฐ์ค๊ฐ์ด์์์๋ก๋์ข์๋ชจ๋ธ์ด๋ผ๊ณ ํ๋จํ ์์๋ค.
(i) Akaike information criterion (AIC): AIC = โ2 ln L + 2k.
(ii) Bayesin information criterion (BIC): BIC = โ2 ln L + k ln M.
(iii) hannan-quinn information criterion (HQC): HQC = โ2 ln L + 2k ln(ln M).
(iv) bozdogan consistent Akaike information criterion (CAIC): CAIC = โ2 ln L + k(ln M + 1).
468 Hajin Kang, Beom Seuk Hwang
3.2.2.๋ชจ๋ธํ์ต
HMM์๋ชจ์๋ฅผ์ถ์ ํ๊ธฐ์ํด๋ฐ์-์ฐ์น์๊ณ ๋ฆฌ์ฆ์์ ์ฉํ๋ค.์ด๋,์ ์ฒด๋ฐ์ดํฐ๋ฅผํ์ต๋ฐ์ดํฐ์์คํ๋ฐ์ดํฐ๋ก๋๋๊ณ ,ํ์ต๋ฐ์ดํฐ๋ฅผ์์์๋จ์๋ธ๋ก์ผ๋ก๋ถํ ํ์ฌ๊ฐ๊ฐ๋ธ๋ก๋ณํ์ต์์งํํ๋ค.๊ทธ๋ฆฌ๊ณ ์์์์์ ์ ๋ํด์ ๊ด์ธก์น๊ฐ ์ฃผ์ด์ง ๊ฒฝ์ฐ, ๊ณผ๊ฑฐ์ ๋น์ทํ ๊ฐ๋ฅ๋๋ฅผ ๋ํ๋ธ ์ ์ฌ ๋ฐ์ดํฐ๋ฅผ ์ฐพ๋ ๋ฐฉ๋ฒ์ ์ด์ฉํด๋ค์ ์์ ์ ๋ํ ๊ฐ๊ฒฉ์ ์์ธกํ๋ค (Hassan๊ณผ Nath, 2005). ์ดํ์ ๊ด์ธก ๋ฐ์ดํฐ๊ฐ ์ถ๊ฐ๋๋ฉด ์ด๋ฅผ ๋ค์ ํ์ต๋ฐ์ดํฐ๋กํ์ฌ๋ชจ๋ธ์์ฌํ์ตํ๊ณ ๋ค์์์ ์์์ธก์์งํํ๋ค.
์ฃผ๊ฐ์ง์ ๋ฐ์ดํฐ์ ์ ์ฉํ์ฌ ์์ธก ๊ณผ์ ์ ์กฐ๊ธ ๋ ์์ธํ ์ดํด๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ๋ค. ์ฐ์ , ํ์ต ๋ฐ์ดํฐ์์๊ธธ์ด๊ฐ D์ธ ๊ณ ์ ๋ ๊ตฌ๊ฐ์ ์ ํํ๋ค. HMM์ ๋ชจ์์ธ ฮป๋ฅผ ์ถ์ ํ๊ธฐ ์ํด T โ D + 1๋ถํฐ T๊น์ง ๊ตฌ๊ฐ์ ๋จ์๋ธ๋ก์ผ๋กํ์ฌํ์ต๋ฐ์ดํฐ๋ก์ฌ์ฉํ๋ค.์ฃผ๊ฐ์ง์๋ฐ์ดํฐ๋์ฐ์ํ๋ฐ์ดํฐ์ด๋ฏ๋ก๊ฐ์ฐ์์๋ถํฌ๋ฅผ๋ฐ๋ฅธ๋ค๊ณ ๊ฐ์ ํ๋ฉฐ, HMM์ ๋ชจ์์ธ ฮป = {A, B, p}์์ ํ๋ ฌ B๋ ๊ฐ์ฐ์์ ๋ถํฌ์ ํ๊ท ยต์ ํ์คํธ์ฐจ ฯ๋ฅผ ๋ํ๋ธ๋ค.์ฃผ๊ฐ์ง์๋ฐ์ดํฐ์์๊ด์ธก๊ฐ๋ฅํ์์ด์์ข ๊ฐ,์๊ฐ,๊ณ ๊ฐ,์ ๊ฐ๋ฅผ์๋ฏธํ๋ฉฐ๋ค์๊ณผ๊ฐ์ด๋ํ๋ผ์์๋ค.
O ={O(1)
t ,O(2)t ,O(3)
t ,O(4)t , t = T โ D + 1,T โ D + 2, . . . ,T
}.
์์์์ด๊ธฐ๋ชจ์์๋ฐ์ดํฐ๋ฅผ์ด์ฉํ์ฌ๊ด์ธก๊ฐ์ํ๋ฅ P(O|ฮป)๋ฅผ๊ณ์ฐํ ์์๋ค.๊ทธ์ดํ์๋ฐ์ดํฐ๋ธ๋ก์์ผ๋ณ๋ก์ด๋์์ผ๋ค์์์๋ก์ด๊ด์ธก๋ฐ์ดํฐ๋ฅผ์ป์ผ๋ฉฐํ๋ฅ P(Onew|ฮป)๋ฅผ๊ณ์ฐํ ์์๋ค.
Onew ={O(1)
t ,O(2)t ,O(3)
t ,O(4)t , t = T โ D,T โ D + 1, . . . ,T โ 1
}.
์ด๋ฌํ๊ณผ์ ์๋ฐ๋ณตํ์ฌ P(Oโ|ฮป) ' P(O|ฮป)๋ฅผ๋ง์กฑํ๋๋ฐ์ดํฐ Oโ๋ฅผ์ฐพ์๋ธ๋ค.
Oโ ={O(1)
t ,O(2)t ,O(3)
t ,O(4)t , t = T โ โ D + 1,T โ โ D + 2, . . . ,T โ
}.
๋ง์ง๋ง์ผ๋ก ๊ด์ธก ๊ฐ๋ฅํ ์์ด ์ค ์ข ๊ฐ๋ฅผ ์๋ก ๋ ๋ค๋ฉด T + 1์์ ์ ์ข ๊ฐO(1)T+1์ ๊ฐ๊ฒฉ์ ๋ค์ ์์ ์ด์ฉํ์ฌ
๊ณ์ฐํ ์์๋ค.
O(1)T+1 = O(1)
T +(O(1)
T โ+1 โ O(1)T โ
)ร sign(P(O|ฮป) โ P(Oโ|ฮป)).
๋ง์ฐฌ๊ฐ์ง๋ก T + 2์์ ์๊ฐ๊ฒฉ์์์ธกํ๊ธฐ์ํด์๋์๋ก์ด๋ฐ์ดํฐ O๋ฅผํ์ต๋ฐ์ดํฐ๋ก์ฌ์ฉํ๋ค.
O ={O(1)
t ,O(2)t ,O(3)
t ,O(4)t , t = T โ D + 2,T โ D + 3, . . . ,T + 1
}.
์ฒ์์์ธก๊ณผ์ ์์์ถ์ ๋ HMM์๋ชจ์ ฮป๋๋๋ฒ์งธ์์ธก์์งํํ ๋์ด๊ธฐ๋ชจ์๋ก์ฌ์ฉํ๋ฉฐ,๋๋จธ์ง๋์์๊ณผ์ ์๋์ผํ๊ฒ๋ฐ๋ณตํ์ฌ์์ธก์์งํํ๋ค.
3.2.3.๋ชจ๋ธ๊ฒ์ฆ
์์ธก ๊ฒฐ๊ณผ๋ฅผ ๋น๊ตํ๊ธฐ ์ํ ํจ์จ์ฑ ์ธก๋๋ก ํ๊ท ์ ๋๋ฐฑ๋ถ์จ์ค์ฐจ(MAPE)์ ํ๊ท ์ ๋์ค์ฐจ(AAE), ์ ๊ณฑ๊ทผํ๊ท ์ ๊ณฑ์ค์ฐจ(RMSE)๋ฅผ์ฌ์ฉํ๋ฉฐ๋ค์๊ณผ๊ฐ์ด์ ์๋๋ค.
(i) mean absolute percentage error (MAPE)
MAPE =1N
Nโi=1
|True(i) โ Predicted(i)|True(i)
,
A hidden Markov model for predicting global stock market index 469
Table 2: Criterion values for the number of states in KOSPI200
Criteria 2 States 3 States 4 States 5 States 6 StatesAIC 41669.8 39766.9 38283.5 37099.6 36508.5BIC 41698.9 39830.8 38393.9 37268.1 36746.8HQC 41670.1 39767.5 38284.6 37101.2 36510.8CAIC 41698.9 39830.8 38393.9 37268.1 36746.8
(ii) average absolute error (AAE)
AAE =1N
Nโi=1
|True(i) โ Predicted(i)|,
(iii) root-mean-square error (RMSE)
RMSE =
โโ1N
Nโi=1
(True(i) โ Predicted(i))2.
์ธ๊ฐ์ง์ธก๋๋ชจ๋์๋์ ์ผ๋ก์์์๋ก์์ธก์ด์์ด๋ฃจ์ด์ก๋ค๊ณ ํ๋จํ ์์๋ค.
3.3.๋ชจ๋ธ์ค์
์ฃผ๊ฐ์ง์๋ฐ์ดํฐ๋์ฐ์ํ๋ณ์์ด๋ฏ๋ก 2.3์์์ธ๊ธํ๋ค๋ณ๋ Gaussian HMM์์ฌ์ฉํ ๊ฒ์ด๋ค.๋ชจ๋ธ์์ค์ ํ ๋์๋์ํ์์๋ฅผ์ถฉ๋ถํ๊ฒ์ค์ ํ๋ฉด๋ชจํ์์ ํํญ๋๋ค์ํ๊ณ ๋์ ํฉํ๋ชจํ์ด์ ํ๋ ์๋์์ผ๋,ํ๋ผ๋ฏธํฐ์ํด์๊ณผ๋ชจํ์๋ํ์ดํด๊ฐ์ด๋ ต๋ค๋๋จ์ ์ด์๋ค.๋ฐ๋ผ์์ ์ฝ์ฑ์์๋ฆฌ(principle of parsimony)๋ฅผ ๊ณ ๋ คํ์ฌ ์๋ ์ํ์ ์๋ 2์์ 6๊น์ง๋ก ์ ํํ๊ณ , ๊ฐ ์ํ์ ์์ ๋ฐ๋ผ AIC, BIC, HQC, CAIC ๊ธฐ์ค์์ฌ์ฉํ์ฌ ์ ์ ํ ์๋ ์ํ์ ์๋ฅผ ๊ฒฐ์ ํ์๋ค. ๊ธฐ์ค๊ฐ์ด ์์์๋ก ๋ ์ข์ ๋ชจํ์ด๋ฉฐ, Table 2์ KOSPI200์ง์์๋ํ์ํ์์์๋ฐ๋ฅธ๊ธฐ์ค๊ฐ๋ค์๋ํ๋ด๊ณ ์๋ค.
๊ตญ๋ด KOSPI200์ง์๋ฟ๋ง์๋๋ผํด์ธ์ฃผ๊ฐ์ง์๋ค๋ชจ๋ 4๊ฐ์ง๊ธฐ์ค์์ํด๊ฒฐ์ ๋์ต์ ์์ํ์๋ 6๊ฐ์ด๋ค. KOSPI200์๊ฒฝ์ฐ์ํ์์๋ฅผ์ ํ์์ด์ถฉ๋ถํํฌ๊ฒํ๋ฉด, AIC, HQC๋ฅผ๊ธฐ์ค์ผ๋ก๋ 25 States๊ฐ์ต์ ์ธ๊ฒ์ผ๋ก, BIC, CAIC๋ฅผ๊ธฐ์ค์ผ๋ก๋ 15 States๊ฐ์ต์ ์ธ๊ฒ์ผ๋กํ์ธํ ์์์์ผ๋์ํ์์๊ฐํฐ๊ฒฝ์ฐ๋ชจํ์์ํด ์ถ์ ํด์ผ ํ ํ๋ผ๋ฏธํฐ์ ์๋ ๊ธฐํ๊ธ์์ ์ผ๋ก ์ฆ๊ฐํ๋ฏ๋ก ์ฌ๋ฌ ๊ฐ์ง ํจ์จ์ฑ์ ์ํด ์ ํ๋ ์ํ์์
์ต์ ์ ์ํ ์์ธ 6๊ฐ๋ฅผ ์ต์ ์ผ๋ก ์ ํํ๊ธฐ๋ก ํ์๋ค. ์ต์ ์ ๋ชจํ์ผ๋ก ์ ํ๋ 6 States HMM์ ๊ธฐ๋ฐ์ผ๋ก์ ํฉํ๋ชจ๋ธ์ 100์์ ์ผ์์ ์์ธก์๋ํํ๋ผ๋ฏธํฐ์๊ฐ์ Figure 4์์ํ์ธํ ์์๊ณ ,๊ทธํด์์๋ค์๊ณผ๊ฐ์ด ํ ์ ์๋ค. ์ด๊ธฐ ํ๋ฅ ์ด p = (1, 0, 0, 0, 0, 0)์ผ๋ก ์ฃผ์ด์ก์ ๋ t = 1 ์์ ์์ q1 = S 1 ๊ฐ์ ๊ฐ๊ณ , t = 2์์ ์์ q2 = S 1 ๊ฐ์ ๊ฐ์ง ํ๋ฅ ์ด 0.995๊ฐ ๋จ์ ์ ์ ์๋ค. ๋ง์ฐฌ๊ฐ์ง๋ก t = 2 ์์ ์์ q2 = S 2 ๊ฐ์ ๊ฐ์ง
ํ๋ฅ ์ 0์๊ทผ์ ํ๊ณ , q2 = S 3 ๊ฐ์๊ฐ์งํ๋ฅ ์ 0.007์ด๋๋ค.์ผ๋ฐํํ๋ฉด,์ ์ดํ๋ฅ ํ๋ ฌ A์ iํ j์ด์์๋์์์ t ์์ ์์ qt = S i๊ฐ์ ๊ฐ๊ณ t + 1 ์์ ์์ qt+1 = S j ๊ฐ์ ๊ฐ์ง ํ๋ฅ ์ ๋ํ๋ธ๋ค. ํ๋ ฌ์ ๋๊ฐ์์๊ฐ์ด๋๋ถ๋ถ 0.95๋ณด๋คํฌ๊ฒ๋ํ๋๋๊ฒ์ผ๋ก๋ณด์๋์ผ์ํ๋ก์ ์ด๋ ํ๋ฅ ์ด๊ฐ์ฅํฐ๊ฒ์์์์๋ค.
์ค์ ์ฃผ๊ฐ์ง์ ๋ฐ์ดํฐ ๋ถ์์์ ๋ค๋ณ๋ ๊ฐ์ฐ์์ ๋ถํฌ๋ฅผ ๊ฐ์ ํ์ผ๋ฏ๋ก, ์ถ๋ ฅํ๋ฅ ํ๋ ฌ B๋ ํ๋ผ๋ฏธํฐ ยต
์ ฮฃ๋ฅผ์๋ฏธํ๋ค.ํ๋ ฌ ยต์์๋ฏธ๋๋ค์๊ณผ๊ฐ๋ค.์์์ t ์์ ์์ 1ํ์์ฒซ๋ฒ์งธ์ํ๊ฐ S 1๊ฐ์๊ฐ์ง๋,์ฆqt = S 1์ผ๋์ข ๊ฐ,์๊ฐ,๊ณ ๊ฐ,์ ๊ฐ์ํด๋นํ๋ํ๊ท ๊ฐ๋ค์๋ฒกํฐ๋ฅผ์๋ฏธํ๋ค.์ฆ, ยตik๋์ํ๊ฐ S i์ผ๋,์ฌ๋ณผ(Symbols) vk๊ฐ์๋ํํ๊ท ์์๋ฏธํ๋ค.ํด๋น์์์๊ฐ๋ฅํ์ฌ๋ณผ์ {v1, v2, v3, v4}์ด๊ณ ๊ฐ๊ฐ์์ข ๊ฐ,์๊ฐ,๊ณ ๊ฐ, ์ ๊ฐ๋ฅผ ๋ํ๋ธ๋ค. ํ๋ ฌ ฮฃ๋ ๋ง์ฐฌ๊ฐ์ง๋ก ์ข ๊ฐ, ์๊ฐ, ๊ณ ๊ฐ, ์ ๊ฐ์ ํด๋นํ๋ ๊ณต๋ถ์ฐํ๋ ฌ์ด ์ํ์ ์๋งํผ
470 Hajin Kang, Beom Seuk Hwang
Figure 4: 6 states HMM parameters in KOSPI200.
6๊ฐ๊ฐ ๋ํ๋จ์ ์ ์ ์๋ค. Figure 4์ ํตํด์ ์ํ๊ฐ S i์ผ ๋, ์ด์ ํด๋นํ๋ ๊ฐ๊ฐ์ ๊ณต๋ถ์ฐ์ ํ์ธํ ์์์ผ๋ฉฐ,ํ๊ท ๊ณผ๊ณต๋ถ์ฐํ๋ ฌ๋ชจ๋์ํ์๋ฐ๋ผ๊ฐ์์์ค์ด๊ตฐ์งํ๋๊ฒ์ฒ๋ผ๊ตฌ๋ถ๋์ด๋ํ๋๊ฒ์ํ์ธํ ์์๋ค.
3.4.๋ถ์๊ฒฐ๊ณผ
Figure 5๋ KOSPI200 ์ง์์ ์ข ๊ฐ, ์๊ฐ, ๊ณ ๊ฐ, ์ ๊ฐ์ ๋ํ 2019๋ 8์ 5์ผ๋ถํฐ 2019๋ 12์ 30์ผ๊น์ง 100์์ ์ผ ๋์์ ์์ธก ๊ฒฐ๊ณผ๋ฅผ ๋ํ๋ธ๋ค. ์ค์ ์ฃผ๊ฐ์ง์ ๊ฐ๊ฒฉ์ ๋ถ์์ ์ ์ , ๋ชจ๋ธ์ ํตํ ์์ธก๊ฐ๊ฒฉ์ ๊ฒ์ ์์ค์ ์ผ๋กํํ๋๊ณ ์๋ค.์๋๋ง๋ฅด์ฝํ๋ชจ๋ธ(HMM)์์ด์ฉํ์์ธก์ด์ ์ฒด์ ์ธ์ฃผ๊ฐ์ง์์์ง์์ด๋์ถ์ด๋ฅผ์ ๋ํ๋ด๊ณ ์์์ ๋ณด์ฌ์ฃผ๊ณ ์๋ค. ์์ธก์ ์ฑ๊ณผ๋ฅผ ํ์ธํ๊ธฐ ์ํด ํ์ต ๋ฐ์ดํฐ์ ์คํ ๋ฐ์ดํฐ๋ก ๋๋ ์ ์ฒด๋ฐ์ดํฐ์ค์์์คํ๋ฐ์ดํฐ์์์์ธก์ค์ฐจ๋ฅผํ์ธํ์๋ค. Table 3์๋ HMM๊ณผ๋น๊ต๋ชจ๋ธ์ธ์ํฌํธ๋ฒกํฐํ๊ท(support vector regression; SVR) ๋ชจ๋ธ (Basak ๋ฑ, 2007)์ ํตํด์ ๋์จ ์์ธก ์ค์ฐจ๋ฅผ ๋น๊ตํ๊ณ ์๋ค. HMM ๋ชจ๋ธ์ด SVR ๋ชจ๋ธ๋ณด๋ค ์ ๋ฐ์ ์ผ๋ก ๋ ์์ ์์ธก ์ค์ฐจ๋ฅผ ๋ณด์ฌ์ฃผ๊ณ ์์ง๋ง, ์ ๊ณฑ๊ทผํ๊ท ์ ๊ณฑ์ค์ฐจ(RMSE)์ ๊ฒฝ์ฐ์ฃผ๊ฐ์ง์์๊ฐ์๊ณ ๊ฐ๋ SVR๋ชจ๋ธ์ด๋์์์์ธก์ค์ฐจ๋ฅผ๊ฐ์ง๊ณ ์๋ค. KOSPI200์๊ฒฝ์ฐ๋น๊ต๋์์ผ๋กํSVR ๋ชจ๋ธ์ด RBF ์ปค๋(radial basis function kernel)์ ์ด์ฉํ ๊ฒฐ๊ณผ์ด์ง๋ง, ๊ฐ๊ฐ์ ์ฃผ๊ฐ์ง์ ๋ฐ์ดํฐ์ ๋ฐ๋ผ์์ ํ(linear), ๋คํญ(polynomial), ์๊ทธ๋ชจ์ด๋(sigmoid) ์ปค๋ ๋ฑ๊ณผ ๊ฐ์ ๋ค๋ฅธ ์ต์ ์ ์ด์ฉํ๊ฒ ๋๋ฉด ๊ฒฐ๊ณผ๋ ์กฐ๊ธ์ฉ ๋ฌ๋ผ์ง ์ ์์ ๊ฒ์ด๋ค. ์ํฌํธ ๋ฒกํฐ ํ๊ท ๋ชจ๋ธ์ ์์์ ๋ฐ๋ฅธ ๊ทผ์ ํ ๋ฐ์ดํฐ์ ์กฐ๊ฑด๋ถ ์์กด์ฑ์ ๋ํ๊ณ ๋ ค๊ฐ๋ถ์กฑํ๊ณ ,๋ชจํ์ ํฉ๋ฐ์์ธก๊น์ง์๊ณ์ฐ์๊ฐ์ด HMM๋ณด๋ค์๋์ ์ผ๋ก๋ง์ด์์๋๋๋จ์ ์๊ฐ์ง๊ณ ์๋ค. HMM๋ชจ๋ธ์๊ด์ฐฐ๊ฐ๋ฅํํ๋ฅ ๊ณผ์ ์๊ฒฝ์ฐ๋ง๋ฅด์ฝํ์ฐ์๊ฐ์ฃผ์ด์ง์ํฉ์์์กฐ๊ฑด๋ถ๋ ๋ฆฝ์ด๋ฉฐ,๊ฐ์์ ์์กฐ๊ฑด๋ถ๋ถํฌ๋์ค์งํด๋น์์ ์๋ง๋ฅด์ฝํ์ฐ์์๋ง์์กดํ๋๊ธฐ๋ณธ๊ตฌ์กฐ๋ฅผ๊ฐ์ง๊ณ ์๋ค.์ด๋์ฃผ๊ฐ์ง์
A hidden Markov model for predicting global stock market index 471
Figure 5: Prediction results for closing, open, high and low prices in KOSPI200.
Table 3: Prediction error for closing, open, high and low prices in KOSPI200
Model Method Closing Open High LowMAPE 0.0088 0.0079 0.0083 0.0081
HMM AAE 2.41 2.18 2.29 2.21RMSE 3.05 2.95 2.84 2.92MAPE 0.0098 0.0083 0.0083 0.0085
SVR AAE 2.69 2.28 2.29 2.31RMSE 3.39 2.91 2.73 2.95
์์ง์์ ์ ํฉํ ๊ตฌ์กฐ๋ผ๊ณ ํ ์ ์๋๋ฐ ์์์ ์์ ์ ์ฃผ๊ฐ์ง์๊ฐ ์๋๋ ์ฌ๋ฌ ์ํ์ ์ํด ์ํฅ์ ๋ฐ์ผ๋ฉฐ
๋ง๋ฅด์ฝํ ๊ณผ์ ์ ๋ฐ๋ฅธ๋ค๊ณ ๊ฐ์ ์ ํ ์ ์๊ธฐ ๋๋ฌธ์ด๋ค. ๋ํ HMM ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ ๋ฑ์ ์ด์ฉํ์ฌ ๋ชจ๋ธ์์ค๋ช ๋ฐํด์ํ ์์์ผ๋ฏ๋ก๋ฐ์ดํฐ์ํน์ฑ์ HMM์์ด์ฉํ์์ธก์ด๋์ข์๊ฒฐ๊ณผ๋ฅผ์ ๊ณตํ๊ณ ์๋ค๊ณ ๋ณผ์์๋ค.
Figure 6๋ ํด์ธ ์ฃผ๊ฐ์ง์์ ๋ํ HMM์ ์ด์ฉํ ์ข ๊ฐ์ ์์ธก ๊ฒฐ๊ณผ๋ฅผ ๋ํ๋ด๋๋ฐ ์ค์ ์ฃผ๊ฐ์ง์ ๊ฐ๊ฒฉ์ ๋ถ์์ ์ ์ , ๋ชจ๋ธ์ ํตํ ์์ธก๊ฐ๊ฒฉ์ ๊ฒ์ ์ ์ค์ ์ผ๋ก ํํํ๊ณ ์๋ค. Table 4๋ ์ด์ ๋ํ ์์ธก ์ค์ฐจ๋ฅผ๋น๊ตํ๊ฒฐ๊ณผ๋ฅผ๋ณด์ฌ์ฃผ๊ณ ์๋ค.
๋ณธ์ฐ๊ตฌ์์์ ์ฉํ HMM์ด์ต๊ทผ์ฃผ๊ฐ์์ธก์๋ง์ดํ์ฉ๋๊ณ ์๋ SVR์๋ชป์ง์๊ฒ์ ๋ฐ์ ์ผ๋ก์ฐ์ํ์์ธก์ ํ๋๋ฅผ๋ณด์ด๊ณ ์์์ํ์ธํ ์์๋ค.์ด๋๊ตญ๋ด๋ฐํด์ธ์ฃผ๊ฐ์ง์๋ฅผ์์ธกํ๊ธฐ์ํ๋ฐฉ๋ฒ์ผ๋ก HMM์ดํจ๊ณผ์ ์ธ์๋จ์ด๋ ์์๋ค๋์ ์๋ท๋ฐ์นจํ๋์ฐ๊ตฌ๊ฒฐ๊ณผ๋ผ๊ณ ํ ์์๋ค.
472 Hajin Kang, Beom Seuk Hwang
Figure 6: Prediction results for closing prices in NIKKEI225, HSI, S&P500 and FTSE100.
Table 4: Prediction error for closing prices in NIKKEI225, HSI, S&P500 and FTSE100
Model Method NIKKEI225 HSI S&P500 FTSE100MAPE 0.0082 0.0113 0.0080 0.0086
HMM AAE 182.73 303.18 23.98 62.64RMSE 243.43 379.43 33.06 78.65MAPE 0.0085 0.0112 0.0084 0.0086
SVR AAE 190.91 298.41 25.18 62.90RMSE 246.36 388.83 33.47 82.56
4.๊ฒฐ๋ก ๋ฐ๋ ผ์
๋ณธ๋ ผ๋ฌธ์์๋์๋๋ง๋ฅด์ฝํ๋ชจ๋ธ์๊ธฐ๋ฐ์ผ๋ก๊ตญ๋ด KOSPI200์ฃผ๊ฐ์ง์์ํด์ธ NIKKEI225, HSI, S&P500,FTSE100์ฃผ๊ฐ์ง์์์ธก์์ ์ฉํ์ฌ์ผ๋ง๋์ฐ์ํ์์ธก์ ํ๋๋ฅผ๋ํ๋ด๋์ง์ค์ฆ๋ถ์์์๋ํ์๋ค. AIC,BIC, HQC, CAIC๊ธฐ์ค์์ด์ฉํด๋ชจ๋ธ์์ต์ ์ํ์๋ฅผ๊ฒฐ์ ํ์๊ณ ,์ด๋ฅผํตํด์์ฑํ๋ชจํ์ผ๋ก์ฃผ๊ฐ์ง์๋ค์์์ง์์์๋ฐ๋ผ๊ฐ๋ฉฐ๊ฐ๊ฒฉ๋ํ์์์ธกํ๋์ง๋ฅผ์ดํด๋ณด์๋ค.๊ทธ๊ฒฐ๊ณผ, HMM๋ฐฉ๋ฒ์ด๋น๊ต๋ชจํ์ธ์ํฌํธ๋ฒกํฐํ๊ท๋ชจํ๊ณผ๋น๊ตํด๋ค์ฒ์ง์ง์๋์ฐ์ํ์์ธก์ ํ๋๋ฅผ๋ณด์์ํ์ธํ ์์์๋ค.ํนํ, HMM๋ฐฉ๋ฒ์๋ง๋ฅด์ฝํ์ฐ์์์กฐ๊ฑด๋ถ๋ ๋ฆฝ์ด๋ผ๋๊ธฐ๋ณธ๊ตฌ์กฐ๊ฐ์ฃผ๊ฐ๋ฐ์ดํฐ์ํน์ฑ์์๋ฐ์ํ ์์๋๋ชจํ์ด๋ผ๋์ ์์
์ฃผ๊ฐ์ง์์์ธก์์๋จ์ผ๋ก์จ์ ํฉํ๋ค๋์ฌ์ค์ํ์ธํ์๋ค.๋ํ,๋ณธ์ฐ๊ตฌ๋ฅผ์ฐธ๊ณ ํ์ฌ์ถํํ์จ๋ฐ์ดํฐ๋,
A hidden Markov model for predicting global stock market index 473
๊ธ๋ฆฌ,์ฃผ์์๋ณ๋์ฑ๋ฟ๋ง์๋๋ผ์ ์ฉ๋ฐ์ดํฐ๋ฑ๊ธ์ต์์ฅ์์ฌ๋ฌ๋ฐ์ดํฐ์๋ HMM๋ฐฉ๋ฒ์๋ค์ํ๊ฒํ์ฉํ ์์์๊ฒ์ผ๋ก๊ธฐ๋ํด๋ณผ์์์๋ค (Idvall๊ณผ Jonsson, 2008; Liu, 2018).
๋ณธ์ฐ๊ตฌ์ํ๊ณ์ ๋ฐํฅํ์ฐ๊ตฌ๋ฐฉํฅ์๋ค์๊ณผ๊ฐ๋ค.์ฒซ์งธ,๊ด์ฐฐ๊ฐ๋ฅํ๋ฐ์ดํฐ์ธ์ฃผ๊ฐ์ง์๋ฐ์ดํฐ๋ชจํ์๋ํด ๊ฐ์ฐ์์ ๋ถํฌ ์ธ์ ๋ค์ํ ๋ถํฌ๋ฅผ ๊ฐ์ ํ์ฌ ์ ์ฉํ๊ณ , ๊ธ์ต ์์ฅ์ ํน์ฑ์ ๋ฐ์ํ ๋ ์ ํฉํ ๋ชจ๋ธ์์ ์ฉํ๋๊ฒ์๋ํ์ฐ๊ตฌ๊ฐํ์ํ๋ค.์ฃผ๊ฐ์ง์๋ฐ์ดํฐ์๊ฒฝ์ฐ์์ชฝ๊ทน๋จ๊ฐ์๋ฐ๋๊ฐ๋๋์ fat-tailํํ์๋ถํฌ๋ฅผ๊ฐ์ง๊ณ ์๋ค๋๊ฒ์ด์๋ ค์ ธ์๊ธฐ๋๋ฌธ์๊ฐ์ฐ์์๋ถํฌ์ธ์๋ก๊ทธ์ ๊ท๋ถํฌ๋์จ์ด๋ธ๋ถํฌ,์ฝ์๋ถํฌ๋ฑ๊ณผ ๊ฐ์ด ๋ฐ์ดํฐ์ ํน์ฑ์ ๋ฐ์ํ HMM์ ์ ์ฉํ์ฌ ๊ฒฐ๊ณผ๋ฅผ ๋ณด๋ค ๊ฐ์ ํ ์ ์์ ๊ฒ์ด๋ค. ๋์งธ, ๋ณธ ๋ ผ๋ฌธ์2010๋ ๋ถํฐ 2019๋ ๊น์ง ํด๋น 10๋ ๋์์ ๋ฐ์ดํฐ ์ธํธ์๋ง ๊ทผ๊ฐํ๊ณ ์์ด์ ๊ณผ๊ฑฐ 2008๋ ์ธ๊ณ ๊ธ์ต์๊ธฐ๋,ํ์ฌ์ฝ๋ก๋19์ฌํ๋ก์ธํ๊ธ์ต์์ฅ์นจ์ฒด๋ฑ๊ธ์ต์์ฅ์ํฐ์ถฉ๊ฒฉ์์ค์ฌ๊ฑด๋ค์ดํฌํจ๋์ง์์๋ค๋ํ๊ณ์ ์ด์๋ค.์ด์๊ฐ์๋๋ณดํต์๊ธ์ต์์ฅ์์์ฃผ์์์์ง์์์์ธกํ๋๊ฒ์ธ์๋๊ธ์ต์์ฅ์ํฐ์ถฉ๊ฒฉ์ด๋ฐ์ํ์๋์์ฃผ์์์ง์๋ํ์์ธก์ด๊ฐ๋ฅํ๋๋ก์ฐ๊ตฌ๊ฐ์งํ๋๋ค๋ฉด๋ฆฌ์คํฌ๊ด๋ฆฌ์ฐจ์์์๋ํจ์จ์ ์ผ๋กํ์ฉ๋ ์
์์๊ฒ์ผ๋ก๊ธฐ๋ํด๋ณผ์์๋ค.
References
Park HJ, Hong DH, and Kim MH (2007). Using hidden Markov model for stock flow forecasting. The Proceed-ings of the Korean Institute of Electrical Engineers Summer Conference, 1860-1861
Basak D, Pal S, and Patranabis DC (2007). Support vector regression. Neural Information Processing-Lettersand Reviews, 11, 203โ224.
Baum LE and Petrie T (1966). Statistical inference for probabilistic functions of finite state Markov chains. TheAnnals of Mathematical Statistics, 37, 1554โ1563.
Baum LE, Petrie T, Soules G, and Weiss N (1970). A maximization technique occurring in the statistical analysisof probabilistic functions of Markov chains, The Annals of Mathematical Statistics, 41, 164โ171.
Bozdogan H (1987). Model selection and Akaikeโs information criterion (AIC): The general theory and its ana-lytical extensions, Psychometrika, 52, 345โ370.
Cao L and Tay FE (2001). Financial forecasting using support vector machines, Neural Computing & Applica-tions, 10, 184โ192.
Cappe, O, Moulines E, and Ryden T(2006). Inference in Hidden Markov Models. Springer, New York.Hannan EJ and Quinn BG (1979). The determination of the order of an autoregression, Journal of the Royal
Statistical Society, Series B, 41, 190โ195.Hassan MR and Nath B (2005). Stock market forecasting using hidden Markov model: a new approach. In
Proceedings of the 5th International Conference on Intelligent Systems Design and Applications, IEEEComputer Society, 192โ196.
Idvall P and Jonsson C (2008). Algorithmic trading: Hidden Markov models on foreign exchange data, MasterโsThesis, Department of Mathematics, Linkopings Universitet.
Knab B, Schliep A, Steckemetz B, and Wichern B (2003). Model-based clustering with hidden Markov modelsand its application to financial time-series data, Between Data Science and Applied Data Analysis, Springer,New York.
Landen C (2000). Bond pricing in a hidden Markov model of the short rate, Finance and Stochastics, 4, 371โ389.Lee S and Oh C (2007). A smoothing method for stock price prediction with hidden Markov models, Journal of
the Korean Data and Information Science Society, 18, 945โ953.Liu W (2018). Hidden Markov model analysis of extreme behaviors of foreign exchange rates, Physics A: Statis-
474 Hajin Kang, Beom Seuk Hwang
tical Mechanics and its Applications, 503, 1007โ1019.Mamon RS and Elliott RJ (2007). Hidden Markov Models in Finance. Springer, New York.Nguyen N (2018). Hidden Markov model for stock trading, International Journal of Financial Studies, 6, 1โ17.Rabiner LR (1989). A tutorial on hidden Markov models and selected applications in speech recognition. In
Proceedings of the IEEE, 77, 257โ286.Viterbi A (1967). Error bounds for convolutional codes and an asymptotically optimum decoding algorithm,
IEEE Transactions on Information Theory, 13, 260โ269.Welch LR (2003). Hidden Markov models and the Baum-Welch algorithm, IEEE Information Theory Society
Newsletter, 53, 10โ13.Zucchini W, MacDonald IL, and Langrock R (2017). Hidden Markov Models for Time Series: An Introduction
Using R. CRC Press, New York.
Received January 15, 2021; Revised February 5, 2021; Accepted February 15, 2021
475
์๋๋ง๋ฅด์ฝํ๋ชจ๋ธ์์ด์ฉํ๊ตญ๊ฐ๋ณ์ฃผ๊ฐ์ง์์์ธก
๊ฐํ์งa ํฉ๋ฒ์1,a
a์ค์๋ํ๊ต์์ฉํต๊ณํ๊ณผ
์ ์ฝ
์๋ ๋ง๋ฅด์ฝํ ๋ชจ๋ธ(hidden Markov model, HMM)์ ์๋๋ ์ํ์ ๊ด์ฐฐ ๊ฐ๋ฅํ ๊ฒฐ๊ณผ์ ๋ ๊ฐ์ง ์์๋ก์ด๋ฃจ์ด์งํต๊ณ์ ๋ชจํ์ผ๋กํ๋ฅ ๋ก ์ ์ ๊ทผ์ด๊ฐ๋ฅํ๊ณ ,๋ค์ํ์ํ์ ์ธ๊ตฌ์กฐ๋ฅผ๊ฐ์ง๊ณ ์์ด์ฌ๋ฌ๋ถ์ผ์์ํ๋ฐํ๊ฒ์ฌ์ฉ๋๊ณ ์๋ค.ํนํ๊ธ์ต๋ถ์ผ์์๊ณ์ด๋ฐ์ดํฐ์์์ฉ๋์ด๋ค์ํ์ฐ๊ตฌ๊ฐ์งํ๋๊ณ ์๋ค.๋ณธ์ฐ๊ตฌ๋HMM์ด๋ก ์๊ตญ๋ด KOSPI200์ฃผ๊ฐ์ง์์๋๋ถ์ด NIKKEI225, HSI, S&P500, FTSE100๊ณผ๊ฐ์ํด์ธ์ฃผ๊ฐ์ง์์์ธก์์ ์ฉํด๋ณด๊ณ ์ํ๋ค.๋ํ,์ต๊ทผ์ธ๊ณต์ง๋ฅ๋ถ์ผ์๋ฐ์ ์ผ๋ก์ธํด์ฃผ์๊ฐ๊ฒฉ์์ธก์๋น๋ฒํ๊ฒ์ฌ์ฉ๋๋์ํฌํธ๋ฒกํฐํ๊ท(support vector regression, SVR)๊ฒฐ๊ณผ์์ด๋ค์ฐจ์ด๊ฐ์๋์ง๋น๊ตํ์ฌ์ดํด๋ณด๊ณ ์ํ๋ค.
์ฃผ์์ฉ์ด:์ํฌํธ๋ฒกํฐํ๊ท,์๋๋ง๋ฅด์ฝํ๋ชจ๋ธ,์ฃผ๊ฐ์ง์์์ธก,์ฝ์คํผ200์ง์,ํด์ธ์ฃผ๊ฐ์ง์
์ด๋ ผ๋ฌธ์ 2020๋ ๋์ค์๋ํ๊ต์ฐ๊ตฌ์ฅํ๊ธฐ๊ธ์ง์์์ํ๊ฒ์.1๊ต์ ์ ์: (06974)์์ธ์๋์๊ตฌํ์๋ก 84,์ค์๋ํ๊ต๊ฒฝ์๊ฒฝ์ ๋ํ์์ฉํต๊ณํ๊ณผ. E-mail: [email protected]