평균트루범위 지표

마지막 업데이트: 2022년 1월 13일 | 0개 댓글
  • 네이버 블로그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 트위터 공유하기
  • 카카오스토리 공유하기
사진 출처 - https://sumniya.tistory.com/26

What is Technical Analysis?( 기술 분석이란?)

Enter your email address and we'll send you a free PDF of this post.

Share this:

Technical analysis is a process for evaluating the historical price action on charts to identify(식별하다) the current trend or chart pattern to establish(제정하다 확증하다) the possible probability of price action in the future. Technical analysts analyze past price action trading activity and the pattern of price changes in a market to project possible future price movements. Technical analysis is a different school(떼)of thought than fundamental analysis. While technical analysis focuses on historical price action, chart patterns, along with both up and downtrends, fundamental analysis focuses on a company’s financial results like earnings, book value, and cash flow. Fundamental analysis projects future trends in earnings and sales to project future prices adjusted for the new value of the underlying company a stock represents or the value of a commodity or currency.

기술 분석은 차트에서 과거 가격 조치를 평가하여 현재 추세 또는 차트 패턴을 식별하여 향후 가격 조치 가능성을 설정하는 프로세스입니다. 기술 분석가는 과거 가격 움직임 거래 활동 및 시장의 가격 변동 패턴을 분석하여 가능한 미래 가격 변동을 예상합니다. 기술 분석은 기본 분석과는 다른 생각의 학교입니다. 기술 분석은 과거 가격 조치, 차트 패턴 및 상승 및 하강 추세에 중점을 두지 만, 기본 분석은 수입, 장부 가치 및 현금 흐름과 같은 회사의 재무 결과에 중점을 둡니다. 기초 분석은 주식이 나타내는 기본 회사의 새로운 가치 또는 상품 또는 통화의 가치에 맞게 조정 된 미래 가격을 예상하여 수입 및 판매의 미래 추세를 예측합니다.

There are many technical indicators that attempt to measure the rate of change of price action like the Relative Strength indicator (RSI). Other indicators try filter the volatility of price action to quantify trends like moving averages. Still others try to quantify a trading range like Bollinger Bands.

상대적 강도 지표(RSI)와 같이 가격 조치의 변화 속도를 측정하려는 많은 기술적 지표들이 있다. 다른 지표들은 이동 평균과 같은 추세를 정량화하기 위해 가격 조치의 변동성을 필터링하려고 시도한다. 여전히 볼링거 밴드같이 다른 사람들은 거래 범위를 정량화하려고 한다.

Technical indicators are not magical and they are not a Holy Grail. Market price action changes from trends to price ranges, and from low volatility to high volatility. They are good for building systems so you can measure your risk on each trade, and use them as trading tools to quantify your entries and exits. They are also helpful for identifying your risk and reward through technical price stop losses and projecting potential rewards based on technical levels.

기술 지표는 마법이 아니며 성배가 아닙니다. 시장 가격 조치는 추세에서 가격 범위로, 변동성이 낮고 변동성이 큰 것으로 변경됩니다. 시스템 구축에 유용하므로 각 거래에 대한 위험을 측정하고 거래 도구로 사용하여 입출고를 정량화 할 수 있습니다. 또한 기술적 가격 중지 손실을 통해 위험과 보상을 식별하고 기술적 수준에 따른 잠재적 보상을 예상하는 데 도움이됩니다.

Bollinger Bands are a technical trading tool that are best used in range-bound markets to measure support and resistance levels, when price gets extended from a medium term moving average like the 20 day SMA .

Relative Strength Index (RSI) is for finding good risk / reward ratios during overbought (70 RSI) or oversold (30 RSI) conditions. The RSI can work in both trends and range-bound markets, but it doesn’t work when a market price goes parabolic(포물선의) .

볼린저 밴드 (Bollinger Bands)는 20 일 SMA와 같이 중기 이동 평균에서 가격이 상승 할 때 지원 및 저항 수준을 측정하기 위해 범위 시장에서 가장 잘 사용되는 기술 거래 도구입니다.

RSI (상대 강도 지수)는 과매 수 (70 RSI) 또는 과매도 (30 RSI) 조건에서 좋은 위험 / 보상 비율을 찾는 데 사용됩니다. RSI는 트렌드와 범위 시장 모두에서 작동 할 수 있지만 시장 가격이 포물선이되면 작동하지 않습니다.

What is Simple Moving Average - SMA?

A simple moving average (SMA) is an arithmetic moving average calculated by adding recent closing prices and then dividing that by the number of time periods in the calculation average. A simple, or arithmetic, moving average that is calculated by adding the closing price of the security for a number of time periods and then dividing this total by that same number of 평균트루범위 지표 periods. Short-term averages respond quickly to changes in the price of the underly .ing, while long-term averages are slow to react.

단순 이동 평균 (SMA)은 최근 종가를 더한 다음 이를 계산 평균의 기간 수로 나누어 계산 한 산술 이동 평균입니다. 조사기간 수 동안 유가 증권의 종가를 더한 다음이 합계를 동일한 수의 기간으로 나눔으로써 계산되는 단순 또는 산술 이동 평균입니다. 단기 평균은 기초가의 가격 변동에 빠르게 반응하는 반면 장기 평균은 반응이 느립니다

The Moving Average Convergence/Divergence (MACD) is a good tool for measuring swings in price up and down in markets with a wide price range.

이동 평균 수렴 / 발산 (MACD)은 다양한 가격대의 시장에서 가격 변동을 측정하는 데 유용한 도구입니다.

Long term moving averages like the 200-day SMA are for trading long term trends.

Short term moving averages like the 5-day EMA and the 10-day EMA are for trading short term trends that have momentum.

200 일 SMA와 같은 장기 이동 평균은 장기 추세 거래 용입니다.

5 일 EMA 및 10 일 EMA와 같은 단기 이동 평균은 모멘텀이있는 단기 추세를 거래하기위한 것입니다

Average True Range (ATR) measures the trend of volatility of the price range.

Technical analysis is used for identifying levels of price support and resistance or the direction of a current trend. Technical indicators are just trading tools; the profits come from how well we use them to build a price action trading system that fits our own risk tolerance and return goals. Technical analysis outside a quantified trading system is of little help in profitable trading as you still need a repeatable edge and proper position sizing.

평균 트루 범위 (ATR)는 가격 범위의 변동 추세를 측정합니다.

기술 분석은 가격 지원 수준과 평균트루범위 지표 저항 또는 현재 추세의 방향을 식별하는 데 사용됩니다. 기술 지표는 거래 도구 일뿐입니다. 이익은 우리가 우리 자신의 위험 감수성과 수익 목표에 맞는 가격 행동 거래 시스템을 구축하기 위해 얼마나 잘 사용하는지에 의해 발생합니다. 정량화 된 거래 시스템 외부의 기술 분석은 여전히 반복 가능한 우위와 적절한 포지션 사이징이 필요하기 때문에 수익성있는 거래에 거의 도움이되지 않습니다.

바이오스펙테이터

삼성바이오에피스가 첫번째 안과질환 치료제 SB11(루센티스 바이오시밀러, 성분명 라니비주맙)의 글로벌 3상에서 1차 유효성 지표를 충족하는 긍정적인 결과를 확보했다. 이에 따라 삼성바이오에피스는 연내 미국, 유럽 등에서 SB11의 판매허가 절차에 돌입할 계획이다.

삼성바이오에피스는 18일 "SB11의 글로벌 임상 3상에서 1차 유효성 평가기준을 달성해 오리지널 의약품과의 임상의학적 동등성을 입증했다"고 발표했다. 삼성측은 당초 5월초 예정됐던 미국 시력안과학회(ARVO) 연례 학술대회를 통해 이번 결과를 발표할 예정이었으나 코로나19로 인해 행사가 취소돼 자체적으로 공개하게 됐다.

SB11의 오리지널 의약품 '루센티스(Lucentis)'는 제넨텍(Genentech)이 개발한 황반변성, 당뇨병성 황반부종 등의 치료제로서 평균트루범위 지표 현재 다국적제약사 로슈(Roche)와 노바티스(Novartis)가 판매 중이며, 지난해 글로벌 시장 매출은 약 4조6000억원에 달한다.

삼성바이오에피스는 루센티스의 바이오시밀러 개발에 착수해 2018년 3월부터 2019년 12월까지 총 705명의 습성(濕性) 연령유관 황반변성(nAMD: Neovascular Age-related Macular Degeneration) 환자들을 대상으로 3상시험을 진행해 SB11과 오리지널의약품간의 임상의학적 유효성 등을 비교 연구했다.

삼성바이오에피스는 1차 유효성 평가 지표(primary endpoint)를 두 가지로 설정해 사전에 수립한 동등성 범위(margin) 충족 여부를 확인했다. 우선 처방 후 8주간의 최대 교정시력(BCVA: Best Corrected Visual Acuity) 개선 수치를 측정한 후 90% 신뢰구간 간격(CI: Confidence Interval)을 확인했다. 또한 4주간의 황반 중심부 두께(CST: Central Subfield Thickness) 변화를 측정한 후 95% 신뢰구간 간격도 확인했다.

연구 결과에 따르면, 8주 최대 교정시력(BCVA)의 최소제곱 평균(Least Squares mean)은 SB11이 6.2글자, 오리지널 의약품이 7.0 글자 개선됐다. 이 때 상호간 차이(-0.8)의 90% 신뢰구간 간격(-1.827 ~ 0.219)은 사전 수립된 동등성 범위(±3)를 충족했다.

4주 중심부 두께(CST) 변화의 최소제곱 평균은 SB11이 -108.4 마이크로미터(μm), 오리지널 의약품이 -100.1 마이크로미터였다. 이 때 상호간 차이는(-8.3)의 95% 신뢰구간 간격(-19.446 ~ 2.747)은 사전 수립된 동등성 범위(±36)를 충족했다. 이번 3상 결과는 최초 24주간의 중간 분석(interim analysis)을 바탕으로 한 것이다.

이에 따라 삼성바이오에피스는 이르면 연내 SB11의 미국, 유럽 등 판매허가 신청을 통해 본격적인 제품 허가 단계에 착수할 계획이다. 오리지널의약품의 물질특허 만료는 유럽 2022년 1월, 미국 2020년 6월로 예정돼 있다.

현재까지 루센티스 바이오시밀러로 미국, 유럽 등에서 판매허가 승인을 받은 제품은 없으며 독일 포마이콘(Formycon)이 3상을 완료해 미국 FDA에 허가신청서(BLA)를 제출했으나 최근 자료보완 지시를 받았다.

삼성바이오에피스 관계자는 "삼성의 첫 안과질환 치료제가 환자들에게 훌륭한 치료 혜택을 제공할 수 있을 것으로 기대된다. 앞으로도 다양한 바이오시밀러 제품 개발을 통해 고품질 바이오의약품을 통한 치료 기회를 전세계적으로 더욱 확대할 수 있도록 노력하겠다”고 전했다.

한편 삼성바이오에피스가 개발 중인 안과질환 치료제는 SB11 외에도 SB15(아일리아 바이오시밀러, 성분명 애플리버셉트)가 있으며, 현재 두 제품은 지난해 11월 미국 바이오젠(Biogen)과의 후속 파트너십 계약을 통해 미국, 유럽 등 주요 글로벌 시장에서의 마케팅 인프라를 조기 구축했다.

Forecasting: Principles and Practice

정답지를 사용하여 예측 정확도를 평가하는 것은 중요합니다. 결과적으로, 잔차(residual)의 크기는 참 예측 오차(forecast error)가 얼마나 클 지에 대해 믿을만한 지표가 아닙니다. 예측치의 정확도는 모델이 모델을 맞출 때 사용하지 않은 새로운 데이터를 얼마나 잘 맞추는 지 여부로만 결정할 수 있습니다.

모델을 선택할 때, 흔히 사용할 수 있는 데이터를 학습 데이터(training data)테스트 데이터(test data) 이렇게 두 부분으로 나눕니다. 여기에서 학습 데이터는 예측 기법의 어떠한 매개변수를 추정하는데 사용하고, 테스트 데이터는 정확도를 평가할 때 사용합니다. 테스트 데이터를 예측치를 결정할 때 사용하지 않기 때문에, 모델이 새로운 데이터에 대한 예측을 얼마나 잘 하는지 평가하는 믿을만한 지표를 제공합니다.

테스트 데이터(test data)의 크기는 표본이 얼마나 긴지와 얼마나 멀리 예측할 지에 따라 달라지긴 하지만 보통은 전체 표본의 약 20% 정도입니다. 테스트 데이터(test data)는 적어도 이상적으로는 필요한 최대 예측수평선(forecast horizon)만큼 커야합니다. 다음과 같은 사항을 주의해야합니다.

  • 학습 데이터를 잘 맞추는 모델이 반드시 예측을 잘 하지는 않을 수도 있습니다.
  • 충분한 매개변수를 고려하는 모델을 이용하여 완벽하게 맞추는 모델을 항상 얻을 수 있습니다.
  • 모델을 데이터에 과도하게 맞춘 것은 데이터에서 조직적인 패턴을 찾아내지 못한 것만큼 나쁩니다.

이러한 데이터가 맞추는 작업에서 “빠지기” 때문에 테스트 데이터를 몇몇 참고 문헌에서는 “빠지는 데이터 모음(hold-out set)”으로 부릅니다. 다른 참조 문헌에서는 학습 데이터를 “표본 내 데이터(in-sample data)”로 테스트 데이터를 “표본 외 데이터(out-of-sample 평균트루범위 지표 data)”라고 부릅니다. 이 책에서는 “학습 데이터(training data)”와 “테스트 데이터(test data)”로 부르겠습니다.

시계열 일부분을 다루기 위한 함수들

2 장에서 소개한 window() 함수는 데이터를 학습 데이터(training data)와 테스트 데이터(test data)로 나누는 것 같이 시계열의 일부분을 추출할 때 유용합니다. window() 함수에서 필요한 시간값에 해당하는 시작이나 끝, 또는 둘 중에 하나, 아니면 둘 다 정할 수 있습니다. 예를 들면,

위의 명령으로 1995년 이후의 모든 데이터를 추출할 수 있습니다.

여러 가지 다양한 방법으로 일부분을 추출할 수 있도록 해주는 subset() 함수도 유용합니다. 이 함수의 가장 큰 장점은 데이터의 일부를 추출할 때 인덱스를 사용할 수 있도록 만들어주는 것입니다. 예를 들면,

위와 같이 ausbeer 에서 마지막 5년의 관측값을 얻을 수 있습니다. 특정한 계절의 모든 값을 추출할 수도 있습니다. 예를 들면,

이렇게 하면, 모든 1분기 값을 얻을 수 있습니다.

마지막으로, head() 와 tail() 도 처음 몇 개 또는 마지막 몇 개의 관측값을 추출할 때 도움이 됩니다. 예를 들어, ausbeer 의 마지막 5년은 다음과 같이 얻을 수 있습니다.

예측 오차

예측 “오차”는 관측값과 관측값의 예측치의 차이입니다. 여기에서 “오차”는 실수(mistake)를 의미하는 것이 아니라 관측값에서 예측할 수 없는 부분을 의미합니다. 예측 오차(forecast error)를 다음과 같이 적을 수 있습니다.

\[ e_ = y_ - \hat_, \] 여기에서 학습(training) 데이터는 \(\\) 로 주어지고 테스트(test) 데이터는 \(\,y_,\dots\>\) 로 주어집니다.

예측 오차는 두 가지 면에서 잔차와 다릅니다. 첫째, 잔차는 학습(training) 데이터에 대해 계산하지만, 예측 오차(forecast error)는 테스트(test) 데이터에 대해 계산합니다. 둘째, 잔차는 한-단계(one-step) 예측값에 기초하지만, 예측 오차는 여러-단계(multi-step) 예측값을 포함할 수 있습니다.

여러가지 방법으로 예측 오차를 요약하여 예측 정확도를 측정할 수 있습니다.

눈금에 의존하는 오차

예측 오차(forecast error)는 데이터와 같은 눈금 위에 있습니다. 따라서 \(e_\) 만 고려하는 정확도 측정값은 눈금(scale)에 의존하고 다른 단위(unit)를 포함하는 시계열을 비교하는데 사용할 수 없습니다.

절대 오차(absolute error) 또는 제곱 오차(squared error)를 고려하는 가장 흔하게 사용하는 두 가지 눈금 의존 측정값(scale-dependent measure)은 다음과 같습니다: \[\begin \text & = \text(|e_|),\\ \text & = \sqrt<\text(e_^2)>. \end\] 한 가지 시계열을 가지고 또는 같은 단위의 몇 가지 시계열 예측 기법을 비교할 때, MAE가 이해하기 쉬우면서 계산하기 쉬워서 인기가 있습니다. MAE를 최소화하는 예측 기법은 예측값의 중앙값(median)을 내는데, RMSE를 최소화하는 예측 기법은 예측치의 평균을 냅니다. 결과적으로, 더 해석하기 어렵긴 하지만 RMSE도 널리 사용됩니다.

백분율 오차

백분율 오차(percentage error)는 \(p_ = 100 e_/y_\) 이렇게 주어집니다. 백분율 오차(percentage error)는 단위와 관련 없다(unit-free)는 장점이 있어서 데이터 모음 사이의 예측 성능을 비교할 때 자주 사용됩니다. 가장 흔하게 사용되는 측정값은 다음과 같습니다. \[ \text = \text(|p_|). \] 백분율 오차(percentage rror)에 기초하는 측정값은 관심 있는 기간 안에서 어떤 \(t\) 에 대해 \(y_=0\) 이면 무한대가 되거나 정의되지 않는 단점과, \(y_\) 가 0에 가까울 수록 극한값을 갖는 단점이 있습니다. 흔히 간과하는 백분율 오차의 또 다른 문제는 측정 단위가 의미있는 0을 갖는다고 가정한다는 것입니다. 2 예를 들어, 온도에는 임의의 0점이 있기 때문에 화씨나 섭씨 눈금에 대해 온도의 정확도를 측정할 때 백분율 오차를 사용하는 것이 말이 안 됩니다.

양수 오차보다 음수 오차 경우에 더 큰 가중치를 준다는 단점도 있습니다. M3 예측 대회에서 사용됐고 Armstrong (1978, p. 348) 에서 제안한 “대칭적” MAPE(sMAPE)를 사용할 때 이러한 단점이 부각됩니다. sMAPE의 정의는 다음과 같습니다. \[ \text = \text\left(200|y_ - \hat_|/(y_+\hat_)\right). \] 하지만, \(y_\) 이 0에 가까우면, \(\hat_\) 도 0에 가깝기 쉽습니다. 따라서, 이 측정값은 계산을 불안정하게 만드는 부분인 0에 가까운 값으로 나누는 부분을 여전히 포함하고 있습니다. sMAPE의 값은 0이 될 수도 있어서, 이건 “절대 백분율 오차(absolute percentage error)” 측정값이 절대로 아닙니다.

Hyndman & Koehler (2006) 는 sMAPE를 사용하지 말 것을 추천합니다. 이 책에서는 이 양을 사용하지 않을 것이지만 단지 널리 사용되기 때문에 여기에서 소개하였습니다.

눈금 조정된 오차

Hyndman & Koehler (2006) 에서 단위가 다른 시계열에 대해 예측 정확도를 비교할 때 사용할 백분율 오차(percentage error)의 대안으로 눈금 조정된 오차(scaled error)를 소개하였습니다. 어떤 단순한 예측 기법의 학습(training) MAE에 기초하여 오차의 눈금(scale)을 조정하는 방법을 제안했습니다.

비-계절성 시계열에 대해, 단순 예측값(naïve forecast)을 사용하여 눈금 조정된 오차(scaled error)를 정의하는 방법은 다음과 같습니다: \[ q_ = \frac<\displaystyle e_> \sum_^T |y_-y_|>. \] 분모와 분자 둘 다 원본 데이터의 눈금에 대한 값을 포함하고 있기 때문에, \(q_\) 는 데이터의 눈금과 독립적입니다. 눈금이 조정된 오차(scaled error)는 학습 데이터에 대해 단순 예측값(naïve forecast)의 평균보다 좋은 예측치를 낼 때 1보다 작습니다. 반대로, 학습 데이터에 대한 예측치가 단순 예측값(naïve forecast)의 평균보다 나쁘면 1보다 큽니다.

계절성 시계열에 대해, 눈금 조정된 오차(scaled error)는 계절성 단순 예측치(seasonal naïve forecast)를 이용하여 다음과 같이 정의할 수 있습니다. \[ q_ = \frac<\displaystyle e_> \sum_^T |y_-y_|>. \]

눈금 조정된 평균 절대 오차(mean absolute scaled error)는 단순히 다음과 같습니다. \[ \text = \text(|q_|). \]

2007년 말까지 호주 분기별 맥주 생산량 데이터를 이용한 예측값.

Figure 3.9: 2007년 말까지 호주 분기별 맥주 생산량 데이터를 이용한 예측값.

그림 3.9은 3가지 예측 기법을 2007년말까지의 호주 분기별 맥주 생산량에 적용한 것입니다. 2008–2010 기간에 대한 실제 값도 있습니다. 이 기간에 대한 예측 정확도 값을 계산해봅시다.

RMSE MAE MAPE MASE
평균 기법 38.45 34.83 8.28 2.44
단순 기법 62.69 57.40 14.18 4.01
계절성 단순 기법 14.31 13.40 3.17 0.94

그래프에서 보면 계절성 단순 기법(seasonal naïve method)이 이러한 데이터에 대해 가장 좋은 것을 알 수 있습니다. 더 좋게 만들 수 있긴 하지만, 나중에 살펴보겠습니다. 때때로, 다른 정확도 값은 어떤 예측 기법이 가장 좋은 것인지에 대한 결과가 서로 다릅니다. 하지만, 이 경우에는, 모든 결과가 이 데이터 모음에서 계절성 단순 기법이 이러한 3개의 기법 중에서 가장 좋다고 알려줍니다.

비-계절성 예제를 다루기 위해, 평균트루범위 지표 구글 주가 데이터를 고려해봅시다. 다음의 그래프는 마지막 값이 2013년 12월 6일인 200개의 관측값과 3개의 다른 기법에서 다음 40일 예측치를 얻은 것을 나타냅니다.

2013년 12월 7일부터의 구글 주가 예측값.

Figure 3.10: 2013년 12월 7일부터의 구글 주가 예측값.

RMSE MAE MAPE MASE
평균 기법 114.21 113.27 20.32 30.28
단순 기법 28.43 24.59 4.36 6.57
표류 기법 14.08 11.67 2.07 3.12

여기에서 가장 좋은 기법은 (어떤 정확도 측정값을 사용하는지에 상관없이) 표류 기법(drift method)입니다.

시계열 교차 검증

시계열 교차 검증(cross-validation)은 데이터를 더 세련되게 학습/테스트하는 방법입니다. 이 과정에서, 각각이 한 가지 관측으로 구성된 테스트(test) 데이터가 있습니다. 대응되는 학습(training) 데이터는 테스트(test) 데이터을 구성하는 관측에 앞서(prior) 일어난 관측만으로 구성됩니다. 그래서 예측치를 구성할 때 미래 측정치를 전혀 사용하지 않습니다. 작은 학습 데이터에서 신뢰할만한 예측을 얻을 수 없기 때문에, 초반부의 관측값을 테스트 데이터로 고려하지 않습니다.

다음의 도표는 학습 데이터와 테스트 데이터를 연속하여 나타낸 것입니다. 여기에서 파란 관측값은 학습 데이터, 빨간 관측값은 테스트 데이터입니다.

예측 정확도(forecast accuracy)는 테스트(test) 데이터에 대한 평균으로 계산합니다. 예측하는 원점(origin)을 시간에 따라 평균트루범위 지표 앞으로 굴리기 때문에 때때로 이 과정을 “예측 원점 굴리기에 대한 평가(evaluation on a rolling forecasting origin)”라고도 합니다.

시계열 예측에서, 한 단계 예측치는 여러 단계 예측치와 그렇게 관련이 있지 않을 수도 있습니다. 이런 경우에는, 예측 원점 굴리기(rolling forecasting origin)에 기초한 교차 검증(cross-validation) 과정을 여러 단계 오차(multi-step forecast)를 사용할 수 있도록 변형할 수 있습니다. 4단계 앞 예측치를 잘 내는 모델에 관심이 있다고 합시다. 그러면 대응되는 그래프는 아래와 같습니다.

시계열 교차 검증(cross-validation)은 tsCV() 함수로 구현합니다. 다음의 예제에서, 잔차 RMSE와 시계열 교차 검증(cross-validation)을 통해 얻은 RMSE를 비교합니다.

예측한 것처럼, 대응되는 “예측값(forecast)”이 참 예측치가 되는 것 대신에, 전체 데이터 모음을 맞추는 모델이 될 수록 잔차에서 얻은 RMSE가 더 작습니다.

가장 뛰어난 예측 모델을 선택하는 좋은 방법은 시계열 교차 검증(cross-validation)으로 RMSE를 계산하여 가장 작은 모델을 찾는 것입니다.

파이프 연산자

위의 지저분한 R 코드 덕분에 R 함수들을 함께 묶는 방법을 소개할 기회가 생겼습니다. 위의 코드에서 함수 안에 함수 안에 함수를 넣어서, 코드를 읽으려면 안팎으로 왔다갔다해야 해서 무엇이 계산되고 있는지 이해하기 어렵습니다. 대신에, 다음과 같이 파이프 연산자(pipe operator) %>% 를 사용할 수 있습니다.

각 파이프의 좌변은 우변에 있는 함수의 첫 번째 입력값으로 넘겨집니다. 이러한 방식은 영어에서 왼쪽에서 오른쪽으로 읽는 방식과 일치합니다. 파이프를 사용할 때는, 가독성을 위해 모든 다른 입력값에 이름을 붙여야 합니다. 파이프를 사용할 때, 왼쪽 화살표 대신에 오른쪽 화살표 할당 -> 을 쓰는 것이 자연스럽습니다. 예를 들어, 위의 예제의 3번째 줄을 다음과 평균트루범위 지표 같이 읽을 수 있습니다. “ goog200 시계열을 골라서, drift=TRUE 와 함께 rwf() 에 넘겨, 결과 잔차를 계산하고, res 로 저장하십시오.”

코드를 읽기 쉽게 만들 수 있는 상황이라면 언제든지 파이프 연산자(pipe operator)를 사용할 것입니다. 내용의 일관성을 위해 입력값이 없는 경우에도 다른 객체들과 구별하기 위해 함수 이름 옆에 괄호를 항상 사용할 것입니다. 위의 코드에서 sqrt() 와 residuals() 를 사용한 방식을 참조하시길 바랍니다.

3.4.1 예제: tsCV() 사용하기

그림 3.5에 나타낸 goog200 데이터에는 NASDAQ에 상장된 Google Inc 주식의 2013년 2월 25일부터 시작하는 200 거래일 동안의 매일 마지막 가격 정보가 있습니다.

아래의 코드는 MSE를 예측 오차로 사용하고 tsCV() 로 1단계부터 8단계 naive (단순; naïve) 예측값의 예측 성능을 계산합니다. 그래프는 자연스럽게 예측할 수 있는 것과 같이, 예측 오차(forecast error)가 예측 범위(forecast horizon)에 따라 증가하는 것을 나타냅니다.

참고 문헌

Armstrong, J. S. (1978). Long-range forecasting: From crystal ball to computer. John Wiley & Sons. [Amazon]

Hyndman, R. J., & Koehler, A. B. (2006). Another look at measures of forecast accuracy. International Journal of Forecasting, 22(4), 679–688. [DOI]

즉, 백분율은 비율눈금(ratio scale)에서 유효하지만, 간격눈금(interval scale)에서는 유효하지 않습니다. 비율 눈금 변수만 의미있는 0값을 갖습니다. (역자 주: 비율 눈금에서는 0보다 작은 값이 정의상 존재할 수 없습니다.)↩︎

외환의 범위 거래란 무엇입니까?

범위 거래

전통적인 거래 지혜에 따르면 외환 시장은 시간의 70-80% 범위입니다. 이 수치를 염두에 두고 레인지 트레이딩이 무엇인지, 그러한 상황에서 FX 시장을 거래하는 방법을 배워야 합니다.

이 기사에서는 다양한 시장을 찾는 방법과 범위를 정확히 찾는 데 도움이 되는 기술 분석 도구를 보여줍니다.

그런 다음 현상을 이용하기 위해 배치할 수 있는 범위 거래 전략에 대해 논의할 것입니다.

거래 범위는 무엇입니까?

거래 범위는 금융 증권이 장기간에 걸쳐 고점과 저점 사이에서 거래될 때 발생합니다. 거래 범위의 상단은 가격 저항을 나타내고 하단은 평균트루범위 지표 가격 지원을 나타냅니다.

가격은 장기간, 때로는 몇 주 또는 몇 달 동안 고점과 저가 사이에서 변동할 수 있습니다. 일부 범위는 매우 좁을 수 있지만 다른 범위는 비교적 넓을 수 있습니다.

거래 범위는 일반적으로 추세 기간이 끝난 후에 발생합니다. 외환 통화 쌍과 같은 유가 증권의 가격은 통합 기간에 들어갑니다.

투자자와 거래자가 유가 증권의 가격이 다음에 어디로 갈지 예측하려고 할 때 이 통합 시간을 시각화할 수 있습니다. 결과적으로, 범위 기간은 시장에서 많은 시간이 소요되기 때문에 방금 종료된 추세에 비해 변동성이 적고 거래량이 적을 수 있습니다.

인내는 장사꾼의 미덕이다

범위 기간은 때때로 투자자들이 결정을 내리기 위해 가만히 앉아 있는 것처럼 느껴질 수 있으며, 시장에서 벗어나는 것이 적극적인 거래자로서의 위치라는 것을 기억할 가치가 있습니다.

FX 시장이 시간의 70-80% 범위에 있다는 이전의 주장을 받아들인다면 논리에 따르면 이 기간에 하기보다는 지켜볼 것입니다.

많은 거래자들이 일정 기간 동안 잡음을 교환하고 시간을 들여 시행한 많은 규칙을 포기할 수 있다고 말하는 것이 공평합니다. 트레이더는 인내심을 갖고 자신의 손에 앉아 모든 옵션을 신중하게 평가하고 시장에 진입하기 전에 거래 조건이 충족되는지 확인해야 합니다.

유사하게, 당신은 시장에서 라이브 레인지 트레이드 포지션을 가지고 있고 당신이 그 움직임이 소진되었다고 확신할 때까지 그것을 유지하기로 결정할 수 있으며, 이것은 많은 스윙 트레이더와 포지션 트레이더가 성공적으로 사용하는 방법입니다.

트레이더의 독특한 스타일이 트렌드를 찾는 방법을 지적하는 것이 중요합니다. 세션 추세, 일 추세 또는 장기 위치 추세가 있을 수 있습니다. 예를 들어, 스윙 트레이더는 특정 범위를 노이즈로 간주할 수 있지만 스캘퍼는 이를 기회로 볼 수 있습니다.

범위 제한 거래는 무엇을 의미합니까?

범위 제한 거래는 가격 채널에서 거래되는 외환 쌍을 식별하고 활용하려는 전략입니다. 범위 경계 거래는 지지선과 저항선을 식별하기 위해 고점과 저점을 추세선과 연결하는 것을 포함합니다.

상당한 지지 및 저항 수준과 추세선을 식별한 후 트레이더는 낮은 추세선 지지 수준(채널 하단)에서 매수하고 상단 추세선 저항 수준(채널 상단)에서 매도할 수 있습니다.

증권이 장기간 일관되게 높은 가격과 낮은 가격 사이에서 거래될 때 거래 범위가 생성됩니다. 유가 증권 거래 범위의 상단은 저항을 제공하고 하단은 일반적으로 가격 지원을 제공합니다.

트레이더는 가격이 가격 채널에서 벗어날 때까지 지지 추세선에서 매수하고 저항 추세선에서 매도를 반복하여 범위 경계 시장을 이용하려고 합니다.

역사적으로 가격은 이러한 수준을 돌파하기보다 이 수준에서 반등할 가능성이 더 큽니다. 위험 대 보상 비율은 유리하고 매력적일 수 있지만, 탈주나 고장에 대해 경계하는 것이 중요합니다.

트레이더는 일반적으로 상단 및 하단 추세선 위에 손절매 주문을 설정하여 돌파 또는 고장으로 인한 손실 위험을 줄임으로써 주가가 지지 추세선에서 하락한 경우 트레이더를 보호합니다.

많은 거래자들은 또한 성공 확률을 높이기 위해 가격 채널과 함께 기술적 분석의 형태를 사용합니다.

RSI(상대 강도 지수)는 가격 채널 내 추세 강도의 중요한 지표입니다. 그리고 추가로 논의된 ATR도 도움이 됩니다.

외환의 평균 일일 범위는 무엇입니까?

평균 일일 범위를 계산하는 것은 많은 거래 스타일에 중요하며 하나의 기술 지표는 이 작업을 돕는 데 탁월합니다.

"Average True Range" 또는 "ATR"은 J. Welles Wilder가 가격 변동 변동성을 측정하기 위해 개발한 기술 지표입니다. 원래 변동성이 더 흔한 상품 시장을 거래하기 위해 고안된 외환 거래자들은 이제 이를 널리 사용합니다.

거래자는 ATR을 사용하여 현재 가격이 현재 범위에서 벗어날 준비가 되었는지 파악합니다. 오실레이터로 분류되는 ATR은 단일 라인이기 때문에 차트에서 모니터링하기 쉽습니다. 5와 같이 낮은 수치는 낮은 변동성을 나타내고 30과 같은 높은 수치는 높은 변동성을 나타냅니다.

디자이너가 제안한 표준 설정은 14일, 즉 14일이었습니다. 따라서 일일 차트 이상은 신뢰할 수 있는 피드백을 제공하기에 가장 좋은 시간대일 수 있지만 많은 거래자들은 낮은 시간대에서도 매우 잘 작동한다고 증언할 것입니다.

촛대 몸체는 변동성 기간 동안 확대되고 낮은 변동성 기간 동안 짧아지는 경향이 있습니다. 낮은 변동성이 지속되면 거래자는 통합이 발생했다고 추론할 수 있으며 브레이크 아웃 가능성이 높아집니다.

범위 경계 거래 전략

이 섹션에서는 거래 범위에 대한 두 가지 인기 있는 방법인 지지 및 저항 거래와 브레이크아웃 및 고장을 살펴보겠습니다.

1: 범위 내에서 지지 및 저항 거래

  • 거래자는 FX 쌍이 가격 채널을 형성하기 시작하는 것을 관찰할 수 있습니다.
  • 초기 최고점을 만든 후 트레이더는 추세선을 기반으로 장단기 거래를 시작할 수 있습니다.
  • 가격이 상단 추세선 저항이나 하단 추세선 지지선에서 벗어나면 범위 제한 거래가 종료됩니다.
  • 유가 증권이 잘 정의된 거래 범위에 있는 경우 거래자는 가격이 지원 수준에 도달하면 매수하고 저항에 도달하면 매도할 수 있습니다.

상대 강도 지수(RSI), 평균 실제 범위(ATR) 스토캐스틱 오실레이터 및 상품 채널 지수(CCI)와 같은 기술 지표는 거래 범위 내에서 가격이 변동함에 따라 과매수 및 과매도 조건을 나타내기 위해 결합될 수 있습니다.

가격이 지지선에서 거래되고 있을 때 매수 포지션에 진입할 수 있고 RSI가 30 미만의 과매도 판독값을 제공합니다. 또는 RSI 평균트루범위 지표 평균트루범위 지표 판독값이 70을 초과하는 과매수 영역에 도달하면 매도를 결정할 수 있습니다.

2: 브레이크아웃 및 분류 범위 거래

  • 거래자는 브레이크아웃의 방향이나 거래 범위에서 브레이크아웃을 입력할 수 있습니다.
  • 움직임이 유효한지 확인하기 위해 거래자는 변동성 및 오실레이터와 같은 지표를 사용할 수 있습니다. 그들은 또한 가격 행동을 관찰할 수 있었습니다.
  • 첫 번째 돌파 또는 붕괴에서 확인 가능한 거래량 증가가 있어야 하며 여러 양초가 거래 범위 밖에서 마감되어야 합니다.
  • 거래자는 거래를 시작하기 전에 되돌림을 기다립니다. 거래 범위의 상단 바로 위에 배치된 지정가 주문이 이제 지원 수준으로 작동합니다.
  • 거래 범위의 반대편에 손절매 주문을 하면 실패한 브레이크아웃을 방지할 수 있습니다.

거래 범위 돌파

거래 범위는 가격이 오르거나 내리면 결국 끝납니다. 이런 일이 발생하면 거래자는 선택권이 있습니다. 그들은 거래 가능한 다른 범위의 시장을 검색하여 방법과 전략에 일치시키거나 가격이 범위를 벗어날 때 추세를 거래할 수 있습니다.

거래자들은 종종 잘못된 움직임에 휘말리는 것을 피하기 위해 주문을 하기 전에 추세의 후퇴를 기다립니다.

매수 또는 매도 지정가 주문은 브레이크아웃 움직임의 대부분을 포착하기 위해 주문을 하는 경우 효과적일 수 있습니다.

브레이크 아웃을 거래하려는 경우 다양한 기술 지표가 움직임이 계속되는지 여부를 식별하는 데 도움이 될 수 있습니다.

높거나 낮은 거래량의 급격한 증가는 가격 움직임과 모멘텀의 변화가 계속될 것임을 암시할 수 있습니다.

브레이크 아웃이 거짓일 수 있으므로 주의를 기울이면 좋을 것입니다. 종종 여러 캔들을 분석하여 돌파 확인을 찾고 선택한 기술 지표가 결정을 확인하는지 확인하는 것이 가장 좋습니다.

[개념] classification model 성능평가지표

사진 출처 - https://sumniya.tistory.com/26

  • TP(True Positive) : 정답 True, 예측 값 True (정답)
  • FP(False Positive) : 정답 False, 예측 값 True (오답)
  • FN(False Negative) : 정답 True, 예측값 False (오답)
  • TN(True Negative) : 정답 False, 예측값 False (정답)

1. Precision(정밀도)

모델이 True라고 분류한 것 중에서 실제 True인 것의 비율

정답률(Positive Predictive Value, PPV)라고도 불린다.

만약 FP = 0이면 결과가 무조건 1이 됨으로 꼭 1이라고 좋은 것은 아니다.

다시말해 Precision이 0이라는 것은 False인 것을 False로는 잘 예측 했지만, True인 것을 True로 잘 인식했다고 할 수는 없는 것이다.

2. Recall(재현율)

실제 True인 것 중에서 모델이 True라고 예측한 비율

통계학에서 sensitivity, 다른 분야에서는 hit rate라는 용어로도 사용한다.

이는 Precision과 다르게 결과가 1이나온 다는 것은 True인 것은 모두 True로 잘 예측 했지만 False은 것을 False로 잘 예측 했다고는 할 수 없다.

※ Precision은 모델의 입장, Recall은 실제 정답의 입장에서 본 관점

=> 요약하자면 Precison은 1에 가까울 수록 False를 잘 예측한 것이고 Recall은 True를 잘 예측 한 것이다.

3. Accuracy(정확도)

가장 직관적으로 모델의 성능을 나타낼 수 있는 평가 지표

이는 data의 bias(편중)이 발생할 경우 평가의 신뢰도가 낮아진다.

다시 말해 잘 못 예측한 것이 모든 데이터의 극 소수라면 모델이 잘 만들어졌다고 보기 힘든 것이다.

4. F1 score

Precision과 Recall의 조화평균

F1 score는 데이터 label이 불균형 구조일 때, 모델의 성능을 정화하게 평가할 수 있으며, 성능을 하나의 숫자로 표현 가능하다. F1-score는 데이터 레이블이 불균형 구조일 떄, 모델의 성능을 정확하게 평가할 수 있다.[출처: ' 텍스트 분류 기반 기계학습의 정신과 진단 예측 적용'논문 인용]

5. ROC curve

모든 분류 임계값에서 분류 모델의 성능을 보여주는 그래프, 이 곡선은 참 양성 비율(TPR)과 허위 양성 비율(FPR)을 표시

이미지 출처 : https://developers.google.com/machine-learning/crash-course/classification/roc-and-auc?hl=ko

ROC 곡선의 점을 계싼하기 위해 분류 임계값이 다른 로지스틱 회귀 모형을 여러 번 평가할 수 있지만 이 방법은 효율적이지 않아 AUC라는 알고리즘이 나옴

6. AUROC(=AUC)

  • ROC curver 그래프 아래의 면적값으로 최대값은 1이며 좋은 모델일 수록 1에 가깝다.
  • AUC 값의 범위는 0~1
  • AUC는 척도 불변이여서 절대값이 아니라 예측이 얼마나 잘 평가되는지 측정한다.
  • AUC는 분류 임계값 불변이여서 어떤 분류 평균트루범위 지표 임계값이 선택되었는지와 상관 없이 모델의 예측 품질을 측정
  • 하지만 척도 불면이 항상 이상적인 것은 아니다. 예를 들어 잘 보정된 확률 결과가 필요한 경우 AUC는 이 정보를 알 수 없음
  • 분류 임계값 불변의 경우 FN과 FP 비용에 큰 차이가 있는 경우 한 가지 유형의 분류 오류를 최소화하는 것은 위험할 수 있다.
  • sklearn.metrics.auc ( x , y )를 이용하여 계산 가능하다 - 참고링크

sklearn.metrics.auc — scikit-learn 0.24.1 documentation

※분류 임계값이란 것은 로지스틱 회귀 값을 이진 카테고리에 매핑하려고 회귀 값 x부터는 1로 나머지는 0으로 본다의 개념으로 생각하면 될 것 같다. - 참고료링크


0 개 댓글

답장을 남겨주세요