본문 바로가기

주식 데이터 전처리2

5. 주식 데이터 분석 - 가장 좋은 스케일링은? (주가 예측 프로젝트) 학부 연구생으로서 진행한 주가 예측 프로그램의 일련의 과정을 차례로 포스팅합니다. 위 그림처럼 어떤 종목이든 10일간의 데이터로 다음날 종가 상승 여부를 예측하는 머신러닝 프로젝트입니다. 주식 데이터는 여기저기 예제들도 굉장히 많이 있고, 비교적 얻기 쉬운 빅데이터이기 때문에 여러가지 프로젝트를 하시는 분들은 굉장히 많을 거라고 생각합니다. 하지만 어려운 도메인인만큼 유의미한 모델링을 한 사례는 굉장히 적습니다. 특히 주식을 잘 모르시는 분들에게는 정말 어려운 데이터죠... 제가 얻은 인사이트를 기록합니다. 주식 데이터 수집 - EDA - 전처리 - 모델링 - 성능 개선 이전 포스팅은 학습이 잘 되도록 EDA를 통해 주식 데이터의 질을 높이는 전처리 과정을 다루었습니다. 스케일링 방식에 따라서 얻는 결과.. 2022. 3. 13.
4. 주식 데이터 분석 - 전처리, EDA (주가 예측 프로젝트) 학부 연구생으로서 진행한 주가 예측 프로그램의 일련의 과정을 차례로 포스팅합니다. 위 그림처럼 어떤 종목이든 10일간의 데이터로 다음날 종가 상승 여부를 예측하는 머신러닝 프로젝트입니다. 주식 데이터는 여기저기 예제들도 굉장히 많이 있고, 비교적 얻기 쉬운 빅데이터이기 때문에 여러가지 프로젝트를 하시는 분들은 굉장히 많을 거라고 생각합니다. 하지만 어려운 도메인인만큼 유의미한 모델링을 한 사례는 굉장히 적습니다. 특히 주식을 잘 모르시는 분들에게는 정말 어려운 데이터죠... 제가 얻은 인사이트를 기록합니다. 데이터 수집 - EDA - 전처리 - 모델링 - 성능 개선 저번 포스팅은 데이터 정보가 너무 적은 단점을 커버하기 위해 수십개의 보조 지표를 추가하는 방법을 다뤘습니다. 이번 포스팅은 EDA를 통해 .. 2022. 3. 12.