1 of 23

주식 데이터로 머신러닝

발표자 : 김범녕

2 of 23

수식의 공포(?)에 머신러닝으로 무언가를 만들어보길 미루신 분들과 경험을 공유하고 싶었습니다.

3 of 23

시작 계기

4 of 23

머신러닝이 굉장히 주목을 받고있으니까

5 of 23

Hello, World! 정도의 무언가를 만들어 보고싶다!

6 of 23

공식홈페이지 튜토리얼까진 무난했습니다.

7 of 23

고군분투 사항

  • 개인적으로 모으거나 사용할 수 있는데이터는 어떤게 있지?
    • 한방에 학습, 테스트 데이터가 준비되는 마술(?)
      • tensorflow.keras.datasets.mnist.load_data()
      • tensorflow.keras.datasets.fashion_mnist.load_data()
  • pandas, numpy, matplotlib, 외계 라이브러리 등장

8 of 23

작업 흐름

  1. 데이터 수집
  2. 데이터 가공
  3. 학습
  4. 학습 결과를 활용

9 of 23

데이터 수집 - 1

  • 크롤링
  • 오픈 데이터셋
    • kaggle 의 데이터셋
    • ImageNet
    • pandas datareader
      • pandas_datareader.get_data_yahoo() 을 통한 주식 데이터 수집

10 of 23

데이터 수집 - 2

11 of 23

데이터 가공 - 1

  • 데이터 가공
    • open : 시작가
    • high : 고가
    • low : 저가
    • close : 종가
    • volume : 거레량
    • Adj Close : 주식의 분할, 배당, 배분 등을 고려해 조정한 종가

12 of 23

데이터 가공 - 2

  • 데이터 가공 후 데이터
    • 최고가 등락률 : (최고가 - 시작가) / 시작가
    • 최저가 등락률 : (최저가 - 시작가) / 시작가
    • 최종 등락률 : (종가 - 시작가) / 시작가
    • 거래대금 : sigmoid(거래량 * (최고가 + 최저가) / 2)
    • 다음날 등락률 : 100 * (내일 종가 - 오늘 종가) / 오늘 종가

13 of 23

데이터 가공 - 3

14 of 23

15 of 23

학습

파일 읽기

16 of 23

학습

학습, 테스트

데이터를 나눔

17 of 23

학습

네트워크 구성

18 of 23

학습

학습 시작

19 of 23

학습 목적과 출력 층의 활성함수 조합

목적

활성 함수

예시

수치 예측

(활성 함수 불필요)

주택 가격 예측

2진 분류

sigmoid

OK, NG 구분

여러개 중 하나로 분류

softmax

표정 감정 분석

20 of 23

학습 결과

  • (mae) 절대 평균 오차 = 2.26
  • (mse제곱 평균 오차 = 12.6 ( 제곱근은 3.x )
  • mae < mse 라는 것은 오차 편차가 크다는 것
  • (망했어요)

21 of 23

하면서 느낀 것

  • ml 을 공부한다 하면 어려운 수식이 많이 등장하지만�결과가 어떻게 되었든 “학습시키고 결과를 보는 것” 은 생각보다 쉬웠습니다.�(잘 만드는게 어렵죠)
  • 그래프만 보고 주식투자하는 사람들이 있는것으로 봐선�기간 데이터를 입력하고 봐보는것도 좋아보입니다.
  • 수익을 위해서라면 어떤 펀드가 좋은지 찾는게 더 좋을 것 같습니다 😂

22 of 23

QnA 입니다만

23 of 23

QnA

어떤 데이터로 해보셨고 어떤 느낌이셨는지 궁금합니다.

(경험을 공유 받고 싶습니다!)

질문도 환영입니다!