주식 관련 예측을 위한 변수는 잘 알지는 못해도 상당히 많이 존재하는 것 같습니다.
각각의 변수는 특징을 추출하기 위한 여러가지 경험과 방법을 제시하는 것 같습니다. 증권사 API 를 연계하여 해당 지표에 해당하는 값과 그에 따른 판단을 할 수 있도록 조건식 등의 항목으로 많이 제공하는 것 같습니다.
개인 PC 에 포함될 수 있는 내용은 그런 모든 변수를 담기에는 자원이 그렇게 허락하지는 않는것 같습니다. 일단 앞서 글에서 언급한 데이터를 수집하는 것은 일 데이터의 시가, 고가, 저가, 종가 와 그 에 해당하는 조정 주가를 수집하는 것으로 부터 시작 하려고 합니다.
Crawling 이라는 메뉴는 4개의 Tab 으로 구성되어 있습니다.
1. Day Crawling 에서는 Crawling Data 조회 , 최근 일자 기준으로 최종 데이터 수집 이후의
데이터를 수집, 지나간 기간에 필요한 하루데이터 단위로 기간을 설정하여 수집하는 기능입
니다. 특히 Auto Crawling 에서는 하루단위 시,고,저,종 가 및 거래량, 해당 일자의 per, pbr,
코스닥, 코스피의 변동을 수집합니다.
Period Crawling 은 특정일자 - 예를 들어 20100101 ~ 20111231 년도 사이의 데이터를
수집하고자 할 때 사용합니다. 처음 데이터가 구성되면 조정된 주가는 종목별로 NHN 에서
수집할 수 있으나, 하루 단위의 real 데이터는 KRX site 에서 가져오기 때문에 그것을 구분
하여 데이터를 수집하고 있습니다. 당연히 해당 데이터는 변경될 수 있으며, 조금 정교
하게 프로그램을 구성한다면, 여러 원천에서 데이터를 가져오고, 그 데이터에서 필수 적인
부분과 비 필수적인 부분을 나누면 더 좋으나, 현재는 실험용 데이터라 그런 구분 까지는
진행하지 않았습니다.
2. Day Stocks 에서는 특정 일자의 로딩된 데이터를 확인합니다.
이미지가 약간 작아 식별하기 어려울지 모르겠습니다. 20일 기울기 등을 sorting 하면
데이터가 없는 종목을 식별할 수 있습니다. 이제 막 상장되어서 없는 것인지, 아니면,
계산이 안되어 없는 것인지 등을 확인 할 수 있습니다. 더구나, 수치가 연속적으로
나오지 않고 크게 튀거나 하면 데이터 계산이 다시 필요할 수도 있습니다. 그것을
식별하기 위해서 사용하는 tab 입니다. 이상하다고 생각하는 항목을 Grid 에서 클릭
하면 다음의 Calculation Tab 으로 이동 합니다.
3. Calculation Tab 에서는 특정 종목의 일자별 데이터를 확인합니다.
앞서의 항목에서 DL이앤씨2우.. 항목을 클릭하여 나타난 화면입니다.
데이터가 2022. 04. 28 일부터 시작되기 때문에 20일 평균등의 데이터가 계산되지 못한
것을 확인할 수 있습니다. 혹시 문제가 있다면 Calculation Button 을 클릭하면 현재
일자에서 과거 데이터를 조정주가 기준으로 찾아와 재 계산을 시도 합니다.
4. Company 는 기본적인 회사 정보를 가져오기 위한 화면입니다.
사실 이 화면에서 DART 를 연동하면 해당 회사의 공시 정보 및 재무 등 상세 정보를
가져 올 수도 있으나, 일단 이곳에서는 간단한 회사 정보만을 출력하고 있습니다.
대한 정보 등을 가져올 필요가 있습니다. 그외 앞서 언급한 회사에 대한 정보 업데이트 및
공시정보등을 가져오는 로직을 구성할 수 있습니다. 필요한 부분은 많이 있지만, 가장
기본적인 정보 로딩 검증을 기준으로 구성해 보았습니다.
댓글 없음:
댓글 쓰기