본문 바로가기
IT이야기/파이썬을 이용한 주식 투자

파이썬을 활용한 주식 재무제표 크롤링 하기 (FnGuide)

by 행복찾아3만리 2022. 1. 6.
반응형

이번 글에서는 파이썬 라이브러리 중 BeautifulSoup를 활용하여 FnGuide에서 제공하는 주식 재무제표를 크롤링해보도록 하겠습니다.

 

1. 필요 라이브러리

!pip install lxml
!pip install BeautifulSoup

 

2. FnGuide에서 제공하는 삼성전자 재무제표 크롤링

from urllib.request import urlopen
from bs4 import BeautifulSoup
from html_table_parser import parser_functions as parser
import pandas as pd

ticker = 'A005930'#삼성전자
URL = "http://comp.fnguide.com/SVO2/ASP/SVD_Finance.asp?pGB=1&gicode={}".format(ticker)

req = urlopen(URL)
html = req.read()

soup = BeautifulSoup(html, 'lxml')

#원하는 table 값이 있는 class 넣기
soup_table = soup.find("table", attrs={'class':'us_table_ty1 h_fix zigbg_no'})

table = parser.make2d(soup_table)
df = pd.DataFrame(table[1:], columns=table[0])
df

코드 설명

  • URL 변수에 FnGuide 삼성전자 재무제표 URL을 넣는다.
  • urlopen 함수를 사용하여 해당 URL을 연다.
  • read() 함수를 사용하여 해당 사이트 html을 읽는다.
  • BeautifulSoup().find() 함수를 사용하여 재무제표를 table로 뽑는다.
 

여기까지 파이썬을 활용한 주식 재무제표 크롤링 하기였습니다. 간단하지만 여기서 더 응용하신다면 더 많은 데이터를 수집하실 수 있으실 것입니다. 감사합니다.

반응형

댓글