제작 도전

네이버 금융 크롤링 (주식 인기검색종목)

영성 2021. 5. 12. 14:12
import sys # 시스템
import os  # 시스템

import pandas as pd  # 판다스 : 데이터분석 라이브러리
import numpy as np   # 넘파이 : 숫자, 행렬 데이터 라이브러리
import requests

from selenium import webdriver   # 웹 브라우저 자동화
import time    # 서버와 통신할 때 중간중간 시간 지연. 보통은 1초
#크롬 웹브라우저 실행
driver = webdriver.Chrome("./chromedriver")
url = "https://finance.naver.com/sise/lastsearch2.nhn"
driver.get(url)
time.sleep(2)
# url주소에 해당 html소스에 있는 테이블들을 list안에 있는 dataframe형태로 table 변수에 할당
html = requests.get('https://finance.naver.com/sise/lastsearch2.nhn') 
table = pd.read_html(html.text)
table[1]

# '전일비' 컬럼제거
stock = table[1].dropna().reset_index(drop = True)
stock = stock.drop(['전일비'], axis=1)
stock

# 엑셀저장
stock.to_excel('인기검색주식순위.xlsx')