본문 바로가기

Programming/Web Crawling

iframe부분 크롤링 실습

# 웹 개발자도구에서 해당 iframe을 찾아 src주소를 입력해서 찾아들어가야함.

import requests as req
from bs4 import BeautifulSoup as bs
import pandas as pd

url = 'https://movie.naver.com'
url_sub = '/movie/bi/mi/pointWriteFormList.nhn?code=181381&type=after&isActualPointWriteExecute=false&isMileageSubscriptionAlready=false&isMileageSubscriptionReject=false'

url_final = url + url_sub

res = req.get(url_final)
soup = bs(res.content, 'lxml')

for reple in reples:
    print(reple.text.strip())
    
# 관람객 아이콘 때문에 띄어쓰기가 되므로 삭제함.
icon = soup.select('span.ico_viewer')

for i in icon:
    i.extract()

for reple in reples:
    print(reple.text.strip())

'Programming > Web Crawling' 카테고리의 다른 글

도시락 크롤링  (0) 2020.03.02
Selenium 모듈  (0) 2020.03.02
진행사항을 알려주는 tqdm  (0) 2020.03.02
한달동안의 영화 평점 수집  (0) 2020.03.02
영화랭킹 페이지에서 제목, 평점 수집하기  (0) 2020.03.02