음악 TOP50수집

import requests
from bs4 import BeautifulSoup as bs

url = 'https://music.naver.com/listen/top100.nhn?domain=TOTAL'
res = req.get(url)
soup = bs(res.text,'lxml')

#select(CSS선택자) : 여러 요소를 검색한 후 리스트로 반환
#                    --> find_all()과 같음
#select_one(CSS선택자) : 하나의 요소만 반환
#                    --> find()와 같음
rank_list = soup.find_all('td',class_='ranking')
name_list = soup.select('a._title > span')
artist_list = soup.select('td.artist > a')

len(rank_list), len(name_list), len(artist_list)




# 리스트를 생성해줌.
ranks = []
names = []
artists = []

for index in range(len(rank_list)):
    rank = rank_list[index].text
    name = name_list[index].text
    artist = artist_list[index].text.strip()
    
    ranks.append(rank) 
    names.append(name)
    artists.append(artist)

music_info = {'rank':ranks,'name':names,'artist':artists}

import pandas as pd
music = pd.DataFrame(music_info)
music.set_index('rank',inplace=True)
music

저작자표시 (새창열림)

'Programming > Web Crawling' 카테고리의 다른 글

iframe부분 크롤링 실습 (0)	2020.03.02
진행사항을 알려주는 tqdm (0)	2020.03.02
한달동안의 영화 평점 수집 (0)	2020.03.02
영화랭킹 페이지에서 제목, 평점 수집하기 (0)	2020.03.02
인코딩 방식 3 가지 (0)	2020.02.28

지식과 경험을 공유 해보자.

음악 TOP50수집

'Programming > Web Crawling' 카테고리의 다른 글

티스토리툴바

음악 TOP50수집

'Programming > Web Crawling' 카테고리의 다른 글

'Programming/Web Crawling' Related Articles

티스토리툴바