본문 바로가기

python

(4)
postgresql, django 데이터베이스 연동
입력값이 몇 개가 될지 모를 때(*args) 여러 개의 입력값을 받는 함수 def add_many(*args): result = 0 for i in args: result = result + i return result 입력 값이 몇 개이든 상관이 없음 *args처럼 * 뒤로 아무 이름이나 붙여 쓰면 입력값을 전부 모아서 튜플로 만들어줌 응용하기 def add_mul(choice, *args): if choice == "add": result = 0 for i in args: result = result + i elif choice == "mul": result = 1 for i in args: result = result * i return result print(add_mul('add', 1, 2, 3, 4, 5)) print(add_mul('..
진행사항을 알려주는 tqdm from tqdm import tqdm_notebook movie_date = [] movie_title = [] movie_rate = [] for day in tqdm_notebook(days): url = "https://movie.naver.com/movie/sdb/rank/rmovie.nhn?sel=cur&date="+day res = req.get(url) soup = bs(res.content, 'lxml') title = soup.select('div.tit5 > a') rate = soup.find_all('td',class_='point') for index in range(len(title)): movie_date.append(day) movie_title.append(title[in..
데이터 분석 순서 1. 문제 정의 (Problem identification) - Business 목적 정의 (수익 고려) - 현재 솔루션의 구성 파악 - 지도(분류, 회귀), 비지도, 강화 선택 2. 데이터수집 (Collecting data sets) - Database - File(CSV, XML, JSON) - Web crwaling - IoT sensor data - Survey - 파이썬 패키지 : BeautifulSoup , Selenium, PyMySQL , PyMongo etc. 3. 데이터 전처리 (Preprocessing) - 결측치 처리 : 데이터 삭제, 다른 값으로 대체(최대값, 최소값, 중앙값, 예측모델 활용한 값) - 이상치 처리 : 입력오류(데이터 삭제, 다른 값으로 대체), 자연발생(featu..