본문 바로가기

Programming/Machine Learning

(36)
Flask 기본사용법 0. 모델 install !pip install flask !pip install werkzeug 1. Flask 모듈 임포트 from flask import Flask 2. Flask객체를 app에 할당 app = Flask(__name__) 3. app객체를 이용해 라우팅 경로를 설정 4. 해당 라우팅 경로로 요청이 올 때 실행할 함수를 바로 밑에 작성해야 함 @app.route("/hello") def hello(): return "Hello World!" 5. 메인 모듈로 실행될 때 플라스크 서버 구동 (서버로 구동한 IP 와 포트를 옵션으로 넣어줄 수 있음) if __name__ == "__main__": from werkzeug.serving import run_simple run_simple..
데이터 값의 치환 replace 결측치는 bp.nan으로 작성 replace(기존내용, 신규내용) 함수는 Series에서 사용 데이터프레임에서의 replace 사용 df.replace({'컬럼이름': ' 기존내용'}, {'칼럼이름': '신규내용'})
정밀도, 재현율, F1score from sklearn.metrics import classification_report X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0) tree = DecisionTreeClassifier() result = cross_val_score(tree, X_train, y_train, cv = 5) print("모델성능 : {:.2f}".format(result.mean())) tree.fit(X_train, y_train) labels = y_test guesses = tree.predict(X_test) print(classification_report(labels, guesses))
네이버 영화리뷰 감성분석 구글 konlypy 검색해서 다운받기 > 시작하기 > 사용하기 > 설치하기 > 윈도우 > cmd 들어가서 java 쳐보고 내용 나오는가 확인 > JPype1 (>=0.5.7)을 다운로드 클릭 > JPype1‑0.7.1‑cp37‑cp37m‑win_amd64.whl 설치 > 주피터노트북으로 test, train 데이터 가져오기 구글 네이버 영화 리뷰 데이터셋 검색 > github 다운받기 > 주피터노트북으로 폴더 넣기 import pandas as pd pd.set_option('display.max_colwidth',-1) df_train = pd.read_csv('data/ratings_train.txt', delimiter='\t') df_train.head(30) df_train.info() df_t..
Sentiment Analysis(영화리뷰데이터) https://ai.stanford.edu/~amaas/data/sentiment/ Large Movie Review Dataset v1.0 다운로드 목표 - 영화리뷰데이터를 활용해 긍정,부정 감성분석을 해보자. - 텍스트데이터를 다루는 방법을 이해하자. from sklearn.datasets import load_files import numpy as np data_url = 'data/aclImdb/train/' reviews_train = load_files(data_url,shuffle=True) data_url = 'data/aclImdb/test/' reviews_test = load_files(data_url,shuffle=True) reviews_train.keys() text_train,..
Titanic데이터활용_DecisionTree_Ensemble Machine Learning 과정 - 문제정의 - 데이터 수집 - 데이터 전처리 (인코딩,특성공학) - 탐색적 데이터 분석 (시각화, 특성선택) - 모델 선택 및 학습 - 하이퍼파라미터 튜닝 (교차검증,그리드서치) - 모델 평가 import pandas as pd import numpy as np 데이터 사전 - PassengerId : 탑승객 id - Survived : 생존여부 (0 = 사망, 1 = 생존) - Pclass : 티켓 클래스 (1등급, 2등급, 3등급) - Name : 이름 - Sex : 성별 (male = 남성, female = 여성) - Age : 나이 - SibSp : 형제/배우자의 수 - Parch : 부모/자녀 수 - Ticket : 티켓 번호 - Fare : 요금 - Cab..
손글씨 분류 실습 목표 - 손글씨 숫자(0~9)를 분류하는 모델을 만들어보자. - 선형 분류모델의 불확실성을 확인 - 이미지 데이터의 형태를 이해 import numpy as np import pandas as pd import matplotlib.pyplot as plt digit_data = pd.read_csv('data/digit_train.csv') digit_data.head() digit_data.shape EDA img0 = digit_data.iloc[0, 1:] print(img0.max()) print(img0.min()) plt.hist(img0, bins = 255) plt.show() plt.imshow(img0.values.reshape(28, 28)) # plt.imshow(img0.value..
보스턴주택 값 예측 import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.datasets import load_boston # 보스턴 주택값 데이터셋 boston = load_boston() boston.keys() print(boston.data) print(boston.target) print(boston.feature_names) print(boston.DESCR) - CRIM: 범죄 발생율 - INDUS: 비상업지역 면적 비율 - NOX: 일산화질소 농도 - RM: 주택당 방 수 - LSTAT: 인구 중 하위 계층 비율 -B: 인구 중 흑인 비율 - PTRATIO: 학생/교사 비율 - ZN: 25,000 평방피트를 초과 ..