본문 바로가기

Programming

(212)
회원가입2 Join2.html Join Page ID PW NAME EMAIL TEL GENDER MAN WOMAN HOBBY SPORT STUDY EATING BIRTHDAY COLOR COUNTRY choice Korea USA Japan China TALK
회원 가입 Join.html Step1 : 아이디/비번 입력 아이디 : 비밀번호 : 비밀번호 확인 : Step2 : 개인정보 성별 : 남여 혈액형 : A형 B형 O형 AB형 생일 : Step3 : 선호도 취미 : 축구야구농구 좋아하는 색깔 : Step4 : 적고 싶은 말
네이버 영화리뷰 감성분석 구글 konlypy 검색해서 다운받기 > 시작하기 > 사용하기 > 설치하기 > 윈도우 > cmd 들어가서 java 쳐보고 내용 나오는가 확인 > JPype1 (>=0.5.7)을 다운로드 클릭 > JPype1‑0.7.1‑cp37‑cp37m‑win_amd64.whl 설치 > 주피터노트북으로 test, train 데이터 가져오기 구글 네이버 영화 리뷰 데이터셋 검색 > github 다운받기 > 주피터노트북으로 폴더 넣기 import pandas as pd pd.set_option('display.max_colwidth',-1) df_train = pd.read_csv('data/ratings_train.txt', delimiter='\t') df_train.head(30) df_train.info() df_t..
Sentiment Analysis(영화리뷰데이터) https://ai.stanford.edu/~amaas/data/sentiment/ Large Movie Review Dataset v1.0 다운로드 목표 - 영화리뷰데이터를 활용해 긍정,부정 감성분석을 해보자. - 텍스트데이터를 다루는 방법을 이해하자. from sklearn.datasets import load_files import numpy as np data_url = 'data/aclImdb/train/' reviews_train = load_files(data_url,shuffle=True) data_url = 'data/aclImdb/test/' reviews_test = load_files(data_url,shuffle=True) reviews_train.keys() text_train,..
Titanic데이터활용_DecisionTree_Ensemble Machine Learning 과정 - 문제정의 - 데이터 수집 - 데이터 전처리 (인코딩,특성공학) - 탐색적 데이터 분석 (시각화, 특성선택) - 모델 선택 및 학습 - 하이퍼파라미터 튜닝 (교차검증,그리드서치) - 모델 평가 import pandas as pd import numpy as np 데이터 사전 - PassengerId : 탑승객 id - Survived : 생존여부 (0 = 사망, 1 = 생존) - Pclass : 티켓 클래스 (1등급, 2등급, 3등급) - Name : 이름 - Sex : 성별 (male = 남성, female = 여성) - Age : 나이 - SibSp : 형제/배우자의 수 - Parch : 부모/자녀 수 - Ticket : 티켓 번호 - Fare : 요금 - Cab..
손글씨 분류 실습 목표 - 손글씨 숫자(0~9)를 분류하는 모델을 만들어보자. - 선형 분류모델의 불확실성을 확인 - 이미지 데이터의 형태를 이해 import numpy as np import pandas as pd import matplotlib.pyplot as plt digit_data = pd.read_csv('data/digit_train.csv') digit_data.head() digit_data.shape EDA img0 = digit_data.iloc[0, 1:] print(img0.max()) print(img0.min()) plt.hist(img0, bins = 255) plt.show() plt.imshow(img0.values.reshape(28, 28)) # plt.imshow(img0.value..
보스턴주택 값 예측 import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.datasets import load_boston # 보스턴 주택값 데이터셋 boston = load_boston() boston.keys() print(boston.data) print(boston.target) print(boston.feature_names) print(boston.DESCR) - CRIM: 범죄 발생율 - INDUS: 비상업지역 면적 비율 - NOX: 일산화질소 농도 - RM: 주택당 방 수 - LSTAT: 인구 중 하위 계층 비율 -B: 인구 중 흑인 비율 - PTRATIO: 학생/교사 비율 - ZN: 25,000 평방피트를 초과 ..
Linear Model - Regression import numpy as np import pandas as pd import matplotlib.pyplot as plt data = pd.DataFrame([[2,20],[4,40],[8,80],[9,90]], index=['학생1','학생2','학생3','학생4'], columns=['시간','성적']) data 1. 수학 공식을 이용한 해석적 모델 - LinearRegression from sklearn.linear_model import LinearRegression linear_model = LinearRegression() linear_model.fit(data[['시간']] , data['성적']) # 문제는 2차원으로 넣어줘야한다. # y = 10 * x + 0 print(linear..