본문 바로가기

분류 전체보기

(216)
영화평점 분석하기 # 영화 평점 데이터 분석하기 import numpy as np data = np.loadtxt('data/ratings.dat', delimiter = '::', dtype = np.int64) data # array([[ 1, 1193, 5, 978300760], # [ 1, 661, 3, 978302109], # [ 1, 914, 3, 978301968], # ..., # [ 6040, 562, 5, 956704746], # [ 6040, 1096, 4, 956715648], # [ 6040, 1097, 4, 956715569]], dtype=int64) # 행(평점 작성개수)이 1000209개 열(데이터의 종류)이 4개 # 1000209 * 4 = 4000836 print(data.shape) p..
Pandas # pandas : 엑셀과 비슷 # 자동화 할 수 있는 장점 # 다른 언어와의 접목 # 내부적으로는 numpy로 구성되어 있음 # numpy : index를 숫자로만 함 # pandas : index를 글자로 할 수 있음 # Series(1차원) : 인덱스, 값 # 넘파이의 배열과 유사 # Data Frame(2차원) : 인덱스, 밸류, 컬럼 # Dictionary : Key, Value로 구성 # pandas모듈 불러오기 # import pandas as pd # Series 생성 population = pd.Series([9904312,3449737,2890451,2466502]) population # 0 9904312 # 1 3449737 # 2 2890451 # 3 2466502 # dtype:..
Numpy # None : 파이썬의 Null # 아나콘다 설치 : Python, Numpy, Pandas, Matplolib 모두 포함 # 인공지능 # 머신러닝(학습하는 AI) # 딥러닝(사람의 뇌 구조를 모방) # 모듈 - 함수들의 모음 # Numpy - 기본 베이스 모듈, Pandas, Matplolib 내부에서도 쓰이는 모듈 # 고성능 과학계산을 위한 데이터 분석 라이브러리 # Pandas - 모듈 # 행과 열로 구성된 표 형식의 데이터를 지원하는 라이브러리(엑셀모양) # Matplolib - 모듈 # 2D 그래프로 시각화가 가능한 라이브러리 # Numpy 주요기능 # 1. 빠르고 효율적인 벡터 산술연산을 제공하는 다차원배열 제공 (ndarray 클래스) # ndArray (; N dimensional Arr..
JupyterNotebook 설치 설치 구글 검색 : Anaconda Anaconda Python 3.7 version 다운로드 프로그램 실행 Anaconda Navigator 실행 Jupitor Notebook 실행 New : Other -> Folder Untitled Folder :체크 rename : 파이썬 파이썬 클릭 New : Notebook -> Python3 추가 기능 Untitiled 클릭 : 제목 바꾸기 저장된 폴더위치 내PC \ 로컬디스크C \ 사용자 \ 사용자명 \ 폴더 단축키 빠른 실행 - Ctrl Enter 파란 커맨드모드 아래 생성 - B 위 생성 - A 녹색 커맨드모드 다음 줄 - Alt Enter 되돌리기 - Ctrl Z 다시하기 - Ctrl Y
함수 # 2배출력 함수 def a(x) : print(x * 2) a(10) # 20 # 두 수의 합 출력 함수 def b(num1, num2) : print(num1 + num2) b(10, 20) # 30 # return하지 않고 출력만 하면 None ; Null 반환 result = b(10,20) print('result : {}'.format(result), 'value : ', result) # 3 # result : None value : None def c(num1, num2) : return num1 + num2 result = c(10, 20) print(result) # 30 # 기본값 설정 def d(num1, num2 = 3) : return num1 + num2 result = d(1..
반복문 # 감량 축하반복 weight1 = int(input('현재 몸무게 : ')) weight2 = int(input('목표 몸무게 : ')) date = 1 while weight1 >= weight2 : diet = int(input('{}주차 감량 몸무게 : '.format(date))) date += 1 weight1 -= diet print('{}kg 달성!! 축하합니다.'.format(weight1)) # 리스트 반복 for x in [1, 2, 3, 4, 5] : print(x) # 1 # 2 # 3 # 4 # 5 # 튜플 반복 for x in (1, 2, 3, 4, 5) : print(x) # 1 # 2 # 3 # 4 # 5 # 문자열 반복 for x in 'hello' : print(x) #..
리스트 # 리스트 선언 a= [1, 2, 3, ['a', 'b', 'c']] arrayTemp = a[3][1] arrayTemp # 'b' a[1:4] # [2, 3, ['a', 'b', 'c']] a = [1, 2, 3, ['a', 'b', 'c'], 4, 5] arrayTemp = a[2:5] arrayTemp # [3, ['a', 'b', 'c'], 4] a = [1, 2, 3, ['a', 'b', 'c'], 4, 5] arrayTemp2 = a[3][0:2] arrayTemp2 # ['a', 'b'] a[1] = ['a', 'b', 'c'] a # [1, ['a', 'b', 'c'], 3, ['a', 'b', 'c'], 4, 5] # 리스트 요소삭제 del a[3] # [1, ['a', 'b', 'c'..
조건문 # 나이 입력하고 성인 판단 age = int(input('나이를 입력하세요. : ')) # 나이를 입력하세요. : 84 if age > 20 : print('성인입니다.') # 성인입니다. # 3과 5의 배수 num = int(input('숫자를 입력하세요 : ')) # 숫자를 입력하세요 : 1500 if (num % 3 == 0) and (num % 5 == 0) : print('3과 5의 배수입니다.') else : print('숫자를 다시 입력해 주십시오.') # 3과 5의 배수입니다. # 점수 입력하고 합불 판단 grade = int(input('점수를 입력하십시오. : ')) if grade >= 60 : print('합격입니다.') else : print('불합격입니다.') # 짝홀 숫자판단..