본문 바로가기

Programming

(212)
데이터베이스 4강 # Non-equi Join : 많이 안씀 비교 연산자 사용 등급 구간나눔 속성이 같은 것 없음 # 예제 : 사원 번호 및 사원이 근무하는 부서 번호, 부서 이름을 출력하시오. SELECT e.employee_id, e.department_id, d.department_name FROM employees e, departments d WHERE e.department_id = d.department_id; # department_id 값이 null인 부서를 배치 받지 못한 사원이 있어 106rows (107x) # Outer Join(포괄 조인) SELECT e.employee_id, e.department_id, d.department_name FROM employees e, departments d ..
데이터베이스 3강 # NOT은 앞에 붙여 씀 외워야하는 예외 : WHERE commission_pct IS NOT NULL # 칸 맞춰쓰기 : column 속성명 format a16 # ORDER BY : ASC은 생략 가능한 기본 값 NULL 값 - 오름차순 : 마지막 표시 내림차순 : 처음 표시 ORDER BY 절 : 마지막 실행 alias 사용 가능 WHERE절 : alias 사용 불가 # SELECT절의 2번째를 기준으로 오름차순 SELECT last_name, 12 * salary annsal FROM employees ORDER BY 2; # ORDER BY는 각 속성 별 오름차순, 내림차순을 다르게 할 수 있음 SELECT last_name, department_id, salary FROM employees ..
데이터베이스 2강 # 오라클 실행 Oracle database 11g Express Edition 폴더 Run SQL Command Line 실행 # SQl문은 세미콜론(;)으로 문장이 종결됨 - 문장 종결자 # 커넥팅하기 conn system / 12345 # hr로 접속 conn hr/hr # 가장 상위 관리자로 커넥팅하기 conn / as sysdba # 접속 유저 변경 alter user system identified by 12345; # 계정 잠겨있는 hr 유저를 풀어줌 alter user hr account unlock; # hr 유저를 비밀번호 hr로 바꿈 alter user hr identified by hr; # 3권 55페이지 # 테이블명 외워오기 # DEPARTMENT TABLE DEPARTMENT_..
데이터베이스 1강 # 데이터, 정보 차이 데이터(정보처리 함), 정보(정보처리 안함) # 데이터베이스(물리적 존재 X, 논리적 존재 O - 메모리) # 데이터 무결성 - 데이터가 정확 데이터베이스 : 항상 무결성보장, 데이터를 저장 # 일괄처리 시스템 : 실시간 처리 X 온라인 실시간처리시스템 : 시스템 오버헤딩 분산처리 시스템 # 현업에서는 하이브리드 시스템을 쓴다. : 상황에 따라 시스템의 방법을 바꿔 쓴다. # 파일시스템 : 땡처리 창고 데이터베이스 : 마트처럼 분류 체계를 갖춘 창고 # 국내 시장은 오라클을 쓰고 있다. 관계형 데이터베이스가 1970년대 개발되었는데 무결성 유지하기 좋아서 지금까지 사용된다. # 데이터를 설명하는 데이터 : 메타데이터 = 스키마 # 데이터베이스는 SQL로 프로그래밍하는데 어떤 언어든..
Kaggle Excel로 Titanic 실습하기 1. Kaggle 구글 아이디 로그인 2. titanic 검색 > Titanic: Machine Learning from Disaster 3. Data > Download All 4. csv파일을 폴더로 넣는다. 5. 구글 스프레드시트에서 파일 불러오기 # 목적 : train.csv로 survived가 1이 나오는 조건식을 만든다. test.csv에 적용하여 survived 값을 출력한다. # 방법 : train.csv 상단 메뉴 데이터 클릭 피봇테이블 행 추가 Sex > 값 추가 Survived 2번 1개는 요약기준 SUM(Survived 관계있는 Sex조건 총합), 다른 1개는 요약기준 COUNT(Survived 관계없는 Sex조건 총합) 우측에 수식 입력 > = B2/C2하고 > %설정 # 조건식 ..
영화평점 분석하기 # 영화 평점 데이터 분석하기 import numpy as np data = np.loadtxt('data/ratings.dat', delimiter = '::', dtype = np.int64) data # array([[ 1, 1193, 5, 978300760], # [ 1, 661, 3, 978302109], # [ 1, 914, 3, 978301968], # ..., # [ 6040, 562, 5, 956704746], # [ 6040, 1096, 4, 956715648], # [ 6040, 1097, 4, 956715569]], dtype=int64) # 행(평점 작성개수)이 1000209개 열(데이터의 종류)이 4개 # 1000209 * 4 = 4000836 print(data.shape) p..
Pandas # pandas : 엑셀과 비슷 # 자동화 할 수 있는 장점 # 다른 언어와의 접목 # 내부적으로는 numpy로 구성되어 있음 # numpy : index를 숫자로만 함 # pandas : index를 글자로 할 수 있음 # Series(1차원) : 인덱스, 값 # 넘파이의 배열과 유사 # Data Frame(2차원) : 인덱스, 밸류, 컬럼 # Dictionary : Key, Value로 구성 # pandas모듈 불러오기 # import pandas as pd # Series 생성 population = pd.Series([9904312,3449737,2890451,2466502]) population # 0 9904312 # 1 3449737 # 2 2890451 # 3 2466502 # dtype:..
Numpy # None : 파이썬의 Null # 아나콘다 설치 : Python, Numpy, Pandas, Matplolib 모두 포함 # 인공지능 # 머신러닝(학습하는 AI) # 딥러닝(사람의 뇌 구조를 모방) # 모듈 - 함수들의 모음 # Numpy - 기본 베이스 모듈, Pandas, Matplolib 내부에서도 쓰이는 모듈 # 고성능 과학계산을 위한 데이터 분석 라이브러리 # Pandas - 모듈 # 행과 열로 구성된 표 형식의 데이터를 지원하는 라이브러리(엑셀모양) # Matplolib - 모듈 # 2D 그래프로 시각화가 가능한 라이브러리 # Numpy 주요기능 # 1. 빠르고 효율적인 벡터 산술연산을 제공하는 다차원배열 제공 (ndarray 클래스) # ndArray (; N dimensional Arr..