본문 바로가기

Programming/Etc.

Kaggle Excel로 Titanic 실습하기

data.zip
7.04MB

1. Kaggle 구글 아이디 로그인

 

2. titanic 검색 > Titanic: Machine Learning from Disaster

 

3. Data > Download All

 

4. csv파일을 폴더로 넣는다.

 

5. 구글 스프레드시트에서 파일 불러오기

 

# 목적 :
  train.csv로 survived가 1이 나오는 조건식을 만든다.
  test.csv에 적용하여 survived 값을 출력한다.

 

# 방법 :
  train.csv 상단 메뉴 데이터 클릭
  피봇테이블
  행 추가 Sex > 값 추가 Survived 2번
  1개는 요약기준 SUM(Survived 관계있는 Sex조건 총합), 다른 1개는 요약기준 COUNT(Survived 관계없는 Sex조건 총합)
  우측에 수식 입력 > = B2/C2하고 > %설정

 

# 조건식 쓰는법
  =IF(조건식, 참 값, 거짓 값)
  =IF(A1 > 90, 'A', 'F')
  =IF(A1 > 90, IF(A2 >= 80 , 'B', 'F')
  =IF(E2 = 'female', 1, 0)

 

test.csv의 Survived 속성 칸 만들어주기 (왼쪽에 1열 삽입)
  조건식 입력 =IF(E2 = 'female', IF(C2 < 3, 1, 0))

 

# PassengerId와 Survived 열을 복사하여 문자 값으로 새 문서 붙여넣기
  csv로 다운로드

 

# Titanic: Machine Learning from Disaster로 들어가서 Submit Predictions
  csv파일 올려 score확인(1이 만점)