본문 바로가기

Programming/Machine Learning

데이터프레임 생성

# 컬럼 이름, 값을 직접 입력하여 DataFrame 생성
데이터프레임 = pd.DataFrame({'컬럼1':[값1, 값2], '컬럼2':[값1, 값2]})

# 랜덤 함수를 활용하여 DataFrame 생성
데이터프레임 = pd.DataFrame(np.random.rand(행길이,열길이))

# 컬럼 이름 설정하기
데이터프레임 = pd.DataFrame(np.random.rand(행길이, 열길이), columns=['컬럼1', '컬럼2'])

# csv파일 불러오기
# 인덱스 설정은 파일을 읽어올 때만 가능
데이터프레임 = pd.read_csv("파일이름.csv", index_col="인덱스로사용되는컬럼", encoding="euc-kr")

# 데이터프레임이 생성된 상태에서 인덱스 설정하기
데이터프레임 = pd.DataFrame(시리즈)
데이터프레임.set_index('컬럼이름', inplace=True)

 

'Programming > Machine Learning' 카테고리의 다른 글

수치형 데이터, 범주형 데이터 변환  (0) 2020.02.11
데이터프레임 컬럼이름 변경하기  (0) 2020.02.11
특정 value 처리하기  (0) 2020.02.11
결측치 처리하기  (0) 2020.02.10
데이터 분석 순서  (0) 2020.02.10