위치 잘라오기
# Integer type으로 잘라오기
데이터프레임.iloc[행시작순서번호:행끝순서번호, 열시작순서번호:열끝순서번호]
# 인덱스 칸을 비우면 끝 인덱스를 의미함
# 문자 type으로 잘라오기
데이터프레임.loc['행시작인덱스이름':'행끝인덱스이름', '열시작컬럼이름':'열끝컬럼이름']
DataFrame[컬럼명]으로 활용
데이터프레임[컬럼] = [값1, 값2, 값3, 값4]
지정된 인덱스 삭제
# 지정한 행 인덱스 번호로 삭제
데이터프레임.drop([행인덱스번호], inplace=True)
# 지정한 열 컬럼이름으로 삭제
데이터프레임.drop([컬럼이름], axis=1)
중복되지 않는 값 확인
# 컬럼을 시리즈로 불러오기
시리즈 = 데이터프레임.컬럼이름
시리즈.unique()
지정 값('A', 'B', 'C', 'D' - 변경가능)이 있는 행만 가져오기
데이터프레임[데이터프레임.컬럼이름.isin(['A', 'B', 'C', 'D'])]
지정 값('A', 'B', 'C', 'D' - 변경가능)이 없는 행만 가져오기
데이터프레임[~데이터프레임.컬럼이름.isin(['A', 'B', 'C', 'D'])]
숫자, 문자열, 카테고리 값의 개수 가져오기
시리즈.value_counts()
# 데이터프레임은 안됨
값이 Null인지 확인하기
시리즈.isnull()
# 데이터프레임가능
값이 Null이 아닌지 확인하기
시리즈.notnull()
조건식을 충족하는 값의 행 제거
# 예시
데이터프레임 = 데이터프레임.drop(데이터프레임[(데이터프레임.컬럼 < 값1) & (데이터프레임.컬럼 > 값2)].index)
# 아래 방법이 더 빠름
데이터프레임 = 데이터프레임[(데이터프레임.컬럼 < 값1) & (데이터프레임.컬럼 > 값2)]
'Programming > Machine Learning' 카테고리의 다른 글
수치형 데이터, 범주형 데이터 변환 (0) | 2020.02.11 |
---|---|
데이터프레임 컬럼이름 변경하기 (0) | 2020.02.11 |
데이터프레임 생성 (0) | 2020.02.10 |
결측치 처리하기 (0) | 2020.02.10 |
데이터 분석 순서 (0) | 2020.02.10 |