반응형
마스킹연산
df[column].str.contains(문자열) : column의 시리즈의 str 데이터에서 문자열을 포함하면 True
df[column] == 문자열 해도 같은 결과가 나온다.
df.Column.str.match(문자열) : 컬럼의 시리즈에서 str데이터에서 문자열을 포함하면 True
match부분에서 정규표현식을 쓰게 되면 더 자세히 검색 가능.
apply 를 통해서 함수로 데이터 다룰 수 있음.
df["Num"].apply(square) : 오른쪽 시리즈데이터.
df["Squre"] = df.Num.apply(lambda x: x **2)
딕셔너리로 key value 가져와서 replace를 하는 함수를 apply로 적용시켜서 값을 변환.
apply안에 딕셔너리를 넣어서 key를 value로 변환할 수 있다.
inplace=True : df["Sex"]=~~~로 시리즈로 다시 넣어주지 않아도 그대로 바뀜.
데이터를 어떻게 채우느냐에 대한것이 aggfunc,
np.mean 즉 각 인덱스에 대해서의 연산 후의 값.
반응형
'엘리스 활동' 카테고리의 다른 글
팀프로젝트 전 능력 키우기(사이드 프로젝트 하기) (0) | 2021.09.25 |
---|---|
엘리스 AI 개발트랙 - 스터디, 취업 로드맵, 프로젝트를 진행하며 (0) | 2021.09.10 |
11주차 엘리스 강의 정리 - Pandas 기본 (0) | 2021.09.02 |
11주차 강의 정리- NumPy (0) | 2021.09.02 |
11주차 실시간강의 정리(1) (0) | 2021.09.01 |