엘리스 활동
11주차 엘리스 강의 정리 - Pandas 심화 알아보기
Grapefruitgreentealoe
2021. 9. 3. 05:01
반응형
마스킹연산
df[column].str.contains(문자열) : column의 시리즈의 str 데이터에서 문자열을 포함하면 True
df[column] == 문자열 해도 같은 결과가 나온다.
df.Column.str.match(문자열) : 컬럼의 시리즈에서 str데이터에서 문자열을 포함하면 True
match부분에서 정규표현식을 쓰게 되면 더 자세히 검색 가능.
apply 를 통해서 함수로 데이터 다룰 수 있음.
df["Num"].apply(square) : 오른쪽 시리즈데이터.
df["Squre"] = df.Num.apply(lambda x: x **2)
딕셔너리로 key value 가져와서 replace를 하는 함수를 apply로 적용시켜서 값을 변환.
apply안에 딕셔너리를 넣어서 key를 value로 변환할 수 있다.
inplace=True : df["Sex"]=~~~로 시리즈로 다시 넣어주지 않아도 그대로 바뀜.
데이터를 어떻게 채우느냐에 대한것이 aggfunc,
np.mean 즉 각 인덱스에 대해서의 연산 후의 값.
반응형