자몽이 조아

11주차 엘리스 강의 정리 - Pandas 심화 알아보기 본문

엘리스 활동

11주차 엘리스 강의 정리 - Pandas 심화 알아보기

Grapefruitgreentealoe 2021. 9. 3. 05:01
반응형

마스킹연산

df[column].str.contains(문자열) : column의 시리즈의 str 데이터에서 문자열을 포함하면 True

df[column] == 문자열 해도 같은 결과가 나온다.

df.Column.str.match(문자열) : 컬럼의 시리즈에서 str데이터에서 문자열을 포함하면 True

match부분에서 정규표현식을 쓰게 되면 더 자세히 검색 가능.

 

apply 를 통해서 함수로 데이터 다룰 수 있음.

df["Num"].apply(square) : 오른쪽 시리즈데이터.

df["Squre"] = df.Num.apply(lambda x: x **2)

 

딕셔너리로 key value 가져와서 replace를 하는 함수를 apply로 적용시켜서 값을 변환.

apply안에 딕셔너리를 넣어서 key를 value로 변환할 수 있다.

inplace=True : df["Sex"]=~~~로 시리즈로 다시 넣어주지 않아도 그대로 바뀜.

 

 

 

데이터를 어떻게 채우느냐에 대한것이 aggfunc,

np.mean 즉 각 인덱스에 대해서의 연산 후의 값.

반응형
Comments