국비지원교육/교육일지

5주차 교육일지: Pandas feature engineering

민서타 2023. 8. 21. 16:37

apply(func, axis = 0): 시리즈와, 판다스에서 적용이 어려운 함수를 적용시켜줌

 

pandas 문자열 함수

  • str.contains(r' 'cat|dog') # r 정규표현식, 고양이나 강아지 포함하는 행 반환, 없을 시 NaN
  • str.split('-')[index] # -하이폰 기준 구분
  • str.extract('(cat)') #괄호 두 번 사용 없을 시 NaN반환

pandas 시리즈를 숫자형 자료형 변환

  • pd.to_numeric(arg, errors='', downcast=None) #arg: 스칼라 혹은 1차원, erros(raise, coerce, ignore)
  • ex) df1.apply(pd.to_numeric, errors = 'coerce') #데이터프레임에 apply 적용

 

 

 

반응형