크롤링_4 = 무선청소기 비교 with 파이썬 (단위 통일시키기)

 |참고서적: 직장인을 위한 데이터 분석 실무 with 파이썬|

목적 : 여러 제조사별 무선청소기의 가격과 성능에 대한 데이터를 수집하고, 이를 분석하는 과정을 통해 각자의 상황에 맞는 제품군이 무엇인지 분석 + 단위 통일하는 방법 

오늘은 저번에 추출하였던, 카테고리, 사용시간, 흡입력 데이터 중에서, 사용시간과 흡입력의 단위를 통일하는 방법에 대해서 배우겠습니다. 왜냐하면 기계는 1시간과 60분의 크기가 같다고 비교하지 못하기 때문에 단위를 통일시켜주어야 합니다. 


1) 사용시간 단위 통일시키기 

이렇게 def 함수를 이용하여 간단하게 기존 1시간이라고 적혀있던 단위를 '분'단위로 조정하였습니다. 

2)흡입력 단위 통일시키기 (1W=1AW=100PA) 


**replace()함수는 확장자를 변경할 때 쓰이는 대표적인 함수입니다. 여기서는 단위를 삭제할 쓰였습니다.
그래서 value.replace("A","") 는 A단위를 "" 공백으로 변경하겠다고 이해하시면 됩니다.

그리고 정의된 한수를 다시 for 구분에 적어 단위를 통일시켰습니다. 


3)전처리 데이터 확인 및 결과 저장 


이렇게 사이트에서 크롤링한 데이터를 원하는 데이터만을 추출하고 정리하는 방법에 대해 배워보았습니다. 

다음시간에는 정리한 데이터를 기반으로 무선청소기의 가성비 좋은 제품을 살펴보기 위한 시각화하는 방법에 대해서 배워보도록 하겠습니다. 

**더 추가해주시거나 고칠게 있다면 댓글 달아주세요:) 보고 배우겠습니다 **
문제시 바로 삭제 

댓글

인기 데이터 분석 사례

크롤링_ 인스타그램 정책 변경(로그인 추가) with python