데이터 시각화 = 무선청소기 with python (모델별 비교&결과)

   |참고서적: 직장인을 위한 데이터 분석 실무 with 파이썬|

목적 : 여러 제조사별 무선청소기의 가격과 성능에 대한 데이터를 수집하고, 이를 분석하는 과정을 통해 각자의 상황에 맞는 제품군이 무엇인지 분석 + seabornd의 scatterplot()함수를 이용해 데이터 분포를 시각화

오늘은 데이터 시각화를 하는 방법에 대해서 알려드리도록 하겠습니다. 


1) 라이브러리 임포트 및 한글 글꼴 설정

2) 결측값 없애기

dropna()함수로 정확한 차트를 그리기 위해 값이 없는 차트는 삭제하도록 하겠습니다. 그리고 axis=0은 행을 의미하고, 데이터가 없는 차트를 열이 아닌 행으로 없애기 위해서 넣어 준것입니다. 


3)청소기 성능 시각화

먼저, # 흡입력, 사용시간 최대, 최소값을 정리해줍니다. 

그후에 본격적인 시각화. 

figure 함수로 그래프의 크기 설정 / title 함수로 그래프 제목 설정 / scatterplot() 함수로 x,y 축 설정 /

*시각화 결과 가운데 빨간 점선은 흡입력과 사용시간의 평균값을 의미합니다. 

결과적으로 사용시간이 길고, 흡입력이 높을수록 가격이 높은 경향이 있음을 확인할 수 있습니다. 동그라미가 클수록 가격이 높음을 표현하기 때문이죠. 

4) 인기 제품 데이터 시각화

이번에는 상위 20개의 모델만 선택해 비교분석 그래프를 그려볼게요. 이번에는 결과치만 보여드리도록 할게요~ 궁금하신 분은 댓글 남겨주시면 알려드리겠습니다 ^^ 

x축은 흡입력, y축은 사용시간, 원의 크기는 가격을 의미합니다. 

결과를 보시면 제트제로는 삼성 제품으로 흡입력과 사용시간 모두 우수한 것을 알수 있습니다. 다만,,,가격이 엄청 나죠? 초록색은 다이슨 제품으로 삼성제품과 가격은 비슷하지만, 흡입력이나 사용시간 측면에서 삼성 제품보다 떨어지는 것을 보입니다. 

오히려,, 빨간색의 샤오미 제품이 다이슨 제품보다 가격에서 더욱 저렴하고 흡수력이 뛰어난 것을 알수 있습니다. 


오늘까지가 무선청소기 데이터 분석의 마지막과정인 시각화를 마쳤습니다. 이를 통해 비싼게 좋은 제품이 있는 반면에 그렇지 않은 제품이 있는것을 데이터 분석을 통해 확인할 수 있었습니다. 


**더 추가해주시거나 고칠게 있다면 댓글 달아주세요:) 보고 배우겠습니다 **
문제시, 바로 삭제 




댓글

인기 데이터 분석 사례

크롤링_ 인스타그램 정책 변경(로그인 추가) with python