-
데이터 살펴보기 : 상자그림(Box plot) 그리기Data Analysis/데이터분석(Data Analysis) 2020. 9. 24. 14:32반응형
데이터 살펴보기
상자그림(Box plot) 그리기
상자그림
- 연속형 변수의 특성이 요약된 그래프
- 연속형 변수의 전체적인 모습을 한 눈에 파악하기
- 아웃라이어 등의 이상치를 바로 확인 할 수 있음
Code
# df_movie의 변수 살펴보기 names(df_movie) [1] "영화명" "관객수" "매출액" "상영횟수" # 관객수의 히스토그램 그리기 관객수 = movie$관객수 boxplot(관객수, main = "히스토그램")
여러 상자그림
Code
# df의 변수 살펴보기 names(df) [1] "age" "sex" "bmi" "children" "smoker" "region" "charges" # 관심변수를 그룹변수 기준으로 Box plot 그리기 # 지역별 청구금액의 상자금액 그리기 # 관심변수: 청구금액, 그룹변수: 지역 boxplot(charges~region, data = df ,main = "지역별 보험금액 청구액")
Box plot 구성 그림 출저: bioinformaticsandme.tistory.com/245
반응형'Data Analysis > 데이터분석(Data Analysis)' 카테고리의 다른 글
[데이터 분석]데이터분석에서 가장 많이 시간이 걸리는 작업, 데이터 클리닝 (0) 2021.03.14 데이터 살펴보기 : 히스토그램(Histogram) 그리기 (0) 2020.09.24