QA ≠ Test

QA(품질 보증)는 개념적인 용어이고, TEST는 QA(품질 보증)를 하기 위한 수단이자 방법이다.

TESTING/PROGREMING

[데이터 사이언스 코딩 - Chap.14] 실습 음료의 칼로리 문제 풀어보기

품생품사(品生品死) 2021. 8. 26. 21:27
반응형

[문제] 스타벅스 음료의 칼로리는 얼마일까요?

스타벅스 음료의 칼로리 및 영양소 정보가 있습니다.

스타벅스 음료의 칼로리 분포는 어떻게 되는지, 히스토그램을 그려서 확인해 봅시다.

원하는 결과가 나오도록 df.plot() 메소드의 괄호를 채워 보세요!

 

df.plot() # 괄호를 채워 주세요.

 

starbucks_drinks.csv
1.01MB

 

칼로리의 구간은 총 20개로 나누어 주세요.

 

This is data_science_001
출력 예시1

 

과제 해설

주어진 데이터의 'Calories' column에는 칼로리 정보가 저장되어 있습니다.

 

%matplotlib inline
import pandas as pd

df = pd.read_csv("data/starbucks_drinks.csv")
df['Calories']

 

0        3
1        4
2        5
3        5
4       70
      ... 
237    320
238    170
239    200
240    180
241    240
Name: Calories, Length: 242, dtype: int64

 

DataFrame의 .plot() 메소드를 사용해서 히스토그램을 그리면 됩니다.

히스토그램을 그리기 위해서 kind를 hist로, 칼로리에 대한 데이터를 그리기 위해서 y를 Calories로, 총 20개의 구간으로 나누기 위해 bins를 20으로 설정해 줍니다.

 

코드를 완성하면 아래와 같습니다.

 

%matplotlib inline
import pandas as pd

df = pd.read_csv("data/starbucks_drinks.csv")
df.plot(kind='hist', y='Calories', bins=20)

 

This is data_science_002
출력 결과1

확인해보면, 스타벅스 음료의 칼로리는 100~300 사이가 가장 많고, 50 이하의 음료도 꽤 있다는 걸 알 수 있습니다.

 

실습 과제

이번엔 스타벅스 음료의 칼로리를 박스 플롯으로 그려봅시다.

This is data_science_003
출력 예시2

 

박스 플롯도 히스토그램과 유사하게 그릴 수 있습니다.
'Calories' column의 칼로리 정보를 확인해 봅시다.

 

%matplotlib inline
import pandas as pd

df = pd.read_csv("data/starbucks_drinks.csv")
df['Calories']

 

0        3
1        4
2        5
3        5
4       70
      ... 
237    320
238    170
239    200
240    180
241    240
Name: Calories, Length: 242, dtype: int64


여기에서 plot 메소드를 사용해서 박스 플롯을 그리면 됩니다.
코드를 완성하면 아래와 같습니다.

 

%matplotlib inline
import pandas as pd

df = pd.read_csv("data/starbucks_drinks.csv")
df['Calories'].plot(kind='box')

 

This is data_science_004
출력 결과2
This is programing_001
Data Science

요약 : sparta coding club, 스파르타 코딩, 코드잇, 노마드 코더, 프로그래밍, 직장인 코딩, 내일 배움 카드 코딩, 밀크티 코딩, 초등 코딩, 아이스크림 코딩, 코딩 소프트웨어, 구글 데이터 스튜디오, 데이터 웨어 하우스 , 빅 데이터 클라우드

반응형