QA ≠ Test

QA(품질 보증)는 개념적인 용어이고, TEST는 QA(품질 보증)를 하기 위한 수단이자 방법이다.

TESTING/PROGREMING

[데이터 사이언스 코딩 - Chap.7] 실습 DataFrame 인덱싱 문제 풀어보기(2)

품생품사(品生品死) 2021. 7. 29. 00:30
반응형

과제 - DataFrame 인덱싱

이번에는 DataFrame에서 연속된 여러 줄을 찾는 연습을 해보려합니다.
방송사는 'KBS'에서 'SBS'까지, 연도는 2012년부터 2017년까지의 시청률만 확인하려면 어떻게 해야하는지 아래 문제를 풀면서 확인해 보도록 하겠습니다.

broadcast.csv
0.47MB
This is data_science_0001
출력 예시

 

리스트 슬라이싱

방송사는 'KBS'에서 'SBS'까지, 연도는 2012년부터 2017년까지의 시청률만 확인하려면 어떻게 하면 될까요?
만약 2012년부터 2017년까지의 모든 데이터를 확인하고 싶다면 리스트 슬라이싱을 활용하면 됩니다.

import pandas as pd

df = pd.read_csv('data/broadcast.csv', index_col=0)
df.loc[2012:2017]

아래와 같이 표시될 것입니다.

This is data_science_0002
리스트 슬라이싱1

만약, 방송사 기준으로 KBS에서 SBS 사이 column의 모든 정보를 확인하고 싶다면 아래와 같이 입력해 봅니다.

import pandas as pd

df = pd.read_csv('data/broadcast.csv', index_col=0)
df.loc[:, 'KBS':'SBS']

This is data_science_0003
리스트 슬라이싱2

위와 같이 확인 하실 수 있을 것입니다.

그럼 이제 이 두 방식을 조합하여, 과제와 같은 데이터의 결과를 만들어 봅시다.

import pandas as pd

df = pd.read_csv('data/broadcast.csv', index_col=0)
df.loc[2012:2017, 'KBS':'SBS']

This is data_science_0004
출력 결과
This is data_science_000
Data Science

요약 : sparta coding club, 스파르타 코딩, 코드잇, 노마드 코더, 프로그래밍, 직장인 코딩, 내일 배움 카드 코딩, 밀크티 코딩, 초등 코딩, 아이스크림 코딩, 코딩 소프트웨어, 구글 데이터 스튜디오, 데이터 웨어 하우스 , 빅 데이터 클라우드

반응형