QA ≠ Test

QA(품질 보증)는 개념적인 용어이고, TEST는 QA(품질 보증)를 하기 위한 수단이자 방법이다.

TESTING/PROGREMING

[데이터 사이언스 코딩 - Chap.5] 실습 Pandas 문제 풀어보기

품생품사(品生品死) 2021. 7. 23. 00:11
반응형

아래와 같은 결과가 나오도록 DataFrame을 만들고 출력해 보겠습니다.

column은 name, birthday, occupation 총 3개입니다.

 

1단계

 

우선 DataFrame에 들어갈 정보가 담긴 2차원 파이썬 리스트를 만들어 주세요.

2차원 파이썬 리스트는 이렇게 작성할 수 있습니다.

celebrities = [
    ['Taylor Swift', 'December 13, 1989', 'Singer-songwriter'],
    ['Aaron Sorkin', 'June 9, 1961', 'Screenwriter'],
    ['Harry Potter', 'July 31, 1980', 'Wizard'],
    ['Ji-Sung Park', 'February 25, 1981', 'Footballer']
]

 

2단계

이제 DataFrame을 생성해야겠죠? pandas 라이브러리의 DataFrame 함수(생성자)를 사용하면 됩니다.

df = pd.DataFrame(celebrities)

 

이렇게 DataFrame을 생성할 수 있는데요. Column 이름을 붙여 보도록 하겠습니다.

 

3단계

DataFrame 함수의 columns라는 파라미터로 리스트를 넘겨주면 됩니다.

import pandas as pd

# 코드를 작성하세요.
two_dimensional_list = [['Taylor Swift', 'December 13, 1989','Singer-songwriter'],
['Aaron Sorkin', 'June 9, 1961', 'Screenwriter'],['Harry Potter', 'July 31, 1980', 'Wizard'], 
['Ji-Sung Park', 'February 25, 1981', 'Footballer']]

df = pd.DataFrame(two_dimensional_list, columns = ['name', 'birthday', 'occupation'], 
index = ['0', '1', '2', '3'])

df

실행 결과

 

pandas DataFrame에는 다양한 종류의 데이터를 담을 수 있습니다.

dtypes를 사용해서 각 column이 어떤 데이터 타입을 보관하는지 확인할 수 있습니다.

import pandas as pd

two_dimensional_list = [['dongwook', 50, 86], ['sineui', 89, 31], ['ikjoong', 68, 91], 
['yoonsoo', 88, 75]]

my_df = pd.DataFrame(two_dimensional_list, columns=['name', 'english_score', 'math_score'], 
index=['a', 'b', 'c', 'd'])

print(my_df.dtypes)
name             object
english_score     int64
math_score        int64
dtype: object

 

위 경우 'name' column은 object라는 데이터 타입을 보관하고, 'english_score'와 'math_score' column은 int64라는 데이터 타입을 보관하는 거죠.

 

보시다시피 한 column 내에서는 모든 값이 동일한 데이터 타입입니다.

 

pandas의 dtype들

pandas에 담을 수 있는 dtype(데이터 타입) 몇 가지를 살펴봅시다.

 

Dtype설명

int64 정수
float64 소수
object 텍스트
bool 불린(참과 거짓)
datetime64 날짜와 시간
category 카테고리

This is data_science_000
Data Science

요약 : sparta coding club, 스파르타 코딩, 코드잇, 노마드 코더, 프로그래밍, 직장인 코딩, 내일 배움 카드 코딩, 밀크티 코딩, 초등 코딩, 아이스크림 코딩, 코딩 소프트웨어, 구글 데이터 스튜디오, 데이터 웨어 하우스 , 빅 데이터 클라우드

반응형