아래와 같은 결과가 나오도록 DataFrame을 만들고 출력해 보겠습니다.
column은 name, birthday, occupation 총 3개입니다.
1단계
우선 DataFrame에 들어갈 정보가 담긴 2차원 파이썬 리스트를 만들어 주세요.
2차원 파이썬 리스트는 이렇게 작성할 수 있습니다.
celebrities = [
['Taylor Swift', 'December 13, 1989', 'Singer-songwriter'],
['Aaron Sorkin', 'June 9, 1961', 'Screenwriter'],
['Harry Potter', 'July 31, 1980', 'Wizard'],
['Ji-Sung Park', 'February 25, 1981', 'Footballer']
]
2단계
이제 DataFrame을 생성해야겠죠? pandas 라이브러리의 DataFrame 함수(생성자)를 사용하면 됩니다.
df = pd.DataFrame(celebrities)
이렇게 DataFrame을 생성할 수 있는데요. Column 이름을 붙여 보도록 하겠습니다.
3단계
DataFrame 함수의 columns라는 파라미터로 리스트를 넘겨주면 됩니다.
import pandas as pd
# 코드를 작성하세요.
two_dimensional_list = [['Taylor Swift', 'December 13, 1989','Singer-songwriter'],
['Aaron Sorkin', 'June 9, 1961', 'Screenwriter'],['Harry Potter', 'July 31, 1980', 'Wizard'],
['Ji-Sung Park', 'February 25, 1981', 'Footballer']]
df = pd.DataFrame(two_dimensional_list, columns = ['name', 'birthday', 'occupation'],
index = ['0', '1', '2', '3'])
df
pandas DataFrame에는 다양한 종류의 데이터를 담을 수 있습니다.
dtypes를 사용해서 각 column이 어떤 데이터 타입을 보관하는지 확인할 수 있습니다.
import pandas as pd
two_dimensional_list = [['dongwook', 50, 86], ['sineui', 89, 31], ['ikjoong', 68, 91],
['yoonsoo', 88, 75]]
my_df = pd.DataFrame(two_dimensional_list, columns=['name', 'english_score', 'math_score'],
index=['a', 'b', 'c', 'd'])
print(my_df.dtypes)
name object
english_score int64
math_score int64
dtype: object
위 경우 'name' column은 object라는 데이터 타입을 보관하고, 'english_score'와 'math_score' column은 int64라는 데이터 타입을 보관하는 거죠.
보시다시피 한 column 내에서는 모든 값이 동일한 데이터 타입입니다.
pandas의 dtype들
pandas에 담을 수 있는 dtype(데이터 타입) 몇 가지를 살펴봅시다.
Dtype설명
int64 | 정수 |
float64 | 소수 |
object | 텍스트 |
bool | 불린(참과 거짓) |
datetime64 | 날짜와 시간 |
category | 카테고리 |
요약 : sparta coding club, 스파르타 코딩, 코드잇, 노마드 코더, 프로그래밍, 직장인 코딩, 내일 배움 카드 코딩, 밀크티 코딩, 초등 코딩, 아이스크림 코딩, 코딩 소프트웨어, 구글 데이터 스튜디오, 데이터 웨어 하우스 , 빅 데이터 클라우드
'TESTING > PROGREMING' 카테고리의 다른 글
[데이터 사이언스 코딩 - Chap.6] 실습 DataFrame 인덱싱 문제 풀어보기(1) (0) | 2021.07.28 |
---|---|
[데이터 사이언스 코딩 - 정보] Pandas : DataFrame을 만드는 방법 알아보기 (0) | 2021.07.24 |
[데이터 사이언스 코딩 - Chap.4] 실습 numpy 기본 통계 문제 풀어보기 (0) | 2021.07.21 |
[데이터 사이언스 코딩 - Chap.3] 실습 Numpy.array 문제 풀어보기 (0) | 2021.07.20 |
[데이터 사이언스 코딩 - Chap.2] 실습 Numpy.array 문제 풀어보기 (0) | 2021.07.19 |