pandas 데이터 테이블 다루기

<2017. 8. 9. 04:03

우선 저번시간까지 다루었던 데이터 테이블을 다시 불러옵시다.

1
2
3
4
5
6
df = pd.DataFrame({'Day':[1, 2, 3, 4, 5, 6],
             'Visitors':[43, 45, 33, 43, 78, 44],
             'Revenue':[64, 73, 62, 64, 53, 66]})
df = df.set_index('Day')
 
df
Colored by Color Scripter
cs

	Revenue	Visitors
Day
1	64	43
2	73	45
3	62	33
4	64	43
5	53	78
6	66	44

여기서 우리가 원하는 데이터를 뽑아보는 연습을 해봅시다.

1
2
3
4
5
6
7
df.loc[1]
print()
df.loc[3:5]
print()
df['Visitors']
print()
df.loc[5]['Visitors']
cs

결과

Revenue     64
Visitors    43
Name: 1, dtype: int64

 Revenue Visitors
Day 
3 62 33
4 64 43
5 53 78

	Revenue	Visitors
3	62	33
4	64	43
5	53	78

Day
1    43
2    45
3    33
4    43
5    78
6    44
Name: Visitors, dtype: int64

loc[]함수는 괄호 안의 인덱스의 각 컬럼값을 가져옵니다.

그리고 이 괄호는 리스트로 활용되어, [3:5]와 같이 활용할 수 있습니다.

['Visitors']처럼 내가 원하는 컬럼만 가져올 수 도 있고

loc[5]['Visitors']처럼 내가 원하는 인덱스의 원하는 칼럼의 값을 가져 올 수 있습니다.

이번엔 테이블에 컬럼을 추가해봅시다.

1
2
3
4
nums = [1,2,3,4,5,6]
df['Num'] = nums
df
 
cs

결과

Num이라는 컬럼이 하나 더 생기고 nums 리스트의 값들이 순서대로 인덱스에 배치되었네요!

따로 인덱스를 지정해주는 방법도 있습니다.

1
2
flags = pd.Series([0, 1, 0, 1], index=[1, 3, 4, 5])
df['Flag'] = flags
Colored by Color Scripter
cs

결과

Series()함수의 첫번째 인자로 들어간 시리즈 값들이 두번째 인자로 들어간 인덱스 값에 순서대로 들어갔습니다.

인덱스로 지정되지 않은 부분은 NaN으로 되었네요.

저작자표시 (새창열림)

'통계 및 데이터 처리 > python' 카테고리의 다른 글

pandas 테이블 합치기 (0)	2017.08.10
file io (0)	2017.08.10
pandas datatable 생성 (0)	2017.08.09
python_pandas 데이터 시각화, 그래프 그리기 (0)	2017.08.09
matplotlib를 활용해서 막대 그래프를 만들어보자2 (0)	2017.08.02

A4용지

pandas 데이터 테이블 다루기

'통계 및 데이터 처리 > python' 카테고리의 다른 글

+ Recent posts

티스토리툴바