pandas 데이터 테이블 다루기 :: A4용지

우선 저번시간까지 다루었던 데이터 테이블을 다시 불러옵시다.

1
2
3
4
5
6
df = pd.DataFrame({'Day':[123456],
             'Visitors':[434533437844],
             'Revenue':[647362645366]})
df = df.set_index('Day')
 
df
cs
RevenueVisitors
Day
16443
27345
36233
46443
55378
66644


여기서 우리가 원하는 데이터를 뽑아보는 연습을 해봅시다.


1
2
3
4
5
6
7
df.loc[1]
print()
df.loc[3:5]
print()
df['Visitors']
print()
df.loc[5]['Visitors']
cs

결과

Revenue     64
Visitors    43
Name: 1, dtype: int64

RevenueVisitors
Day
36233
46443
55378

Day
1    43
2    45
3    33
4    43
5    78
6    44
Name: Visitors, dtype: int64

78

loc[]함수는 괄호 안의 인덱스의 각 컬럼값을 가져옵니다.

그리고 이 괄호는 리스트로 활용되어, [3:5]와 같이 활용할 수 있습니다.

['Visitors']처럼 내가 원하는 컬럼만 가져올 수 도 있고

loc[5]['Visitors']처럼 내가 원하는 인덱스의 원하는 칼럼의 값을 가져 올 수 있습니다.


이번엔 테이블에 컬럼을 추가해봅시다.

1
2
3
4
nums = [1,2,3,4,5,6]
df['Num'] = nums
df
 
cs

결과

Num이라는 컬럼이 하나 더 생기고 nums 리스트의 값들이 순서대로 인덱스에 배치되었네요!


따로 인덱스를 지정해주는 방법도 있습니다.

1
2
flags = pd.Series([0, 1, 0, 1], index=[1, 3, 4, 5])
df['Flag'] = flags
cs

결과

Series()함수의 첫번째 인자로 들어간 시리즈 값들이 두번째 인자로 들어간 인덱스 값에 순서대로 들어갔습니다.

인덱스로 지정되지 않은 부분은 NaN으로 되었네요.

+ Recent posts