우선 저번시간까지 다루었던 데이터 테이블을 다시 불러옵시다.
1 2 3 4 5 6 | df = pd.DataFrame({'Day':[1, 2, 3, 4, 5, 6], 'Visitors':[43, 45, 33, 43, 78, 44], 'Revenue':[64, 73, 62, 64, 53, 66]}) df = df.set_index('Day') df | cs |
Revenue | Visitors | |
---|---|---|
Day | ||
1 | 64 | 43 |
2 | 73 | 45 |
3 | 62 | 33 |
4 | 64 | 43 |
5 | 53 | 78 |
6 | 66 | 44 |
여기서 우리가 원하는 데이터를 뽑아보는 연습을 해봅시다.
1 2 3 4 5 6 7 | df.loc[1] print() df.loc[3:5] print() df['Visitors'] print() df.loc[5]['Visitors'] | cs |
결과
Revenue 64 Visitors 43 Name: 1, dtype: int64
Revenue | Visitors | |
---|---|---|
Day | ||
3 | 62 | 33 |
4 | 64 | 43 |
5 | 53 | 78 |
Day 1 43 2 45 3 33 4 43 5 78 6 44 Name: Visitors, dtype: int64
78
loc[]함수는 괄호 안의 인덱스의 각 컬럼값을 가져옵니다.
그리고 이 괄호는 리스트로 활용되어, [3:5]와 같이 활용할 수 있습니다.
['Visitors']처럼 내가 원하는 컬럼만 가져올 수 도 있고
loc[5]['Visitors']처럼 내가 원하는 인덱스의 원하는 칼럼의 값을 가져 올 수 있습니다.
이번엔 테이블에 컬럼을 추가해봅시다.
1 2 3 4 | nums = [1,2,3,4,5,6] df['Num'] = nums df | cs |
결과
Num이라는 컬럼이 하나 더 생기고 nums 리스트의 값들이 순서대로 인덱스에 배치되었네요!
따로 인덱스를 지정해주는 방법도 있습니다.
1 2 | flags = pd.Series([0, 1, 0, 1], index=[1, 3, 4, 5]) df['Flag'] = flags | cs |
결과
Series()함수의 첫번째 인자로 들어간 시리즈 값들이 두번째 인자로 들어간 인덱스 값에 순서대로 들어갔습니다.
인덱스로 지정되지 않은 부분은 NaN으로 되었네요.
'통계 및 데이터 처리 > python' 카테고리의 다른 글
pandas 테이블 합치기 (0) | 2017.08.10 |
---|---|
file io (0) | 2017.08.10 |
pandas datatable 생성 (0) | 2017.08.09 |
python_pandas 데이터 시각화, 그래프 그리기 (0) | 2017.08.09 |
matplotlib를 활용해서 막대 그래프를 만들어보자2 (0) | 2017.08.02 |