통계 및 데이터 처리/python
python_pandas 데이터 시각화, 그래프 그리기
cossmos
2017. 8. 9. 03:01
데이터를 처리하기 위해서 필요한 패키지를 불러옵니다
1 2 3 | import pandas as pd import datetime as dt import pandas_datareader.data as web | cs |
1 2 3 4 5 | start = dt.datetime(2010, 1, 1) end = dt.datetime(2016, 12, 31) df = web.DataReader("AAPL", "google", start, end) | cs |
저는 처음 DataReader 함수보고 정말 깜짝 놀랐어요.
"정말 저렇게만 써넣으면 google finance에서 apple 주가 정보를 가져온다고?"
짠 (.head()함수는 상위 5의 정보만 가져옵니다. 괄호 안에 5말고 다른 수를 넣으면 그 수만큼 상위에서 가져옵니다.)
ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 정말 신기해요
이제 이 주가 정보를 그래프로 나타내봅시다.
우선 필요한 패키지를 불러옵니다.
1 2 3 | import matplotlib.pyplot as plt from matplotlib import style | cs |
1 2 3 4 5 | df['High'].plot() plt.legend() plt.show() | cs |
df 테이블에서 high컬럼의 정보들을 시간에 따라 그래프를 나타내는 코드입니다.
legend()함수는 그래프에 등장하는 곡선이 어떤 컬럼을 나타내는지 표시되도록 역할을 합니다.
show()를 통해서 보면 아래와 같은 그래프가 등장합니다.
(이쁘죠)
1 2 3 4 | df['High'].plot(figsize=(15, 6)) plt.legend() plt.show() | cs |
이번엔 사이즈를 조절해보겠습니다.
plot(figsize=(15,6))이 추가 되었는데요,
figsize안에 첫번째 인자가 그래프 가로, 두번째 인자가 그래프 세로의 길이를 조절해줍니다.
가로로 좀 더 늘어난 그래프가 나왔네요. (이것도 예뻐..)
이번엔 시간적 구간을 설정해봅시다.
1 2 3 | df['High']['2014-08-01':'2015-08-01'].plot(figsize=(15, 6)) plt.legend() plt.show() | cs |
['2014-08-01':'2015-08-01']이 추가되었는데요,
파이썬의 리스트 사용방법을 아시는 분이면 어떻게 시간을 조절하는 것인지 알 것입니다.
짜잔