통계 및 데이터 처리/python

python_pandas 데이터 시각화, 그래프 그리기

cossmos 2017. 8. 9. 03:01

데이터를 처리하기 위해서 필요한 패키지를 불러옵니다

1
2
3
import pandas as pd
import datetime as dt
import pandas_datareader.data as web


cs



1
2
3
4
5
start = dt.datetime(201011)
end = dt.datetime(20161231)
 
df = web.DataReader("AAPL""google", start, end) 
cs

저는 처음 DataReader 함수보고 정말 깜짝 놀랐어요.

"정말 저렇게만 써넣으면 google finance에서 apple 주가 정보를 가져온다고?"

짠 (.head()함수는 상위 5의 정보만 가져옵니다. 괄호 안에 5말고 다른 수를 넣으면 그 수만큼 상위에서 가져옵니다.)

ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 정말 신기해요


이제 이 주가 정보를 그래프로 나타내봅시다.

우선 필요한 패키지를 불러옵니다.

1
2
3
import matplotlib.pyplot as plt
from matplotlib import style
 
cs

1
2
3
4
5
df['High'].plot()
plt.legend()
plt.show()
cs

df 테이블에서 high컬럼의 정보들을 시간에 따라 그래프를 나타내는 코드입니다.

legend()함수는 그래프에 등장하는 곡선이 어떤 컬럼을 나타내는지 표시되도록 역할을 합니다.

show()를 통해서 보면 아래와 같은 그래프가 등장합니다.

(이쁘죠)

1
2
3
4
df['High'].plot(figsize=(15, 6))
plt.legend()
plt.show()
cs

이번엔 사이즈를 조절해보겠습니다.

plot(figsize=(15,6))이 추가 되었는데요,

figsize안에 첫번째 인자가 그래프 가로, 두번째 인자가 그래프 세로의 길이를 조절해줍니다.

가로로 좀 더 늘어난 그래프가 나왔네요. (이것도 예뻐..)


이번엔 시간적 구간을 설정해봅시다.

1
2
3
df['High']['2014-08-01':'2015-08-01'].plot(figsize=(15, 6))
plt.legend()
plt.show()
cs

['2014-08-01':'2015-08-01']이 추가되었는데요, 

파이썬의 리스트 사용방법을 아시는 분이면 어떻게 시간을 조절하는 것인지 알 것입니다.


짜잔