본문 바로가기

python 데이터 분석

(2)
공공데이터 '아파트 분양가격' 동향 파악하기 - final 2015년 8월 이전 데이터를 보겠습니다. 중간에 ... 으로 생략된 게 보이는데요. pd.options.display.max_columns 로 컬럼이 다 보이게 설정했습니다. 위 데이터 프레임은 컬럼이 100개는 아니지만 일단 최대치를 df_first 데잍프레임 컬럼보다 많이 늘려놓았기에 모든 컬럼이 이제 보입니다. 최근 데이터 프레임과 예전 데이터 프레임(df_first) 의 양식이 많이 다릅니다. df_first를 최근 데이터 프레임 양식에 맞춰서 합쳐주겠습니다. df_first 데이터를 살펴보겠습니다. 컬럼 데이터들을 melt 시키겠습니다. 기존 컬럼을 행으로 녹여내는게 melt 입니다. melt 시킨 데이터를 다른 이름으로 할당하고 컬럼명 df_lasf 데이터프레임과 맞췄습니다. 연도,월 분리 ..
공공데이터 '아파트 분양가격' 동향 파악하기 - 2단계 지난 시간에 했던 공공데이터 분석의 2단계입니다. 시각화 작업을 할겁니다. 우선, 시각화 작업하기 전에 pandas, seaborn 위주로 시작화를 하긴할겁니다. 헌데, 이 때 알아두셔야 하는 것은 그래프를 여러 가지 형태로 그린다는 데 초점을 맞추면 좋을 것 같습니다. 세부적인 그래프의 모든 옵션은 일일히 직접 입력해보면서 그래프의 변화를 관찰하면서 만드는 게 좋다고 생각합니다. 만약, 보고서 또는 공모전 용도로 한다면 디자인에 대한 생각을 해야겠지만 이 프로젝트 개인적인 토이 프로젝트 느낌이며 공부하는 용도이기에 조금은 라이트하게 하려고 합니다. 또, 그래프 쓸 때마다 매번 시프트,탭을 눌러서 한 번 확인하고 하는 것이 좋습니다. 기본적으로 x y 축에 데이터프레임의 컬럼을 타입에 맞게 넣고, hue..