반응형 시각화2 [데이터 분석] 행정구역 정보를 읽고, 분석하기(2/2) [1]. 상관계수 (crrelation) * 인구수와 면적간에 관련성이 있는지 살펴보기 위해서 상관계수를 구하기 * 상관계수 값음 -1 ~ 1 사이의 값으로 , -1에 가까우면 음에 비례, 1에 가까우면 양의 비례(관련성이높다), 0에 가까울수록 상관x * 음수는 반비례, 양수는 비례 * corr()함수사용 corr() 함수 사용 data['면적'].corr(data['인구수']) -0.3460351605045771 서울특별시의 면적과 인구수의 상관계수 구하기 seoul_df = data.loc[data['광역시도'] == '서울특별시'] seoul_df['면적'].corr(seoul_df['인구수']) 0.664426818890978 [2]. Group By 기능 * 광역시도별 인구수의 합계 * ~별에.. 2022. 2. 12. [데이터 분석] 행정구역 정보를 읽고, 분석하기(1/2) 오늘은 위의 첨부한 파일을 갖고 정보를 읽고, 분석하는 작업을 해보겠다. 작업 순서는 아래와 같다. 제목 [행정구역 정보를 읽고, 분석하기] 목차 1. read_csv()함수로 csv file 읽어오기 2. 특정행과 열을 선택하기 3. 컬럼명변경 4. 상관관계 분석 (인구수와 면적간의 상관관계) 5. 시각화 [1]. 데이터 읽어오기 import pandas as pd data = pd.read_csv('data_draw_korea.csv') #print(data) data.sample(3) Unnamed: 0인구수shortNamexy면적광역시도행정구역 171739668횡성105997.82강원도횡성군 115115292375부산북구91638.30부산광역시북구 106106321618대전유성413177.16대전.. 2022. 2. 11. 이전 1 다음 반응형