728x90

Machine Learning 17

[PANDAS] seaborn으로 데이터 분포 살펴보기

matplotlib 과 statsmodel 패키지를 이용하여 만들어짐 데이터의 통계적인 부분을 살펴볼 때 쉽고 간편하다. [seaborn import] import seaborn as sns sns.set() pit.rc('font',family='Malgun Gothic') sns.countplot(data=데이터 셋, x='x 축 값'); sns.boxplot(data=데이터 셋, x='x 축 값',y='y축의 값'); (hue 인자로, boxplot 그래프 분리) sns.boxplot(data=데이터 셋, x='x 축 값',y='y축의 값', hue='값을 나눌 기준'); 같은 그래프인데 성별로 나누어서 분포 확인 가능하다. sns.violinplot(data=데이터 셋, x='x 축 값',y='y..

Machine Learning 2021.08.22

[PANDAS] matplotlib으로 그래프 그리기

Pandas에는 matplotlib으로 그래프 그리는 기능이 내장되어 있다. series.plot dataframe.plot plot()함수의 인자로 쓸 수 있는 옵션들 인자 역할 figsize 그래프 크기 kind 그래프 종류 title 제목 xlabel x축 제목 ylable y축 제목 legend 범례 rot 눈금회전 subplots 복수 그래프 kind : 기본값은 라인그래프로 출력됨 bar, scatter 의 옵션이 있음 subplots=> 복수 그래프(True로 켤 수 있음/기본값은 False) 이렇게 한 그래프로 표현되어있는 그래프를 아래와 같이 나누어서 표현 할 수 있다.

Machine Learning 2021.08.15

[PANDAS] 함수 (.concat)(.groupby)(.query)

[DataFrame 병합] import pandas as pd pd.concat([df_A, df_B],axis=1) 값이 없는 경우에는 NaN값으로 채워짐. 기본적으로 axis=0으로 설정되어 있음(행 방향) 열 방향으로 병합하고 싶을 때는 axis=1로 설정 [그룹으로 묶어서 Aggregation하기] df.groupby(by=집계대상, axis=집계축) 그 뒤에 .sum (합계) .mean(평균) 등 여러 집계 함수를 같이 쓸 수 있음 [DataFrame 필터링 하기] df.query(쿼리문) ex) df.query('number==1') column은 큰 따옴표 없이, 값은 문자열일 경우에만 큰 따옴표 사용 and or 등 여러개를 중첩으로 사용 가능

Machine Learning 2021.08.15

[PANDAS] DataFrame -> CSV 파일로 저장하기

DataFrame을 CSV 파일로 저장하는 방법 New_df.to_csv('파일명or파일경로') New_df.to_csv('파일명or파일경로', encoding='cp949') ## 한글이 포함된 경우 엑셀을 위한 인코딩 CSV 파일을 DataFrame으로 불러오는 방법 readed_df=pd.read_csv('파일명 or 파일경로') readed_df=pd.read_csv('파일명 or 파일경로', encoding='cp849', index_col=0) #encoding 지정하여 한글이 포함된 파일 불러오기 index_col 값이 없으면 모두 column 값으로 입력된다. index는 임의값(0,1,2,...) 으로 정의된다

Machine Learning 2021.08.15

[PANDAS] Series & DataFrame 생성하기

데이터 시각화의 중요한 PANDAS import pandas as pd new_sr=pd.Series([배열], name='배열이름', index=[인덱스배열]) 1 차원 Series 생성 name, index는 생략가능함. name 생략하는경우 : None index 생략하는 경우: 0,1,2, ... import pandas as pd new_df=pd.DataFrame([2차원 배열], index=[인덱스배열], columns=[컬럼의 배열] 2차원 DataFrame 생성 new_df.loc[:,'컬럼값']=[배열] DataFrame에 새로운 열 생성하기. 초기 생성시에는 2차원 배열이 index 기준으로 값이 입력되는데, 추가 할 때는 column 기준으로 입력되니 주의하자. 빈 값을 넣으려면, ..

Machine Learning 2021.08.10
728x90