pandas 기초2
2020. 10. 20. 12:00ㆍproject/data science
기본
import numpy as np
import pandas as pd
조건 검색
-masking & query
방법 1. dataFrame 있으면 단순히 dataFrame 변수명에 조건문 넣듯이 사용 가능
df = pd.DataFrame(np.random.rand(3, 2), columns=["A", "B"])
df[“A”] < 0.5
결과 :
df(df[“A”] < 0.5)
로 감싸주면 차트형식
방법2 . query 사용 -> false, true 형식 말고 차트로 나옴
df.query("A < 0.5 and B > 0.3")
결과 :
함수 사용
-apply()
df["column_name"].apply(func)
groupby
df.groupby('column_name')
pivot_table
: 조건으로 새로운 table 생성
index :행 인덱스 값
Column:열 인덱스 값
Value: 분석할 데이터
sex | class | grade | |
1 | female | 1 | 4.5 |
2 | male | 1 | 4.3 |
3 | female | 2 | 3.6 |
4 | male | 2 | 4.3 |
5 | female | 1 | 3.9 |
pivot_table(index="sex",column="class",values="grade",aggfunc = np.mean)
결과 :
class | 1 | 2 |
sex | ||
female | 4.1 | 3.6 |
male | 4.3 | 4.3 |
'project > data science' 카테고리의 다른 글
pandas 기본 (0) | 2020.10.13 |
---|---|
numpy 이용해 간단한 연산 (0) | 2020.10.13 |