728x90
- Pandas 개요
Pandas 에는 Series 와 DataFrame의 두가지 데이터 구조가 존재한다. 주로 사용되는 데이터 구조는 2차원 구조인 DataFrame 이다.
- 데이터 참조
DataFrame의 데이터는 행과 열을 지정해서 참조할 수 있다. 여러가지 참조방법이 있지만 행에 대하여 추출할 때는 loc, 열에 대하여 추출할 때는 iloc를 자주 이용한다.
import pandas as pd
data = {"fruits" : ["apple", "orange", "banana","strawberry", "kiwifruit"],
"year" : [2001,2002,2001,2008,2006],
"time" : [1,4,5,6,3]}
df = pd.DataFrame(data)
print(df)
-------------------------------------------------------------------------------------
fruits year time
0 apple 2001 1
1 orange 2002 4
2 banana 2001 5
3 strawberry 2008 6
4 kiwifruit 2006 3
_________________________________________________________________________________________
df = df.loc[[1,2],["time","year"]]
print(df)
--------------------------------------------------------------------------------------
time year
1 4 2002
2 5 2001
Example.
import pandas as pd
index = ["광수","민호","소희","태양","영희"]
columns = ["국어","수학","사회","과학","영어"]
data = [[30,45,12,45,87],[65,47,83,17,58],[64,63,86,57,46],[38,47,62,91,63],[65,36,85,94,36]]
df = pd.DataFrame(data, index = index, columns = columns)
#df에 "제목"이라는 새 열을 만들고 pe_column의 데이터를 추가하세요.
pe_column = pd.Series([56,43,73,82,62], index = ["광수","민호","소희","태양","영희"])
df["제목"] = pe_column
print(df)
print()
#수학을 오름차순으로 정렬하세요.
df1 = df.sort_values(by = "수학",ascending = True)
print(df1)
print()
#df1의 각 요소에 5점을 더하세요.
df2 = df1 + 5
print(df2)
print()
#df의 통계 정보 중에서 "mean","max","min"을 출력하세요.
print(df2.describe().loc[["mean","max","min"]])
728x90
반응형
'Deep Learning > Natural Language Processing' 카테고리의 다른 글
Document Classification (vector space model) (0) | 2022.03.25 |
---|---|
[python] 3D 그래프 (0) | 2022.02.10 |
[python] 데이터 시각화_matplotlib (0) | 2022.02.10 |
[python]Numpy (0) | 2022.02.09 |
[python]Class (0) | 2022.02.09 |