Deep Learning/Natural Language Processing

[python]Pandas

frances._.sb 2022. 2. 9. 16:04
728x90
  • Pandas 개요

Pandas 에는 SeriesDataFrame의 두가지 데이터 구조가 존재한다. 주로 사용되는 데이터 구조는 2차원 구조인 DataFrame 이다.

 

 

  • 데이터 참조

DataFrame의 데이터는 행과 열을 지정해서 참조할 수 있다. 여러가지 참조방법이 있지만 행에 대하여 추출할 때는 loc, 열에 대하여 추출할 때는 iloc를 자주 이용한다.

import pandas as pd

data = {"fruits" : ["apple", "orange", "banana","strawberry", "kiwifruit"],
        "year" : [2001,2002,2001,2008,2006],
        "time" : [1,4,5,6,3]}
df = pd.DataFrame(data)

print(df)
-------------------------------------------------------------------------------------
       fruits  year  time
0       apple  2001     1
1      orange  2002     4
2      banana  2001     5
3  strawberry  2008     6
4   kiwifruit  2006     3
_________________________________________________________________________________________
df = df.loc[[1,2],["time","year"]]
print(df)
--------------------------------------------------------------------------------------
   time  year
1     4  2002
2     5  2001

 

 

 

Example.

import pandas as pd

index = ["광수","민호","소희","태양","영희"]
columns = ["국어","수학","사회","과학","영어"]
data = [[30,45,12,45,87],[65,47,83,17,58],[64,63,86,57,46],[38,47,62,91,63],[65,36,85,94,36]]
df = pd.DataFrame(data, index = index, columns = columns)

#df에 "제목"이라는 새 열을 만들고 pe_column의 데이터를 추가하세요.
pe_column = pd.Series([56,43,73,82,62], index = ["광수","민호","소희","태양","영희"])
df["제목"] = pe_column
print(df)
print()

#수학을 오름차순으로 정렬하세요.
df1 = df.sort_values(by = "수학",ascending = True)
print(df1)
print()

#df1의 각 요소에 5점을 더하세요.
df2 = df1 + 5
print(df2)
print()

#df의 통계 정보 중에서 "mean","max","min"을 출력하세요.
print(df2.describe().loc[["mean","max","min"]])
728x90
반응형

'Deep Learning > Natural Language Processing' 카테고리의 다른 글

Document Classification (vector space model)  (0) 2022.03.25
[python] 3D 그래프  (0) 2022.02.10
[python] 데이터 시각화_matplotlib  (0) 2022.02.10
[python]Numpy  (0) 2022.02.09
[python]Class  (0) 2022.02.09