In [66]:
[ {'bikes': 20, "pants" : 30, "watches" : 35, "glasses" : 4} ]
Out[66]:
[{'bikes': 20, 'pants': 30, 'watches': 35, 'glasses': 4}]
In [67]:
new_item = [ {'bikes': 20, "pants" : 30, "watches" : 35, "glasses" : 4} ]
In [68]:
pd.DataFrame(data = new_item, index = ["store 3"])
Out[68]:
bikes | pants | watches | glasses | |
---|---|---|---|---|
store 3 | 20 | 30 | 35 | 4 |
In [69]:
new_store = pd.DataFrame(data = new_item, index = ["store 3"])
In [70]:
new_store
Out[70]:
bikes | pants | watches | glasses | |
---|---|---|---|---|
store 3 | 20 | 30 | 35 | 4 |
In [73]:
# df에, 새로만든 new_store를, 행으로 추가
In [76]:
df = df.append(new_store)
C:\Users\5-10\AppData\Local\Temp\ipykernel_5756\2676567635.py:1: FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead. df = df.append(new_store)
In [77]:
df
Out[77]:
bikes | pants | watches | glasses | shirts | suits | |
---|---|---|---|---|---|---|
store 1 | 20 | 30 | 35 | NaN | 15.0 | 45.0 |
store 2 | 15 | 5 | 20 | 50.0 | 2.0 | 7.0 |
store 3 | 20 | 30 | 35 | 4.0 | NaN | NaN |
In [78]:
# 데이터를 삭제하는 방법
# 행 삭제? 열삭제? => 2가지 방법으로 삭제하는것을 의미
In [79]:
# drop() 함수를 이용하고, axis 만 설정해주면 된다.
In [80]:
df
Out[80]:
bikes | pants | watches | glasses | shirts | suits | |
---|---|---|---|---|---|---|
store 1 | 20 | 30 | 35 | NaN | 15.0 | 45.0 |
store 2 | 15 | 5 | 20 | 50.0 | 2.0 | 7.0 |
store 3 | 20 | 30 | 35 | 4.0 | NaN | NaN |
In [81]:
# store 2 행 삭제
df.drop("store 2" , axis=0)
Out[81]:
bikes | pants | watches | glasses | shirts | suits | |
---|---|---|---|---|---|---|
store 1 | 20 | 30 | 35 | NaN | 15.0 | 45.0 |
store 3 | 20 | 30 | 35 | 4.0 | NaN | NaN |
In [ ]:
# df.drop("store 2") 만해도 동일한 아웃풋을 준다
# 이유는 axis 디폴트가 0 으로 설정되어있기때문
In [ ]:
# glasses 컬럼 삭제
In [82]:
df.drop("glasses" , axis = 1)
Out[82]:
bikes | pants | watches | shirts | suits | |
---|---|---|---|---|---|
store 1 | 20 | 30 | 35 | 15.0 | 45.0 |
store 2 | 15 | 5 | 20 | 2.0 | 7.0 |
store 3 | 20 | 30 | 35 | NaN | NaN |
In [83]:
# pants 컬럼과 suits 컬럼을 삭제하세요
In [84]:
df.drop(["pants","suits"],axis = 1)
Out[84]:
bikes | watches | glasses | shirts | |
---|---|---|---|---|
store 1 | 20 | 35 | NaN | 15.0 |
store 2 | 15 | 20 | 50.0 | 2.0 |
store 3 | 20 | 35 | 4.0 | NaN |
In [85]:
df
Out[85]:
bikes | pants | watches | glasses | shirts | suits | |
---|---|---|---|---|---|---|
store 1 | 20 | 30 | 35 | NaN | 15.0 | 45.0 |
store 2 | 15 | 5 | 20 | 50.0 | 2.0 | 7.0 |
store 3 | 20 | 30 | 35 | 4.0 | NaN | NaN |
In [86]:
# store 3 를 last store 로 인덱스를 변경하자.
In [87]:
df.rename(index= {"store 3":"last store"} )
Out[87]:
bikes | pants | watches | glasses | shirts | suits | |
---|---|---|---|---|---|---|
store 1 | 20 | 30 | 35 | NaN | 15.0 | 45.0 |
store 2 | 15 | 5 | 20 | 50.0 | 2.0 | 7.0 |
last store | 20 | 30 | 35 | 4.0 | NaN | NaN |
In [88]:
df.rename(index= {"store 3" : "last store" , "store 1" : "first store"})
Out[88]:
bikes | pants | watches | glasses | shirts | suits | |
---|---|---|---|---|---|---|
first store | 20 | 30 | 35 | NaN | 15.0 | 45.0 |
store 2 | 15 | 5 | 20 | 50.0 | 2.0 | 7.0 |
last store | 20 | 30 | 35 | 4.0 | NaN | NaN |
In [89]:
# bikes 컬럼은 hat 으로, suits 컬럼은 shoes 로 바꿔주세요
In [90]:
df.rename(columns= {"bikes" : "hat", "suits":"shoes"})
Out[90]:
hat | pants | watches | glasses | shirts | shoes | |
---|---|---|---|---|---|---|
store 1 | 20 | 30 | 35 | NaN | 15.0 | 45.0 |
store 2 | 15 | 5 | 20 | 50.0 | 2.0 | 7.0 |
store 3 | 20 | 30 | 35 | 4.0 | NaN | NaN |
In [ ]:
In [91]:
# 새로운 컬럼 name 을 만들되
# A, B, C 로 컬럼 추가해 주세요
In [147]:
df["name"] = ["A","B","C"]
In [148]:
df
Out[148]:
name | bikes | pants | watches | glasses | shirts | suits | |
---|---|---|---|---|---|---|---|
0 | A | 20 | 30 | 35 | NaN | 15.0 | 45.0 |
1 | B | 15 | 5 | 20 | 50.0 | 2.0 | 7.0 |
2 | C | 20 | 30 | 35 | 4.0 | NaN | NaN |
In [139]:
# name 컬럼의 값을, 인덱스로 만들자
In [140]:
df.set_index("name", inplace = True) # inplace = True 는 df = 와 같은 의미
In [141]:
df.values
Out[141]:
array([[20., 30., 35., nan, 15., 45.], [15., 5., 20., 50., 2., 7.], [20., 30., 35., 4., nan, nan]])
In [142]:
df
Out[142]:
bikes | pants | watches | glasses | shirts | suits | |
---|---|---|---|---|---|---|
name | ||||||
A | 20 | 30 | 35 | NaN | 15.0 | 45.0 |
B | 15 | 5 | 20 | 50.0 | 2.0 | 7.0 |
C | 20 | 30 | 35 | 4.0 | NaN | NaN |
In [143]:
# 인덱스를 원래대로 초기화 시키고 싶다.(컴퓨터가 매기는 인덱스) 시키고 싶다.
In [144]:
df.reset_index(inplace= True)
In [146]:
df
Out[146]:
name | bikes | pants | watches | glasses | shirts | suits | |
---|---|---|---|---|---|---|---|
0 | A | 20 | 30 | 35 | NaN | 15.0 | 45.0 |
1 | B | 15 | 5 | 20 | 50.0 | 2.0 | 7.0 |
2 | C | 20 | 30 | 35 | 4.0 | NaN | NaN |
In [145]:
df.values
Out[145]:
array([['A', 20, 30, 35, nan, 15.0, 45.0], ['B', 15, 5, 20, 50.0, 2.0, 7.0], ['C', 20, 30, 35, 4.0, nan, nan]], dtype=object)
'DataScience > Pandas' 카테고리의 다른 글
Pandas NaN을 처리하는 전략 dropna(), fillna() (0) | 2022.11.24 |
---|---|
Pandas CSV파일불러오기, .describe() 통계, .info()정보 (0) | 2022.11.24 |
Pandas .iloc[ , ], 데이터 프레임에서 컬럼 만드는 방법 (0) | 2022.11.24 |
Pandas Dataframe, Nan의 의미, 데이터프레임 엑세스 (0) | 2022.11.23 |
Pandas Series, 레이블과 인덱스, Operations (0) | 2022.11.23 |