一 pandas DataFrame一列賦值問(wèn)題
說(shuō)明,把b的列賦值給a
情況1:a,b index設(shè)置相同
如下代碼
import pandas as pd
import numpy as np
a = pd.DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('wxyz'))
b = pd.DataFrame(np.array([11,22,33,44]),index=list('abcd'),columns=['m'])
a['m'] = b['m']
print(a)
上述代碼結(jié)果如下
w x y z m
a 0 1 2 3 11
b 4 5 6 7 22
c 8 9 10 11 33
d 12 13 14 15 44
情況一是最基本的情況,結(jié)果也符合預(yù)期,之所以符合預(yù)期是因?yàn)閍,b都設(shè)有同樣的index,賦值操作按照index來(lái)到。如果b不設(shè)置Index,而是使用默認(rèn)的index呢?
情況2:b的index采用默認(rèn)值
代碼如下
import pandas as pd
import numpy as np
a = pd.DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('wxyz'))
b = pd.DataFrame(np.array([11,22,33,44]),columns=['m'])
a['m'] = b['m']
print(a)
結(jié)果如下
w x y z m
a 0 1 2 3 NaN
b 4 5 6 7 NaN
c 8 9 10 11 NaN
d 12 13 14 15 NaN
情況二,結(jié)果超出了想象,b中的index為0,1,2,3與a中的index(‘a(chǎn)',‘b',‘c',‘d')不同,在賦值的過(guò)程中,是按照a中的index在b中找index相同位置的值,由于index不同,因此,給a賦值為NaN
情況三 : b中的部分Index與a中的相同
代碼如下
import pandas as pd
import numpy as np
a = pd.DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('wxyz'))
b = pd.DataFrame(np.array([11,22,33,44]),index=list('arpb'),columns=['m'])
a['m'] = b['m']
print(a)
結(jié)果如下
w x y z m
a 0 1 2 3 11.0
b 4 5 6 7 44.0
c 8 9 10 11 NaN
d 12 13 14 15 NaN
由情況三結(jié)果可知,只有Index相同的行,賦值才能成功
總結(jié):
從以上可以看出,Pandas DataFrame嚴(yán)格按照Index進(jìn)行賦值,如果Index不同的話(huà),則賦值為NaN
補(bǔ)充:python編程過(guò)程中DataFrame修改特定單元格值后原數(shù)據(jù)不變的一個(gè)解決方案
最近在參加了一個(gè)比賽,里面設(shè)計(jì)到數(shù)據(jù)清洗的工作,需要對(duì)一些異常值作出修改,往常我都是這樣操作的
df[condition]['column'].iloc[0:3] = ......
或者
df[condition]['column'][0:3] = ......
里面condition代表滿(mǎn)足條件的邏輯表達(dá)式,column表示列名
一般還是管用的,但偶爾會(huì)出現(xiàn)錯(cuò)誤,主要是df[condition]這種表達(dá)在python里面是不夠規(guī)范的,因此運(yùn)行以后單元格容易賦值失敗。在嘗試了很多種方法之后,最后還是使用規(guī)范的loc或者iloc表達(dá)
df.loc[[row condition],['column']] = ......
例如:
NA.loc[[23,29,49],'北美整體規(guī)模'] = ......
或者
df.iloc[np.where(condition),[1:3]]
注意loc里面接的是具體的行列名稱(chēng),iloc里面接的是滿(mǎn)足條件的行列名稱(chēng)所對(duì)應(yīng)的位置數(shù)字列表,切忌弄混!
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
您可能感興趣的文章:- 對(duì)pandas將dataframe中某列按照條件賦值的實(shí)例講解
- pandas.DataFrame 根據(jù)條件新建列并賦值的方法
- 淺談Pandas dataframe數(shù)據(jù)處理方法的速度比較
- 使用pandas忽略行列索引,縱向拼接多個(gè)dataframe
- Pandas.DataFrame轉(zhuǎn)置的實(shí)現(xiàn)
- Pandas中DataFrame交換列順序的方法實(shí)現(xiàn)
- 詳解pandas中利用DataFrame對(duì)象的.loc[]、.iloc[]方法抽取數(shù)據(jù)
- Pandas中兩個(gè)dataframe的交集和差集的示例代碼