基礎
以下操作基于python 3.6 windows 10 環(huán)境下 通過
將通過實例來演示三者的區(qū)別
toward_dict = {1: '東', 2: '南', 3: '西', 4: '北'}
df = pd.DataFrame({'house' : list('AABCEFG'),
'price' : [100, 90, '', 50, 120, 150, 200],
'toward' : ['1','1','2','3','','3','2']})
df
map()方法
通過df.(tab)鍵,發(fā)現(xiàn)df的屬性列表中有apply() 和 applymap(),但沒有map().
map()是python 自帶的方法, 可以對df某列內的元素進行操作, 我個人最常用的場景就是有toward_dict
的映射關系 ,為df中的toward
匹配出結果,
df['朝向'] = df.toward.map(toward_dict);df
結果就是沒有匹配出來, why???
因為df.toward
這列數字是str型的, toward_dict
中的key是int型,下面修正操作下:兩個思路:
第一種思路:`toward_dict`的key轉換為str型
toward_dict2 = dict((str(key), val) for key, val in toward_dict.items())
# 第二種思路, 將df.toward轉為int型
df.toward = df.toward.map(lambda x: np.nan if x == '' else x).map(int,na_action='ignore')
df['朝向2'] = df.toward.map(toward_dict);df
apply() 方法
更新時間: 2018-08-10
我目前的實際工作中使用apply()
方法比較少, 所以整理的內容比較簡陋, 后續(xù)涉及到數據分析方面可能會應用比較多些.
先將上面的測試中的map
替換為apply
,看看怎么樣?
結果報錯了, ValueError
, 還是老老實實寫實際操作例子吧 ?
參考DataFrame.apply官方文檔
文檔中第一個參數:
func : function
Function to apply to each column or row.
意思即是, 將傳入的func
應用到每一列或每一行,進行元素級別的運算
第二個參數:
axis : {0 or ‘index', 1 or ‘columns'}, default 0
Axis along which the function is applied:
0 or ‘index': apply function to each column. # 注意這里的解釋
1 or ‘columns': apply function to each row.
舉例:
這個要特別注意的,
沒有繼續(xù)使用map里的DF, 是因為df.house是字符串, 不能進行np.sum
運算,會報錯.
2018年12月3日
新增:
最近在工作中使用到了pandas.apply()
方法,更新如下:
背景介紹:
一個 df
有三個列需要進行計算,change_type
值 為1和0, 1為漲價,0為降價, price
為現(xiàn)價, changed
為漲降價的絕對值, 現(xiàn)求:漲降價的比例, 精確到0位,無小數位,
解決思路:
1.最主要的計算是: 漲降價的絕對值/ 原價
2.最主要的難點是: 漲價的原價 = 現(xiàn)價 - 絕對值
降價的原價 = 現(xiàn)價 + 絕對值
偽代碼如下: 漲降價比例 = round(changed/(price 加上或減去 changed), 0)
就是我需求的結果了.
解決方案 如下:
以下代碼經過win 10 環(huán)境 python3.6 版本測試通過
import pandas as pd
df = pd.DataFrame({'change_type' : [1,1,0,0,1,0],
'price' : [100, 90, 50, 120, 150, 200],
'changed' : [10,8,4,11,14,10]})
def get_round(change_type, price, changed_val):
"""
策略設計
"""
if change_type == 0:
return round(changed_val/(price + changed_val) * 100, 2)
elif change_type == 1:
return round(changed_val/(price - changed_val) * 100, 2)
else:
print(f'{change} is not exists')
# 策略實現(xiàn)
df['round'] = df.apply(lambda x: get_round(x['change_type'], x['price'], x['changed']),axis=1)
若有問題, 歡迎指正, 謝謝
applymap()
參考DataFrame.applymap官方文檔:
func : callable
Python function, returns a single value from a single value.
文檔很簡單, 只有一個參數, 即傳入的func
方法
樣例參考文檔吧, 沒有比這個更簡單了
總結:
map() 方法是pandas.series.map()方法, 對DF中的元素級別的操作, 可以對df的某列或某多列, 可以參考文檔
apply(func) 是DF的屬性, 對DF中的行數據或列數據應用func
操作.
applymap(func) 也是DF的屬性, 對整個DF所有元素應用func
操作
到此這篇關于pandas map(),apply(),applymap()區(qū)別解析的文章就介紹到這了,更多相關pandas map(),apply(),applymap()內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- pandas使用函數批量處理數據(map、apply、applymap)
- Pandas對DataFrame單列/多列進行運算(map, apply, transform, agg)
- 淺談Pandas中map, applymap and apply的區(qū)別