如何在 Pandas 中使用默认值向现有 DataFrame 添加新列

如何在 Pandas 中使用默认值向现有 DataFrame 添加新列

已邀请:
先定义一个dataframe
import pandas as pd

dates=['April-10', 'April-11', 'April-12', 'April-13']
fruits=['Apple', 'Papaya', 'Banana', 'Mango']
prices=[3, 1, 2, 4]

df = pd.DataFrame({'Date':dates ,
'Fruit':fruits ,
'Price': prices})

print(df)
输出:

Date Fruit Price
0 April-10 Apple 3
1 April-11 Papaya 1
2 April-12 Banana 2
3 April-13 Mango 4
1.pandas.DataFrame.assign() 在 Pandas DataFrame 中添加新列
我们可以使用 pandas.DataFrame.assign() 方法向现有的 DataFrame 添加新列,并为新创建的 DataFrame 列分配默认值。
import pandas as pd

dates=['April-10', 'April-11', 'April-12', 'April-13']
fruits=['Apple', 'Papaya', 'Banana', 'Mango']
prices=[3, 1, 2, 4]

df = pd.DataFrame({'Date':dates ,
'Fruit':fruits ,
'Price': prices})

new_df=df.assign(Profit=6)
print(new_df)
输出:

Date Fruit Price Profit
0 April-10 Apple 3 6
1 April-11 Papaya 1 6
2 April-12 Banana 2 6
3 April-13 Mango 4 6

该代码在 DataFrame 中创建一个新列 Profit,并将整个列的值设置为 6。
2.访问新列以将其设置为默认值
我们可以使用 DataFrame 索引在 DataFrame 中创建新列并将其设置为默认值。

语法:

df[col_name]=value
它在 DataFrame df 中创建一个新列 col_name,并将整个列的默认值设置为 value。
import pandas as pd

dates=['April-10', 'April-11', 'April-12', 'April-13']
fruits=['Apple', 'Papaya', 'Banana', 'Mango']
prices=[3, 1, 2, 4]

df = pd.DataFrame({'Date':dates ,
'Fruit':fruits ,
'Price': prices})

df['Profit']=5
print(df)
输出:

Date Fruit Price Profit
0 April-10 Apple 3 5
1 April-11 Papaya 1 5
2 April-12 Banana 2 5
3 April-13 Mango 4 5
3.pandas.DataFrame.insert() 在 Pandas DataFrame 中添加新列
pandas.DataFrame.insert() 允许我们在 DataFrame 中在指定位置插入列。

语法:

DataFrame.insert(loc, column, value, allow_duplicates=False)
它在位置 loc 处创建一个名称为 column 的新列,默认值为 value。allow_duplicates = False 确保 dataFrame 中只有一列名为 column 的列。

import pandas as pd

dates=['April-10', 'April-11', 'April-12', 'April-13']
fruits=['Apple', 'Papaya', 'Banana', 'Mango']
prices=[3, 1, 2, 4]

df = pd.DataFrame({'Date':dates ,
'Fruit':fruits ,
'Price': prices})

df.insert(2, "profit", 4, allow_duplicates=False)
print(df
输出:

Date Fruit profit Price
0 April-10 Apple 4 3
1 April-11 Papaya 4 1
2 April-12 Banana 4 2
3 April-13 Mango 4 4
在这里,名称为 profit 的列被插入到索引 2,默认值为 4。

要回复问题请先登录注册