请教一下“~”符号的用法

df2 = df.loc[~df[col].isin(special_attribute)]

小象老师a

赞同来自: fish 大保健

同学您好,非常感谢您的提问~~“~”符号在这里是取反的意思,表示对 df[col].isin(special_attribute) 这句返回的值取反,主要用于数据的 slicing。比如 df 是如下的格式:
1225_slicing.png
我们希望从 df 中删去 special_attribute = ['H', 'I', 'J', 'K', 'L', 'M', 'N'] 中的列,但是注意到
1225_slicing_special_attribute.png
df 中只有 'H', 'I', 'J' 是在 special_attribute 里面的,我们需要把 'K', 'L', 'M', 'N' 的列都去掉,从而得到以下的df2:
1225_slicing_df2.png
我们用 boolean 的操作进行 slicing。 1. 用isin(special_attribute) 判断每个 column 是否在 special_attribute里面,如果在就返回 True,否则返回 False。 2. 用 df[col] 对每个列都进行判断,由 df[col].isin(special_attribute) 返回针对每个列的 True/False 值,也就是 [False, False, False, False, False, False, False, True, True, True]。 3. 用 ~ 对 True/False 值列表进行取反,得到 [True, True, True, True, True, True, True, False, False, False] 4. 用 df.loc 选择出 boolean 值为 True 的前6列,得到 df2:
1225_slicing_df2.png
   

@5f34002936f9b

赞同来自:

楼上瞎几把说!!!!明明是取col列的值不在special_attribute里的意思,然后输出数据集。

要回复问题请先登录注册