请教一下“~”符号的用法

df2 = df.loc[~df[col].isin(special_attribute)]
已邀请:

小象a

赞同来自: fish 大保健

同学您好,非常感谢您的提问~~“~”符号在这里是取反的意思,表示对 df[col].isin(special_attribute) 这句返回的值取反,主要用于数据的 slicing。比如 df 是如下的格式:
[attach]6416[/attach]
我们希望从 df 中删去 special_attribute = ['H', 'I', 'J', 'K', 'L', 'M', 'N'] 中的列,但是注意到
[attach]6417[/attach]
df 中只有 'H', 'I', 'J' 是在 special_attribute 里面的,我们需要把 'K', 'L', 'M', 'N' 的列都去掉,从而得到以下的df2:
[attach]6418[/attach]
我们用 boolean 的操作进行 slicing。
1. 用isin(special_attribute) 判断每个 column 是否在 special_attribute里面,如果在就返回 True,否则返回 False。
2. 用 df[col] 对每个列都进行判断,由 df[col].isin(special_attribute) 返回针对每个列的 True/False 值,也就是 [False, False, False, False, False, False, False, True, True, True]。
3. 用 ~ 对 True/False 值列表进行取反,得到 [True, True, True, True, True, True, True, False, False, False]
4. 用 df.loc 选择出 boolean 值为 True 的前6列,得到 df2:
[attach]6418[/attach]
 
 
楼上瞎几把说!!!!明明是取col列的值不在special_attribute里的意思,然后输出数据集。

要回复问题请先登录注册