问题标签 [isin]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
44 浏览

python - 在数据框过滤器中包含无

我有一个名为 df 的数据框:

我想使用 pandas.series.isin 过滤数据框,我想过滤来自 df 的数据,其中 col2 只包含数字 2,8 和 None,所以新的数据框是:

我试过了:

结果总是:

似乎我无法确定什么是 None 以及如何将其包含到过滤器中。

0 投票
2 回答
24 浏览

pandas - 如何导出两个数据帧中不常见的记录列表?

我有两个与证券相关的数据框——相同的结构/数据类型,只是大小不同。

我想做一个 vlookup 样式检查,以识别 df1 中但不在 df2 中的安全 ID,反之亦然。然后我想删除这些安全 ID,以便我有两个均衡的数据帧以供进一步分析。

我曾尝试使用以下方法来实现这一点,但无济于事:

理想情况下,这应该df1['sec_id_check']用“True”和“False”填充,但我得到的只是所有 12,498 个条目的“True”。df2我通过创建列反向重复了完全相同的方法df['sec_id_check'],并且在所有 12,510 条记录中我再次得到了“真”

我知道一个事实,即两个数据集中都不存在证券——df1 中的 firefly123 在 df2 中不存在,google566 在 df2 中但不在 df1 中——我本以为这些已被标记为“假” ' 在我的测试中。

期待您的回复 - 非常感谢您提前!

0 投票
1 回答
25 浏览

pandas - 如何删除仅包含熊猫列表中值的每一列

我希望能够从我传入的列表中删除所有只有值的列。

在这个例子中,我想创建一个只有 C1、C3 和 C4 的数据框。

0 投票
1 回答
1085 浏览

python - Python pandas在另一列的元素列表中查找一列的元素

这是我的问题,我想在数据框的 B 列元素列表中找到 A 列的元素。因此,我只想保留那些在 A 中找到元素的行:

工作正常,但我真正想要的是:

哪个不起作用,因为 A 中的元素没有与 B 列中列表的元素进行比较,而是与整个列表进行比较?

我想要的结果是:

那可能吗?

0 投票
1 回答
37 浏览

python - 如何使用 .isin 进行子集化(似乎无法正常工作)?

我是莫斯科国立大学的学生,我正在做一项关于郊区铁路的小型研究。我从维基百科爬取了有关莫斯科地区所有车站的信息,现在我需要对这些车站进行子集化,即莫斯科中央直径 1(铁路线)车站。我有一个直径 1 站 (d1_names) 的列表,我想做的是使用 isin pandas 方法从整个数据帧 (suburban_rail) 中提取子集。问题是它只返回 2 个站点(第一个和最后一个),尽管我很确定还有更多,因为使用 str.contains 和不存在的站点会返回我正在寻找的内容(所以它们在数据框中) . 我已经检查了拼写并尝试将 strip() 应用于数据框和站点列表的每个元素。附上我的代码的几个屏幕截图。

郊区铁路数据框

我用来子集的电台列表

isin 返回什么

手动检查 Bakovka 站

手动检查 Nemchinovka 站

提前致谢!

0 投票
1 回答
50 浏览

pandas - 跨 2 列用于 groupby 的 Isin

当我知道要在 df1 中匹配的数据将分布在 2 列(标题、ID)中时,如何将 isin 与或(?)一起使用。

如果您删除 ' 或 df1[df1.ID.isin(df2[column])] ',则下面的代码有效

期望的输出:

0 投票
1 回答
89 浏览

python - 为一个数据框中的行列组合生成一个列表,其中第二个数据框中的数据包含更多列值组合

我需要为每个国家/地区生成不同年份的人口列表。我需要的信息包含在两个数据框中

  1. 第一个数据框 gni_per_capita 包含国家和年份的名称。此数据框中的国家/地区具有不同的年份范围

  2. 第二个数据框 hihd 也有国家名称和日期,但国家列表更广泛,每个国家的日期范围更广。第二个数据框包含每个国家每年的人口,第二个没有。

我需要为第一个数据框中的每个国家/地区每年生成一份人口列表。

我得到了以下提示:

到目前为止,我已经从第一个数据框中创建了一个包含国家和年份的系列

但是,我正在努力将第二个数据框与创建的系列相结合

0 投票
1 回答
127 浏览

pandas - 如何使用 isin 有条件地创建 Pandas 列?

我有以下数据框:

我需要创建一个新的列'case statement'样式:

新列应该只在 countryList 中列出这三个国家,或者说“其他”。但是当我运行上面的代码时,它只会复制原始列。这是我在处理数据时经常需要的东西,每当我搜索时,我都找不到任何不涉及我想避免的循环的东西。

我希望有一种单行、易于理解和直接的方式,它使用 ISIN 函数基本上完成我通常在 sql case 语句中所做的事情。

编辑:表明这是一个重复链接的链接,该链接指向未在单个答案中使用 isin 的页面。我在原始问题上特别询问了如何使用 isin 来执行此操作,并且如果无法使用 isin ,我只会接受不同的解决方案。

0 投票
4 回答
60 浏览

python - Dataframe 索引行比较和删除

再会,

我需要一些建议我有两个数据框。一个包含数百行,另一个包含六个。两个帧的时间戳都被索引。我想将 df1 中的索引值与 df2 进行比较,并仅保留与 df2 中的时间戳匹配的行。

所以只有第 0、3 和 4 行应该保留在 d1 中

0 投票
1 回答
113 浏览

python - isin 假期只识别第一个小时

我在西班牙创建了一个假期类

然后我生成了一个大小等于我的数据框中的日期列

这给出了以下

在此处输入图像描述

为了生成df带有假期的列,由列中的值产生"Date",我已经完成了

然而,正如人们可以从holidays输出的图像中猜到的那样,如果一个人正在处理每小时数据,在这种情况下,它只会在第一个小时(时间为 00:00)选择为假期。

我应该如何进行,以便在分析中holidays忽略小时,并为特定的假日日期分配相应的值。


编辑

两个都

给出与上图相同的输出。