问题标签 [isin]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 在数据框过滤器中包含无
我有一个名为 df 的数据框:
我想使用 pandas.series.isin 过滤数据框,我想过滤来自 df 的数据,其中 col2 只包含数字 2,8 和 None,所以新的数据框是:
我试过了:
结果总是:
似乎我无法确定什么是 None 以及如何将其包含到过滤器中。
pandas - 如何导出两个数据帧中不常见的记录列表?
我有两个与证券相关的数据框——相同的结构/数据类型,只是大小不同。
我想做一个 vlookup 样式检查,以识别 df1 中但不在 df2 中的安全 ID,反之亦然。然后我想删除这些安全 ID,以便我有两个均衡的数据帧以供进一步分析。
我曾尝试使用以下方法来实现这一点,但无济于事:
理想情况下,这应该df1['sec_id_check']
用“True”和“False”填充,但我得到的只是所有 12,498 个条目的“True”。df2
我通过创建列反向重复了完全相同的方法df['sec_id_check']
,并且在所有 12,510 条记录中我再次得到了“真”
我知道一个事实,即两个数据集中都不存在证券——df1 中的 firefly123 在 df2 中不存在,google566 在 df2 中但不在 df1 中——我本以为这些已被标记为“假” ' 在我的测试中。
期待您的回复 - 非常感谢您提前!
pandas - 如何删除仅包含熊猫列表中值的每一列
我希望能够从我传入的列表中删除所有只有值的列。
在这个例子中,我想创建一个只有 C1、C3 和 C4 的数据框。
python - Python pandas在另一列的元素列表中查找一列的元素
这是我的问题,我想在数据框的 B 列元素列表中找到 A 列的元素。因此,我只想保留那些在 A 中找到元素的行:
工作正常,但我真正想要的是:
哪个不起作用,因为 A 中的元素没有与 B 列中列表的元素进行比较,而是与整个列表进行比较?
我想要的结果是:
那可能吗?
python - 如何使用 .isin 进行子集化(似乎无法正常工作)?
我是莫斯科国立大学的学生,我正在做一项关于郊区铁路的小型研究。我从维基百科爬取了有关莫斯科地区所有车站的信息,现在我需要对这些车站进行子集化,即莫斯科中央直径 1(铁路线)车站。我有一个直径 1 站 (d1_names) 的列表,我想做的是使用 isin pandas 方法从整个数据帧 (suburban_rail) 中提取子集。问题是它只返回 2 个站点(第一个和最后一个),尽管我很确定还有更多,因为使用 str.contains 和不存在的站点会返回我正在寻找的内容(所以它们在数据框中) . 我已经检查了拼写并尝试将 strip() 应用于数据框和站点列表的每个元素。附上我的代码的几个屏幕截图。
提前致谢!
pandas - 跨 2 列用于 groupby 的 Isin
当我知道要在 df1 中匹配的数据将分布在 2 列(标题、ID)中时,如何将 isin 与或(?)一起使用。
如果您删除 ' 或 df1[df1.ID.isin(df2[column])] ',则下面的代码有效
期望的输出:
python - 为一个数据框中的行列组合生成一个列表,其中第二个数据框中的数据包含更多列值组合
我需要为每个国家/地区生成不同年份的人口列表。我需要的信息包含在两个数据框中
第一个数据框 gni_per_capita 包含国家和年份的名称。此数据框中的国家/地区具有不同的年份范围
第二个数据框 hihd 也有国家名称和日期,但国家列表更广泛,每个国家的日期范围更广。第二个数据框包含每个国家每年的人口,第二个没有。
我需要为第一个数据框中的每个国家/地区每年生成一份人口列表。
我得到了以下提示:
到目前为止,我已经从第一个数据框中创建了一个包含国家和年份的系列
但是,我正在努力将第二个数据框与创建的系列相结合
pandas - 如何使用 isin 有条件地创建 Pandas 列?
我有以下数据框:
我需要创建一个新的列'case statement'样式:
新列应该只在 countryList 中列出这三个国家,或者说“其他”。但是当我运行上面的代码时,它只会复制原始列。这是我在处理数据时经常需要的东西,每当我搜索时,我都找不到任何不涉及我想避免的循环的东西。
我希望有一种单行、易于理解和直接的方式,它使用 ISIN 函数基本上完成我通常在 sql case 语句中所做的事情。
编辑:表明这是一个重复链接的链接,该链接指向未在单个答案中使用 isin 的页面。我在原始问题上特别询问了如何使用 isin 来执行此操作,并且如果无法使用 isin ,我只会接受不同的解决方案。
python - Dataframe 索引行比较和删除
再会,
我需要一些建议我有两个数据框。一个包含数百行,另一个包含六个。两个帧的时间戳都被索引。我想将 df1 中的索引值与 df2 进行比较,并仅保留与 df2 中的时间戳匹配的行。
所以只有第 0、3 和 4 行应该保留在 d1 中