问题标签 [isin]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 使用 isin(list) 过滤数据帧时出现“ValueError:列必须与键长度相同”
我正在尝试根据列表中的值过滤数据框中的列,这是我的代码片段出错的地方(为简单起见,替换了值)
这是问题代码之前数据框的示例
这是我想要的 df 应该是什么样子
这是我收到的错误,这很奇怪,因为我昨天运行了这个确切的代码并且没有任何问题。这里有什么明显的东西我没看到吗?
python - 向量化“在”
我尝试将m
向量样本(带有整数条目)与m
评估一起构建。如果其条目之一是 number ,则x
对 shape向量(n,1)
进行评估。否则,它被评估为。
为了处理许多这样的向量和评估,样本向量存储在一个形状中,而评估存储在一个形状中。见代码:y=1
2
y=0
(n,m)
ndarray
(1,m)
ndarray
如何矢量化 的计算Y
?我试图用以下内容替换 和 的初始化/X
计算Y
:
一些执行表明这比我的第一种方法要慢一些。(实际上,这个分析器首先说这numpy.apply_along_axis
不是为了速度。我也不知道lambda
在这种情况下有多好。)
有没有办法对 的计算进行矢量化,即根据该列是否包含元素Y
来分配一个值1
或给每一列?0
2
python - Python:用 isin 或 wkn 调用 pandas_datareader 或将其转换为股票代码?
我有一份带有 ISIN 和 WKN-Number 的股票清单。我的目标是使用 pandas_datareader 现在从该股票中获取历史数据。我的问题是,功能例如
只能使用股票代码。是否有某种方法(可能是其他库)来解决该问题或某种算法将数字转换为股票代码?
pandas - 在没有 drop_duplicates 的情况下删除重复的 Pandas
请注意,在转向您之前,我已经浏览了各种帖子。事实上,我尝试实现中提供的解决方案:根据“不在”条件从数据帧中删除行
我的问题如下。假设我有一个巨大的数据框,我想删除其中的重复项。我很清楚我可以使用 drop_duplicates 因为它是最快的最简单的方法。但是,我们的老师希望我们创建一个包含重复项 ID 的列表,然后根据这些值是否包含在上述列表中来删除它们。
现在,让我们看看输出:
因此,我得出的结论是,我的代码以某种方式将要删除的行加倍并删除它们。
但是,当我遵循 drop_duplicates 方法时,我的代码运行良好并删除了 135 行。
你们中的任何人都可以帮助我理解为什么会发生这种情况吗?我试图尽可能简化这个问题。
非常感谢!
pandas - 检查子字符串是否在不同 DF 的字符串中,如果是则从另一行返回值
我想检查DF1的子字符串是否在DF2中。如果是我想返回相应行的值。
DF1
姓名 | ID | 地区 |
---|---|---|
约翰 | AAA | 一种 |
约翰 | AAA | 乙 |
拍 | CCC | C |
桑德拉 | CCC | D |
保罗 | DD | 乙 |
桑德拉 | R9D | F |
米娅 | dfg4 | G |
金 | asfdh5 | H |
路易丝 | 45gh | 一世 |
DF2
姓名 | ID | 公司 |
---|---|---|
约翰 | AAAxx1 | 微软 |
约翰 | AAAxxREG1 | 微软 |
迈克尔 | BBBER4 | 微软 |
拍 | CCCERG | 戴尔 |
拍 | CCCERGG | 戴尔 |
保罗 | DFHDHF |
期望的输出
其中来自 DF1 的 ID 在 DF2 的 ID 列中我想在 DF1 中创建一个与公司匹配的新列
姓名 | ID | 地区 | 公司 |
---|---|---|---|
约翰 | AAA | 一种 | 微软 |
约翰 | AAA | 乙 | 微软 |
拍 | CCC | C | 戴尔 |
桑德拉 | CCC | D | |
保罗 | DD | 乙 | |
桑德拉 | R9D | F | |
米娅 | dfg4 | G | |
金 | asfdh5 | H | |
路易丝 | 45gh | 一世 |
我有以下代码来确定来自 DF1 的 ID 是否在 DF2 中,但是我不确定如何输入公司名称。
DF1['Get company'] = np.in1d(DF1['ID'], DF2['ID'])
python - python中没有硬编码的条件
我试图找到一种方法来表示np.where()
代码中以外的条件。在我下面的例子中,
条件是
一种。df['col_a']=='101' 或
湾。df['col_a']=='337' 或
C。df['col_a']=='524'
有什么方法可以在代码外部表示这些条件?或者通过另一个python方法/函数?可以tkinter
提取这部分代码并编辑这些条件吗?希望找到一种方法可以在外部而不是在脚本内审查和管理这些条件等。
我已经尝试过np.isin()
,np.in1d
但收到了错误的结果:
输出:
从以下:
将df转换为numpy
同样产生了所有“假”匹配np.isin()
。谢谢你的想法。
python - Python:将 ISIN、WKN 或 RIC 转换为 Yahoo Ticker Symbol?
根据这里的这篇文章,我可以在libraryinvestpy的帮助下将 ISIN 转换为某种形式的股票代码。这种转换对大多数美国股票都是正确的。
但是这个符号本身在任何情况下都与我需要调用 pandas_dataframe 的股票代码不同。我认为更确切地说它符合 RIC 符号(例如看这里)。
例如,如果我尝试以下调用:
我的输出是:
但
给我一个错误。
我需要的正确调用是:
所以我的问题是:
- 有没有办法将 ISIN、WKN 或 RIC 转换为 DataReader 调用所需的代码符号 yahoo。
或更一般的
- 有没有办法通过 ISIN 的知识获取历史股票数据,也许是 WKN 或 RIC?
python - Pandas:在两个数据框中查找匹配的行(不使用`merge`)
假设我有这两个列数相同但行数可能不同的数据框:
我想验证 的行df2
是否与 的任何行匹配 df
,即我想获得一系列(或数组)的布尔值来给出这个结果:
我认为类似该方法的isin
方法应该可以工作,但是我得到了这个结果,这导致了一个数据框并且是错误的:
作为一个约束,我不希望使用该merge
方法,因为我所做的实际上是在应用合并之前检查数据。感谢您的帮助!
pandas - 使用现有列值作为过滤器在 pandas 中创建新列 - .isin() 因属性错误而失败
错误:AttributeError:“int”对象没有属性“isin”
问题:没有空值,在单独的代码块中工作。试图将R系列的数据类型修改为对象,错误:'str'对象没有属性'isin'
我错过了什么?
代码:
python - 检查列“long_date”中的哪些日期也在数组 Holy_date 中
我得到一个空的df,虽然我知道里面应该有一些行
任何想法如何解决这个问题?
第 7 行运行后的 df 如下所示:
长日期 | 国家 |
---|---|
2020-11-07 | 葡萄牙 |
2020-01-01 | 葡萄牙 |
Holy_date 看起来像这样:['2020-01-01','2020-01-06']