问题标签 [pandas-loc]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - loc[~*value*]的含义和实现
看书中的这段代码:
以前从未见过这个 loc[~<..>] 。可能了解功能,但要确定。它也只适用于 pandas 或一般的 python 吗?
python - 如何仅获取具有特定条件的数据帧的第二个索引
首先,我对python很陌生,所以请放轻松。
我需要从数据框中获取某个值。
我得到了这个代码:
第一个输入的数据框:
输入:
输出:
第二个输入的数据框:
输出:
好吧,我正在尝试检查第一个数据框中的日期是否在第二个数据框中并且(而股票名称相同)。
此代码不会转到下一个可迭代对象。我认为这是因为第二个输出给了我股票名称和日期,而不仅仅是日期。
pandas - Pandas 定位多个条件
我有一个数据框,我想删除 A 列等于蓝色且 B 列等于绿色的所有行。
我虽然下面应该工作,但事实并非如此。
任何人都可以看到问题
python - 如何在 pandas loc 过滤条件中传递“Take All”参数?
我有一个带有参数的函数(在这种情况下:“部门”)从我的数据集中过滤(df.loc [(df ['A'] ==部门)特定数据。在一种情况下,我想使用它具体功能,但不是过滤数据,我想获取所有数据。
有没有办法传递一个会导致类似 df.loc[(df['A'] == *)或 df.loc[(df['A'] == %) 的参数
pandas - 如何根据布尔值对数据求和?
创建了名为项目的字典。不同键的组合值并放入变量 food_list。
我试图根据字典值查找字符串。如果字符串在字典中,则数据框中的行包含该字符串。我取它关联的金额并将符合条件的总行金额相加。
我通常运行代码并得到
python - Is there a way to locate a data frame between a set of date ranges?
I have seen many ways to locate a data frame for one date range,
i.e.
but I can't find out how to do this if I had multiple date ranges
i.e.
I would need something like
but of course this doesn't work for a variety of reasons (you need an or statement between the ands, and you cant append these masks in this way)
could anybody give me a nudge in the right direction?
python - 使用 Dask DataFrame loc 更改列值
我有一个庞大的数据库,我需要根据特定条件更改列的值。
在 Pandas 中,我执行以下代码来完成我想要的:
我怎样才能在 Dask 中做类似的事情?
python - 使用字典替换DataFrame中句子中的单词
我正在尝试用字典替换数据框中句子中的单词。如何替换原始数据框?
字典:rep_vocab 包含{wrong words: correct words}
数据框:data_test 列 ['question1'] 句子列 ['d5'] 包含一组在句子中拼写错误的单词。我使用此列快速定位有错误单词的句子行。
我的代码:
它返回正确的结果,但数据框中的原始值不会改变。我尝试了其他方法,例如 use inplace=True
,但它引发了警告:
试图在 DataFrame 中的切片副本上设置一个值。尝试改用 .loc[row_indexer,col_indexer] = value
python - 如果列中的总和等于 n,则将 n 行作为输入并返回列名的函数
我有一个大DataFrame
的结构如下:
我正在尝试构建一个函数,该函数将n行名称作为参数求和所有列中的值,如果这些列的总和等于n ,则返回我的列名称。
例如,使用 label1、label2 和 label3 作为输入,我想获得以下输出:
或者
我对在 Python 中构建函数知之甚少,但我的头脑确实停留在这一点上。你能帮我进步吗?
python - 为什么 df.loc 不适用于我的 DataFrame?
df.loc 函数似乎不适用于我的 DataFrame。我认为这与我选择的读者图书馆有关。由于我正在导入一个 .sav 文件 b' ' 前缀出现在每一列中,所以在 name 列中,出现了 df['name'] b'Steve'。
我已使用 .str.decode('utf-8') 删除此前缀,但我似乎无法使用 df.loc[df['name'] == 'Sam'] 对我的 df 进行切片。这里发生了什么?