问题标签 [python-applymap]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 根据 pandas 中的字符串用 NaN 替换列
我有以下数据框
我想替换所有包含Set Nullto的列值,Nan所以我采用了以下方式
但这并没有改变任何东西
但是当我只打印csv_data.applymap(lambda element: set_NaN(element))如下时,我可以看到输出,但是当分配回来时,我无法获得我想要的数据
那么如何根据特定字符串将列值替换为 NaN 呢?
python - 是否可以在熊猫中使用 groupby 进行应用映射?
applymap(somefunction)在我想使用的熊猫数据框中groupby(使用一些列索引值)。
mcve_01.txt
我编写了函数来对 A、B、C、D 列进行一些分析,其中 A、B、C 和 D 中的值是列表。
说功能是,
最后:
这给了我(最终输出):
因此,如果我想为整个数据帧运行函数(mapfun)而不进行分组,则此代码有效。但是,我想通过按索引值对它们进行分组来运行该函数。
不幸的是,我没有看到任何 groupby 和 applymap 在一起的例子。
然后我尝试重新索引索引列,然后将函数(mapfun)包装在 apply 中,但这不起作用。
我没有收到任何错误,但是在尝试分组然后应用时功能部分搞砸了。
我得到的输出:
预期输出:
与最终输出相同,但输出(功能部分)按公共索引值分组
现在,我想通过使用列或索引之一中的值对数据/帧进行分组来获取此功能并在此列中应用映射。
我尝试重置索引,然后使用索引名称进行分组。但是,def fnc() 特定于 A、B、C、D 列中的数据。此外,我没有在 pandas df 中找到任何使用 applymap 和 groupby 的示例和教程。
python-3.x - 如何在 python pandas 数据框中使用 applymap 来处理标准化的比例
首先,我为一个模糊的问题道歉。让我解释。我有一个熊猫数据框,其中包含 2 列,即平方英尺和卧室数量。我正在尝试使用线性回归计算价格,并希望运行矩阵来计算梯度下降。由于平方英尺比卧室数量大 1000 倍,而且梯度下降不能很好地收敛,我试图通过归一化来处理属性中的这种尺度差异。
我正在做的特定归一化是用它们各自的平均值减去卧室和平方英尺的各个列单元格,然后将结果除以它们各自的标准偏差。我写的代码是这样的:-
问题是有一种更简单的方法可以做到这一点,因为如果我有 1000 列,这将无法扩展。我想知道是否有一个 dataframe.applymap() 方法可以计算各个列的平均值和标准差,并对每列的各个单元格执行归一化。请注意,每一列可以有不同的值范围,但都是数字。
python - 修改某些熊猫数据框列,将更改应用于整个原始数据框
我将 .csv 文件读入 pandas 数据框delta_df = pd.read_csv('SAAF_121581_67_500_s.dat',index_col=False)- 我需要根据列的标题对某些列应用以下操作:delta_df.iloc[0:,2:].select(lambda x: not re.search('rad', x), axis=1)/1000
本质上,我正在搜索标题不包含字符串“rad”的每一列,并将其内容除以 1000。到目前为止一切顺利。
从这里我想应用delta_df.iloc[0:,2:].select(lambda x: not re.search('rad', x), axis=1)/1000回原始数据框 - 更改包含“rad”的列,其余所有内容保持不变。
我曾尝试使用,df.apply()但我认为这可能是一份工作df.applymap()--> 我似乎无法让它工作。
任何建议或指示将不胜感激。
python - 在 pandas DataFrame 的 applymap() 中使用自定义函数
我是熊猫新手。我编写了一个函数,我想将其应用于 pandas DataFrame“Monthly_mean_consump”中的所有条目,下面提供了一个数据样本。
我编写了一个函数,其输入是数据帧“Monthly_mean_consump”中的单个元素,只要该值大于 0.45,该函数就会从另一个数据帧“df_loss_peak”(下面提供示例)中找到相应的成本并返回相应的成本。
我写的函数如下:
我使用了两个嵌套的 for 循环(代码如下)将此函数应用于数据框“Monthly_mean_consump”的每个元素,我得到了所需的输出。
但是,我知道这非常耗时,pandas 提供了一个非常适合这项工作的高效函数“applymap()”。我在其他各种任务中使用了 applymap() 函数。但是当我编写以下代码以便在此处使用 applymap() 时,我得到 keyindex 错误 -1:
任何帮助,将不胜感激?我也认为 applymap() 函数会比我实现的循环更有效吗?
谢谢
python - 如何在 Pandas 中使用 applymap() 将数据帧传递给函数?
我正在尝试使用applymap()pandas 中的功能将函数应用于整个数据帧。我有一个数据框df(下面是一个示例):
我还有另外两个框架,即,df_peak它们df_off_peak如下:
我在一个单独的文件中编写了以下函数interpolate.py:
计算与消耗对应的损失的函数
然后我调用函数cost_consump如下:
这完全符合我的要求。但是我很好奇这项工作是否可以通过使用来完成applymap()。我尝试编写以下内容,我想将函数应用于数据帧df并将结果操作保存在df1.
但是,这需要我将两个额外的数据帧传递给我不知道该怎么做的函数。
我将不胜感激任何帮助。
python - Python:将函数应用于熊猫数据框中的某些元素/单元格
我在熊猫中有下表。
我想对以 . 开头的单元格中的每个元素应用一个函数b'。功能是:
背景:我有一个 csv 文件,其中包含正常值和加密值,我想仅对未加密的元素应用解密方法。我的计划是将 csv 读入 pandas 并仅对加密的单元格应用解密功能(例如以 开头'b)。执行加密后,我将数据导出回新的 csv。我想使用applymap而不是使用循环,但我不知道如何仅在特定元素上执行此操作。
谢谢
python-3.x - Pandas:使用超过 1 列与 dict 进行映射
我得到了基本的数据框:
我希望 map 函数在 X 和 Y 列上工作并获得这个:
为此,我为 2 个键创建了一个字典:
并在 DataFrame 上使用了 applymap 方法:
不幸的是,我收到一条错误消息:
代码是错误的,还是基于字典的映射根本不支持超过 1 列?
python - 如何使用 Pandas 为数据框中的新添加值着色?
我想在 DataFrame 中突出显示(或着色)以前是 NaN 的新值。
我有 2 个具有相同索引的数据框。
一个带有 NaN 的
另一个(“更新的”),其中 NaN 已被新值(每列的平均值)替换
如何使用 Pandas.style和.applymap()方法突出显示或着色新值(均值)?
任何帮助将非常感激 !
python - TypeError:不支持的类型在写()
所以我正在读取一个.xlsx 文件,我需要检查xlsx 文件中有多少变量属于pandas 中的每个数据类型,最后将其导出到excel。
所以这里是代码:
此代码给出错误:“ TypeError: float() argument must be a string or a number, not 'numpy.dtype'”
然后我将数据帧转换为 str 类型,所以现在添加了额外的代码行:
但它仍然向我显示相同的错误和标题中给出的错误。
任何建议将不胜感激。