问题标签 [pd]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何处理 DataFrame 中的配对数据集?
我想要做的是比较两个共享相同来源的句子。在拆分或合并(无论如何..)之后,我想在两个句子之间使用 Jaccard Similarity。
我不知道如何用循环来完成它。
也许原型是这样的。
来源:1000,可接受性:1,句子:
来源:1000,可接受性:0,句子:
……
来源:1001,可接受性:1,句子:
来源:1001,可接受性:0,句子:
...
在将 DataFrame 与循环站拆分后,我希望根据 Jaccard Similarity 比较这些对。如果这对的相似度分数太低,我想从 DataFrame 中删除该对。
我真的需要你们帮助!!
谢谢你帮助我!
python - 没有这样的文件或目录(python 中的新功能)
我正在练习我的 Python 技能,所以我试图理解代码。还有这样的代码
但我得到一个错误:
“没有这样的文件或目录:'../figs/SerialDist.png'”
正如我已经说过的,我在这方面很新,但我认为问题是我的文件路径是错误的,所以我该如何解决它。谢谢你。
pandas - 在 Dataframe 中选择一列的值在另一列表列中的行
我正在尝试以下
我想选择col1
值在col2
列表中的行
但我得到了空的df。为什么isin
功能不起作用?
python - 如何使用套接字将 Web 数据从 Python 流式传输到纯数据 (Pd)
我正在尝试使用 Python 中的套接字将来自 Web 服务器的数据流式传输到纯数据(Pd)的 netrecieve 对象。我对 Python 非常陌生,但能够连接到所需的 Web 服务器并在 Python 中打印数据。我还可以看到我在我的计算机上成功地打开了从 Python 到 Pure Data 的连接。但是我无法弄清楚从 python 发送数据的最佳方式(它不是静态变量,而是动态更新的流)。然后我会在 Pd 端解析这个(我对这部分有更多的经验)。
Python 代码如下所示:
非常感谢任何建议。对 Python 来说非常陌生,所以我请求原谅任何“明显”的愚蠢行为。
python - 无法使用 pd.read_html 抓取整个表格
我尝试使用 pd.read_html 来抓取表格,但最后 3 列返回“nan”。这是我使用的代码:
总共有 7 列,它抓取所有标题,但不抓取最后 3 列中的数据。我也尝试使用 BeautifulSoup 解析它,但得到了相同的结果。
我假设问题与 HTML 代码有关。谁能帮我解决这个问题?
python - 使用 Pandas 分离 CSV 文件中的数据
我正在尝试在 CSV 文件中分离数据。
我希望 python 脚本打印 Hello 并显示 1 秒,然后再打印 Hi 并显示 3 秒。
由于我是新人,请与我裸露。谢谢。
text - 如果数据框中的字符串包含子字符串,则将所有内容替换为其他内容
A = “我想吃寿司”</p>
我想运行一个代码,如果 A 有“吃”和“想要”,则将整个字符串替换为“YES!”</p>
但是这个 A 是在数据框的上下文中,所以代码需要能够遍历每一行。
python - 将 .txt 文件转换为 Python 中的数据框,以将特定行作为列名
我的目录文件中有多个 txt 文件。我想通过使用同一目录中的所有 .txt 文件创建一个数据框并创建一个 csv 数据框。在 txt 文件中,我想使用特定行作为列名和该列下有关该行的信息。
文本1:
文本2:
文本3:
当我运行此代码时:
我得到这个结果:
但是我想得到这个结果: want_to_get_this
我想要所有文本文件中的特定信息,并从这些 .txt 文件中创建数据集。正如您在want_to_get_this中看到的那样,对于特定信息,我为它们创建了列名,并且有关这些列的信息写在它们的特定列下。.txt 文件中不包含的是“名称”列。代表姓名写在txt文件中。我刚刚在“名称”列下指定了该信息。提前致谢!
python - Python:文件未找到错误。没有这样的文件或目录
我正在编写一个程序,尽管我使用 Pandas 发布了绝对文件路径,但 Python 无法读取我的文件。最奇怪的部分是这个程序以前可以工作,但现在不行,我无法深入了解原因。这是程序和错误:
错误:
该文件肯定在那个位置,我复制粘贴了该位置!任何修复将不胜感激