“patsy”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

1283 浏览

python - 从 patsy 中的 DesignMatrix 中获取名称

问题：不是使用 Designinfo 指定列的“名称”（这基本上使我的代码的可重用性降低），我可以不读取此 DesignMatrix 给出的名称，以便稍后将其输入 DataFrame，而无需知道预先“参考水平/对照组”水平是什么？

IE。当我做 dmatrix("C(carbs, Treatment(reference='lo')) + score", dta)

所以 g 将是转换后的数据框，我可以在不需要记录（或硬编码）列名及其参考级别的情况下对其进行逻辑建模。

2014-05-09T08:38:07.453

0 投票

1 回答

352 浏览

ipython - ipython notebook 和 patsy 分类变量（公式）

我和这个问题有同样的错误。

奇怪的是，它在 ipython shell 中有效（提供了答案），但在 ipython 笔记本中无效。但它与C()运营商有关，因为没有它可以工作（但不是作为运营商）

与该示例相同：

这在 ipython notebook 和 shell 中都很有效，并且被patsy视为Region分类变量，因为它是由字符串组成的。

但是如果我尝试这个（如教程中所示）：

我在 ipython 笔记本中遇到错误：

请注意，在 notebook 和 shellstatsmodels中patsy都是相同的版本（分别为 0.5.0 和 0.3.0）

你有同样的错误吗？

ipython ipython-notebook statsmodels patsy

2014-10-06T10:33:09.390

0 投票

1 回答

630 浏览

python - 如何使用 Patsy 的 API 准备大型数据集？

我正在运行逻辑回归，并且在使用 Patsy 的 API 来准备大于小样本的数据时遇到问题。

dmatrices直接在 DataFrame 上使用该函数，我会遇到这个突然的错误（请注意，在我的笔记本电脑上遇到这个问题后，我启动了一个具有 300GB RAM 的 EC2，并得到了同样的错误）：

所以，我梳理了Patsy 的文档，发现了这个宝石：

但是，该方法的文档很少，源代码也基本上没有注释。

我已经到了这个代码：

但我收到PatsyError: Error evaluating factor: NameError: name 'ff' is not defined

这是被抛出的，因为 _try_incr_builders（从 dmatrix 调用）在 highlevel.py的第 151 行返回 None

使用这些 Patsy 函数准备数据的正确方法是什么？您可能拥有的任何示例或指导都会有所帮助。

python data-processing patsy

2014-10-22T06:37:45.057

0 投票

0 回答

693 浏览

python - 使用python statsmodels回归趋势+季节性

我有一个关于python回归的问题。长话短说，我需要找到一个 yt = mt + st 形式的模型，其中 mt 和 st 分别是趋势和季节性分量。在我之前的分析中，通过我的回归分析，我发现 mt 的一个好的模型是 mt = a0 + a1*t + a2*t^2 类型的二次趋势。现在，当我想添加季节性组件时，这是我最难的地方。现在，我采用了这两种方法……一种是通过 R 编程，我将 R 对象调用到 python 中，另一种是仅通过 python。现在，按照我书中的示例，我使用 R 进行了以下操作：

我得到了正确的回归系数。但是，如果我在 python 中做同样的事情，这就是我在复制它时遇到问题的地方。

我在这里做错了什么？我首先收到一条错误消息，指出“找不到数据类型”，它指向 res_result 公式。所以，然后我尝试将 ss_temp 更改为系列。然后，上面的语句起作用了。但是，与 R 输出相比，我的参数完全关闭。我一直在这上面花了一天时间，但无济于事。有人可以帮助我或指导我做什么，或者在 R 中是否有一个相当于 as.factor 的 python？我认为这在熊猫中是绝对的。

谢谢

如果上面的太难了，那也没关系。我仍然有我在 R 中回归的残差模型。但是，任何想法如何将其转换为 python 等效于 statsmodels 解释为回归的 res 吗？再次感谢

python r regression statsmodels patsy

2015-02-06T16:56:07.843

0 投票

1 回答

640 浏览

python-2.7 - Patsy's dmatrices cannot read my formula

I have a function LogReg, which is as follows: (using justmarkham's code as inspiration)

with the following outcome:

I do not see what goes wrong here, as the string does by my knowledge not contain the EOF character, nor does the Python code seem erroneous. Therefore, the question: Where does it go wrong (and preferably: , and how to fix it)?

P.S.: The software used are all the most recent stable packages as available on 04/09/2015.

python-2.7 patsy

2015-04-12T11:06:58.093

0 投票

1 回答

75 浏览