问题标签 [kaggle]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

945 问题

0 投票

1 回答

148 浏览

machine-learning - kaggle titanic Subset Women and Children

I am trying to make a feature variable from the Titanic dataset on kaggle by pulling specific information from two variables but I can't figure out how to code it. I want to combine the "Sex" variable and the "Parch" variable. What I want is if the passenger is a female with children or parents they should be coded as 1 in a new variable called "WomenandChildren." If they are a woman without children/parents or a male with or without children they should be coded as a 0.

My theory is that women with children were more likely to survive then women without children or men with or without children.

machine-learning subset kaggle

2016-03-08T14:33:29.747

0 投票

3 回答

36374 浏览

python - python中的KFold到底是做什么的？

我正在看这个教程：https ://www.dataquest.io/mission/74/getting-started-with-kaggle

我到了第 9 部分，做出预测。其中有一些数据称为泰坦尼克号，然后使用以下方法将其分成折叠：

我不确定它到底在做什么以及 kf 是什么类型的对象。我尝试阅读文档，但没有太大帮助。另外，一共有三折（n_folds=3），为什么后面只能在这一行访问train和test（我怎么知道他们叫train和test）？

python scikit-learn cross-validation kaggle

2016-03-17T14:09:25.930

0 投票

2 回答

22317 浏览

python - xgboost: AttributeError: 'DMatrix' 对象没有属性 'handle'

这个问题真的很奇怪，因为那部分与其他数据集一起工作得很好。

完整代码：

最后一行导致以下错误（提供完整输出）：

这里有什么问题？我不知道如何解决这个问题

UPD1：实际上这是 kaggle 问题：https ://www.kaggle.com/insaff/bnp-paribas-cardif-claims-management/xgboost

python python-3.x machine-learning xgboost kaggle

2016-03-17T15:54:37.043

0 投票

0 回答

416 浏览

r - 在 R 中为 Kaggle Titanic 数据集调整 SVM 时出错

我正在尝试使用 Titanic Kaggle 数据集在 R 中完成对 SVM 模型的调整。

当我运行以下代码时：

我得到错误：

使用回溯：

我知道我的变量可能有问题 - 有没有想过这可能是什么？

如果有帮助，我没有修改任何变量，但删除了一堆（在调整公式中没有看到并通过以下方式创建了一个新变量family：

船是一个data.table。

r svm kaggle

2016-03-23T16:49:28.820

0 投票

2 回答

1022 浏览

python-3.x - Python 3.+，Scipy Stats Mode 函数给出类型错误不可排序的类型：str() > float()

我正在尝试解决 kaggle 泰坦尼克号灾难问题，特别是使用众数/平均值/中位数来输入缺失值。这是我的数据集的一个峰值

我正在尝试获取“Embarked”列的模式并输入“Object”。我正在使用python3。这是代码片段：

这是错误片段：

python-3.x numpy scipy anaconda kaggle

2016-03-26T19:35:01.420

0 投票

1 回答

1730 浏览

scikit-learn - Scikit-learn TruncatedSVD 文档

我打算在sklearn.decomposition.TruncatedSVDKaggle 比赛中使用 LSA，我知道 SVD 和 LSA 背后的数学，但我对 scikit-learn 的用户指南感到困惑，因此我不确定如何实际应用 TruncatedSVD。

在doc中，它指出：

这次手术后，

U_k * transpose(S_k)是具有特征的转换训练集k（n_components在 API 中调用）

为什么是这样？我想在SVD之后，X此时X_k应该是U_k * S_k * transpose(V_k)？

然后它说，

为了也转换一个测试集X，我们将它乘以V_k：X' = X * V_k

这是什么意思？

scikit-learn nlp svd kaggle lsa

2016-03-28T00:28:12.000

0 投票

1 回答

69 浏览

linux - 将代码段的十六进制表示转回二进制

微软在 Kaggle 挑战赛 ( https://www.kaggle.com/c/malware-classification/data ) 中提供的恶意软件样本包含代码段的十六进制表示。一个例子：

我想将它们转换回二进制格式，以便进一步将它们转换为图像（并节省空间）。

我试过xxd -r -p了，但输出不正确。xxd以某种方式也对地址进行编码00401000，而我想摆脱地址。

有没有快速的方法来做到这一点？

linux assembly binary hexdump kaggle

2016-03-30T04:32:42.097

0 投票

1 回答

352 浏览

python - Python seaborn 图形

亲爱的，我正在尝试将 kaggle 教程代码应用于 Iris 数据集。

不幸的是，当我执行图表的代码时，我只能看到这个输出而没有看到任何图表：

matplotlib.axes._subplots.AxesSubplot at 0x9abf9b0

任何想法？

这是代码

python matplotlib seaborn kaggle

2016-04-06T14:59:49.557

0 投票

1 回答

464 浏览

r - 使用 docker kaggle 映像运行 r 脚本

我正在尝试R script在我的本地Windows OS重现结果（重现它在 kaggle 服务器上给出的结果）。为此，有人建议使用docker images在我的本地运行 r 脚本。

我已经安装了 docker 并按照此处给出的说明完成了设置步骤https://docs.docker.com/windows/step_one/

安装后，我正在努力研究如何创建 kaggle R 图像并使用本地资源/数据在我的本地运行 R 脚本。有人可以帮我解决这些吗？

r windows docker containers kaggle

2016-04-08T10:11:08.537

0 投票

1 回答

152 浏览

python-3.x - Python 3.x - 合并熊猫数据框

我在 Kaggle 上使用 Python 进行泰坦尼克号灾难竞赛。数据集 (df) 包含对应于每位乘客的 3 个属性——“性别”(1/0)、“年龄”和“Pclass”(1/2/3)。我想获得与每个 Gender-Pclass 组合相对应的中位年龄。

最终结果应该是一个数据框 -

中位年龄稍后计算

我尝试按如下方式创建数据框 -

但获得的输出是 -

有人可以帮我获得所需的输出吗？

python-3.x pandas merge outer-join kaggle

2016-04-15T09:51:20.100

1 2 3 4 5 6 7 8 9 10