问题标签 [kaggle]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

945 问题

0 投票

1 回答

3187 浏览

python-2.7 - IndexError：Python 上的索引过多

在 OSX 上将 PyDev 与 Python 2.7 的 Eclipse 环境一起使用。试图计算数组中的元素并将数组中的元素相加。在索引上出现错误。

让我知道我是否可以提供更多信息。

谢谢你。

更新： 我进行了编辑，但得到了另一个关于模块不可调用的错误：

更新： 我将 os.path('train.csv') 更改为 os.path.join('train.csv')，但出现另一个关于找不到 .csv 文件的错误。

这是 .csv 文件和 python 脚本的绝对路径。

'/Users/scdavis6/Desktop/train.csv'

'/Users/scdavis6/Documents/Kaggle/Titanic1.py'

2014-01-17T06:58:38.653

0 投票

1 回答

798 浏览

matlab - 使用 Octave 从 csv 文件中读取图像

我想training.csv用 Octave阅读Kaggle 比赛的文件。该文件包含 16 个字段。前 15 个是关键点的坐标。第 16 个是图像，它是由空格分隔的9216 个数字（0 到 255）。

尝试过，但没有运气以下：

笔记：

该文件还包含缺失的数据。
csv 文件的前 3 行在这里：pastebin.com/pwBQgcfa

谢谢，

matlab csv octave kaggle

2014-01-20T18:59:04.467

0 投票

2 回答

3012 浏览

python - SKLearn - 主成分分析导致 knn 预测的可怕结果

通过将 PCA 添加到算法中，我正在努力提高 kaggle 数字识别教程的 %96.5 SKlearn kNN 预测分数，但基于 PCA 输出的新 kNN 预测结果非常糟糕，比如 23%。

以下是完整代码，如果您指出我错了，我将不胜感激。

python scikit-learn pca knn kaggle

2014-01-24T11:11:32.523

0 投票

1 回答

3451 浏览

machine-learning - 为什么要使用交叉验证？

目前我正在参加几场 Kaggle 机器学习比赛，我有一个简单的问题。为什么我们使用交叉验证来评估我们的算法在这些比赛中的有效性？

当然，在这些比赛中，你在公开排行榜上的得分，你的算法会根据实际实时数据进行测试，这会让你更准确地表示你的算法效率吗？

machine-learning artificial-intelligence cross-validation kaggle

2014-01-30T00:41:15.543

0 投票

1 回答

115 浏览

python - 访问列表列表

我有列表形式的数据。我想做类似的事情(data[1::100])[3]，我访问前 100 个元素，然后只访问所有这些元素的第三列。在 Kaggle 的教程中，我看到过类似的东西data[1::100,3]，但是 Python 说：

TypeError：列表索引必须是整数，而不是元组。

是否有捷径可寻？我可以只使用一个循环或其他东西，但这会出现很多，所以有一些速记会很好。

python list types scikit-learn kaggle

2014-02-14T22:50:24.910

0 投票

1 回答

837 浏览

python - Matplotlib xy 线图图例

如何在 IPython 笔记本内部的 Matplotlib 中向 xy 线图添加图例？我目前的尝试：

这样做，我收到以下错误：

/Users/mc/.virtualenvs/kaggle/lib/python2.7/site-packages/matplotlib/legend.py:613: UserWarning: Legend does not support [] 使用代理艺术家。

http://matplotlib.sourceforge.net/users/legend_guide.html#using-proxy-artist

(str(orig_handle),)) /Users/mc/.virtualenvs/kaggle/lib/python2.7/site-packages/matplotlib/legend.py:613: UserWarning: Legend does not support [] 使用代理艺术家。

http://matplotlib.sourceforge.net/users/legend_guide.html#using-proxy-artist

(str(orig_handle),))

如果我不这样做，则此命令有效plt.scatter，plt.plot但我想要一个折线图而不是 x,y 点。

python matplotlib plot kaggle

2014-02-25T06:11:35.297

0 投票

1 回答

1876 浏览

r - 在 R 中下载 kaggle 文件而不会出现“权限被拒绝”错误

我正在尝试直接在 R 中下载 Kaggle 数据文件：

任何已知的走动？

r download kaggle

2014-03-19T07:49:48.113

0 投票

6 回答

22947 浏览

r - C5.0 决策树 - 名为 exit 的 c50 代码，值为 1

我收到以下错误

c50 代码调用退出，值为 1

我正在根据 Kaggle 提供的泰坦尼克号数据进行此操作

输出：-

然后我尝试使用 C5.0 dtree

所以运行上面的行给了我这个错误

我无法弄清楚出了什么问题？我在不同的数据集上使用了类似的代码，并且运行良好。关于如何调试代码的任何想法？

-谢谢

r machine-learning decision-tree kaggle

2014-04-02T06:36:39.757

0 投票

1 回答

259 浏览

python - 从给定多索引的熊猫数据框中查找

在使用 pandas 玩 kaggle titanic 数据集时，我发现一个地方我在 python 中编写了一个显式循环，但我想知道是否有更有效的方法？考虑以下程序：

我的问题是是否可以在s没有循环的情况下生成？

python pandas kaggle

2014-04-26T20:21:09.497

0 投票

1 回答

2934 浏览

r - 解压缩一个大的 .gz 文件

我需要解压缩transactions.gz从 Kaggle 下载的文件；大约 (2.86 GB)，3.5 亿行，11 列。

我在 RStudio、Windows Vista、32 位、RAM：3 GB 上试过：

但我在控制台上收到此错误消息

我检查了这个案例，但它对我不起作用：Decompress gz file using R

我将不胜感激任何建议。

r compression kaggle

2014-05-01T00:58:30.317

1 2 3 4 5 6 7 8 9 10

问题标签 [kaggle]

Reference