问题标签 [kaggle]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3187 浏览

python-2.7 - IndexError:Python 上的索引过多

在 OSX 上将 PyDev 与 Python 2.7 的 Eclipse 环境一起使用。试图计算数组中的元素并将数组中的元素相加。在索引上出现错误。

让我知道我是否可以提供更多信息。

谢谢你。


更新: 我进行了编辑,但得到了另一个关于模块不可调用的错误:


更新: 我将 os.path('train.csv') 更改为 os.path.join('train.csv'),但出现另一个关于找不到 .csv 文件的错误。

这是 .csv 文件和 python 脚本的绝对路径。

'/Users/scdavis6/Desktop/train.csv'

'/Users/scdavis6/Documents/Kaggle/Titanic1.py'

0 投票
1 回答
798 浏览

matlab - 使用 Octave 从 csv 文件中读取图像

我想training.csv用 Octave阅读Kaggle 比赛的文件。该文件包含 16 个字段。前 15 个是关键点的坐标。第 16 个是图像,它是由空格分隔的9216 个数字(0 到 255)。

尝试过,但没有运气以下:

笔记:

谢谢,

0 投票
2 回答
3012 浏览

python - SKLearn - 主成分分析导致 knn 预测的可怕结果

通过将 PCA 添加到算法中,我正在努力提高 kaggle 数字识别教程的 %96.5 SKlearn kNN 预测分数,但基于 PCA 输出的新 kNN 预测结果非常糟糕,比如 23%。

以下是完整代码,如果您指出我错了,我将不胜感激。

0 投票
1 回答
3451 浏览

machine-learning - 为什么要使用交叉验证?

目前我正在参加几场 Kaggle 机器学习比赛,我有一个简单的问题。为什么我们使用交叉验证来评估我们的算法在这些比赛中的有效性?

当然,在这些比赛中,你在公开排行榜上的得分,你的算法会根据实际实时数据进行测试,这会让你更准确地表示你的算法效率吗?

0 投票
1 回答
115 浏览

python - 访问列表列表

我有列表形式的数据。我想做类似的事情(data[1::100])[3],我访问前 100 个元素,然后只访问所有这些元素的第三列。在 Kaggle 的教程中,我看到过类似的东西data[1::100,3],但是 Python 说:

TypeError:列表索引必须是整数,而不是元组。

是否有捷径可寻?我可以只使用一个循环或其他东西,但这会出现很多,所以有一些速记会很好。

0 投票
1 回答
837 浏览

python - Matplotlib xy 线图图例

如何在 IPython 笔记本内部的 Matplotlib 中向 xy 线图添加图例?我目前的尝试:

这样做,我收到以下错误:

/Users/mc/.virtualenvs/kaggle/lib/python2.7/site-packages/matplotlib/legend.py:613: UserWarning: Legend does not support [] 使用代理艺术家。

http://matplotlib.sourceforge.net/users/legend_guide.html#using-proxy-artist

(str(orig_handle),)) /Users/mc/.virtualenvs/kaggle/lib/python2.7/site-packages/matplotlib/legend.py:613: UserWarning: Legend does not support [] 使用代理艺术家。

http://matplotlib.sourceforge.net/users/legend_guide.html#using-proxy-artist

(str(orig_handle),))

如果我不这样做,则此命令有效plt.scatterplt.plot但我想要一个折线图而不是 x,y 点。

0 投票
1 回答
1876 浏览

r - 在 R 中下载 kaggle 文件而不会出现“权限被拒绝”错误

我正在尝试直接在 R 中下载 Kaggle 数据文件:

任何已知的走动?

0 投票
6 回答
22947 浏览

r - C5.0 决策树 - 名为 exit 的 c50 代码,值为 1

我收到以下错误

c50 代码调用退出,值为 1

我正在根据 Kaggle 提供的泰坦尼克号数据进行此操作

输出 :-

然后我尝试使用 C5.0 dtree

所以运行上面的行给了我这个错误

我无法弄清楚出了什么问题?我在不同的数据集上使用了类似的代码,并且运行良好。关于如何调试代码的任何想法?

-谢谢

0 投票
1 回答
259 浏览

python - 从给定多索引的熊猫数据框中查找

在使用 pandas 玩 kaggle titanic 数据集时,我发现一个地方我在 python 中编写了一个显式循环,但我想知道是否有更有效的方法?考虑以下程序:

我的问题是是否可以在s没有循环的情况下生成?

0 投票
1 回答
2934 浏览

r - 解压缩一个大的 .gz 文件

我需要解压缩transactions.gz从 Kaggle 下载的文件;大约 (2.86 GB),3.5 亿行,11 列。

我在 RStudio、Windows Vista、32 位、RAM:3 GB 上试过:

但我在控制台上收到此错误消息

我检查了这个案例,但它对我不起作用:Decompress gz file using R

我将不胜感激任何建议。