问题标签 [kaggle]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-2.7 - IndexError:Python 上的索引过多
在 OSX 上将 PyDev 与 Python 2.7 的 Eclipse 环境一起使用。试图计算数组中的元素并将数组中的元素相加。在索引上出现错误。
让我知道我是否可以提供更多信息。
谢谢你。
更新: 我进行了编辑,但得到了另一个关于模块不可调用的错误:
更新: 我将 os.path('train.csv') 更改为 os.path.join('train.csv'),但出现另一个关于找不到 .csv 文件的错误。
这是 .csv 文件和 python 脚本的绝对路径。
'/Users/scdavis6/Desktop/train.csv'
'/Users/scdavis6/Documents/Kaggle/Titanic1.py'
matlab - 使用 Octave 从 csv 文件中读取图像
我想training.csv
用 Octave阅读Kaggle 比赛的文件。该文件包含 16 个字段。前 15 个是关键点的坐标。第 16 个是图像,它是由空格分隔的9216 个数字(0 到 255)。
尝试过,但没有运气以下:
笔记:
- 该文件还包含缺失的数据。
- csv 文件的前 3 行在这里:pastebin.com/pwBQgcfa
谢谢,
python - SKLearn - 主成分分析导致 knn 预测的可怕结果
通过将 PCA 添加到算法中,我正在努力提高 kaggle 数字识别教程的 %96.5 SKlearn kNN 预测分数,但基于 PCA 输出的新 kNN 预测结果非常糟糕,比如 23%。
以下是完整代码,如果您指出我错了,我将不胜感激。
machine-learning - 为什么要使用交叉验证?
目前我正在参加几场 Kaggle 机器学习比赛,我有一个简单的问题。为什么我们使用交叉验证来评估我们的算法在这些比赛中的有效性?
当然,在这些比赛中,你在公开排行榜上的得分,你的算法会根据实际实时数据进行测试,这会让你更准确地表示你的算法效率吗?
python - 访问列表列表
我有列表形式的数据。我想做类似的事情(data[1::100])[3]
,我访问前 100 个元素,然后只访问所有这些元素的第三列。在 Kaggle 的教程中,我看到过类似的东西data[1::100,3]
,但是 Python 说:
TypeError:列表索引必须是整数,而不是元组。
是否有捷径可寻?我可以只使用一个循环或其他东西,但这会出现很多,所以有一些速记会很好。
python - Matplotlib xy 线图图例
如何在 IPython 笔记本内部的 Matplotlib 中向 xy 线图添加图例?我目前的尝试:
这样做,我收到以下错误:
/Users/mc/.virtualenvs/kaggle/lib/python2.7/site-packages/matplotlib/legend.py:613: UserWarning: Legend does not support [] 使用代理艺术家。
http://matplotlib.sourceforge.net/users/legend_guide.html#using-proxy-artist
(str(orig_handle),)) /Users/mc/.virtualenvs/kaggle/lib/python2.7/site-packages/matplotlib/legend.py:613: UserWarning: Legend does not support [] 使用代理艺术家。
http://matplotlib.sourceforge.net/users/legend_guide.html#using-proxy-artist
(str(orig_handle),))
如果我不这样做,则此命令有效plt.scatter
,plt.plot
但我想要一个折线图而不是 x,y 点。
r - 在 R 中下载 kaggle 文件而不会出现“权限被拒绝”错误
我正在尝试直接在 R 中下载 Kaggle 数据文件:
任何已知的走动?
r - C5.0 决策树 - 名为 exit 的 c50 代码,值为 1
我收到以下错误
c50 代码调用退出,值为 1
我正在根据 Kaggle 提供的泰坦尼克号数据进行此操作
输出 :-
然后我尝试使用 C5.0 dtree
所以运行上面的行给了我这个错误
我无法弄清楚出了什么问题?我在不同的数据集上使用了类似的代码,并且运行良好。关于如何调试代码的任何想法?
-谢谢
python - 从给定多索引的熊猫数据框中查找
在使用 pandas 玩 kaggle titanic 数据集时,我发现一个地方我在 python 中编写了一个显式循环,但我想知道是否有更有效的方法?考虑以下程序:
我的问题是是否可以在s
没有循环的情况下生成?
r - 解压缩一个大的 .gz 文件
我需要解压缩transactions.gz
从 Kaggle 下载的文件;大约 (2.86 GB),3.5 亿行,11 列。
我在 RStudio、Windows Vista、32 位、RAM:3 GB 上试过:
但我在控制台上收到此错误消息
我检查了这个案例,但它对我不起作用:Decompress gz file using R
我将不胜感激任何建议。