问题标签 [kaggle]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
22234 浏览

python - 错误:“utf8”编解码器无法解码位置 0 中的字节 0x80:起始字节无效

我正在尝试执行以下kaggle assignmnet。我正在使用 gensim 包来使用 word2vec。我能够创建模型并将其存储到磁盘。但是,当我尝试重新加载文件时,出现以下错误。

我发现类似的问题。但我无法解决问题。我的 prog_w2v.py 如下。

我正在尝试使用此处的代码生成模型。该程序大约需要半个小时来生成模型。因此我无法多次运行它来调试它。

0 投票
2 回答
10138 浏览

r - train.default(x, y, weights = w, ...) 中的错误:无法确定最终调整参数

我是机器学习的新手,正在尝试Kaggle 上的森林覆盖预测比赛,但我很早就挂断了电话。运行以下代码时出现以下错误。

0 投票
1 回答
497 浏览

python-2.7 - Kaggle word2vec 竞赛,第 2 部分

我的代码来自:https ://www.kaggle.com/c/word2vec-nlp-tutorial/details/part-2-word-vectors ,我读取数据成功, 这里用于BeautifulSoup和nltk来清理文本,删除非字母但数字。

但是当我继续到这里时,无法继续前进。

0 投票
1 回答
191 浏览

python - 斯坦福 NLP 解析器对 Kaggle 电影评论中使用的相同语句给出不同的结果(情绪)

我正在研究 Kaggle 电影情绪分析,我发现电影评论已经使用 Standford Parser 进行了解析。在探索数据集时,我发现相同的语句给出了不同的设置-

其中英语是解析的数据,数字属于情绪。现在,如果你只检查逗号和一个点的区别,其余部分是相同的,但两者都属于不同的情绪,这给我分类带来了很多麻烦。

在文本分类中我应该怎么做才能避免这样的问题,如果我忽略重复并使用已经添加的情感,我的分类会出现可怕的错误,那么解决这种情况的方法应该是什么。

0 投票
3 回答
25937 浏览

python - Pandas scatter_matrix - 绘制分类变量

我正在查看来自 Kaggle 比赛的著名泰坦尼克号数据集:http ://www.kaggle.com/c/titanic-gettingStarted/data

我已使用以下方法加载和处理数据:

来自 matplotlib 的 scatter_matrix

如何将 Sex 和 Embarked 等分类列添加到情节中?

0 投票
1 回答
6577 浏览

machine-learning - Caffe 中的多标签回归

根据 kaggle 面部关键点竞赛,我从输入图像中提取 30 个面部关键点 (x,y)。

我如何设置 caffe 来运行回归并产生 30 维输出?

我如何相应地设置咖啡?我正在使用 EUCLIDEAN_LOSS(平方和)来获得回归输出。这是一个使用 caffe 的简单逻辑回归模型,但它不起作用。看起来准确度层无法处理多标签输出。

这是图层文件:

0 投票
0 回答
103 浏览

r - 在 R 中合并数据;在列中重复数据?

我必须从这些链接中获取数据集:cmu:http ://lib.stat.cmu.edu/S/Harrell/data/descriptions/titanic.html kaggle:https ://www.kaggle.com/c/titanic-gettingStarted /数据

当我尝试合并它们时,我的列在右侧重复,有什么办法可以解决这个问题?我试图将“票价”与人们进行比较。主要是尝试学习合并。

输出:

0 投票
0 回答
101 浏览

python-2.7 - ubuntu 14.04 中带有 kaggle 教程的 TclError:ipython、pylab 和 pandas

0 投票
1 回答
3924 浏览

r - RStudio闪亮错误 - 要替换​​的项目数不是替换长度的倍数

我对 R 相当陌生,目前正在使用 RStuido 开发一个闪亮的网络应用程序来识别手写数字。

我使用的数据来自 Kaggle 比赛: Digit-Recogniser

我有以下函数来呈现数字的平均表示

我将上述变量传递给 ui.R 使用:

运行应用程序时,我得到以下输出:

有谁知道如何解决这个问题?

谢谢

0 投票
1 回答
3404 浏览

python - 尝试python多处理的Windows上的RuntimeError

我将转储尝试 python 脚本时得到的错误代码:

预先处理验证数据

使用 gpu 设备 0:Tesla K20c

Traceback (most recent call last):

File "<string>", line 1, in <module>

File "C:\SciSoft\WinPython-64bit-2.7.6.4\python-2.7.6.amd64\lib\multiprocessing\forking.py", line 380, in main prepare(preparation_data)

File "C:\SciSoft\WinPython-64bit-2.7.6.4\python-2.7.6.amd64\lib\multiprocessing\forking.py", line 495, in prepare '__parents_main__', file, path_name, etc

File "C:\Users\Administrator\Desktop\Galaxy Data\kaggle-galaxies-master\kaggle-galaxies-master\try_convnet_cc_multirotflip_3x69r45_maxout2048_extradense.py", line 133, in <module>

for data, length in create_valid_gen():

File "load_data.py", line 572, in buffered_gen_mp process.start()

`文件“C:\SciSoft\WinPython-64bit-2.7.6.4\python-2.7.6.amd64\lib\multiprocessing\process.py”,第 130 行,在 start self._popen = Popen(self)

文件“C:\SciSoft\WinPython-64bit-2.7.6.4\python-2.7.6.amd64\lib\multiprocessing\forking.py”,第 258 行,在init cmd = get_command_line() + [rhandle]

文件“C:\SciSoft\WinPython-64bit-2.7.6.4\python-2.7.6.amd64\lib\multiprocessing\forking.py”,第 358 行,在 get_command_line` 中

RuntimeError:尝试在当前进程完成其引导阶段之前启动一个新进程。

据我了解,我必须插入一行

if __name__ == '__main__':

一些让它工作的地方

谁能告诉我应该在哪个文件中插入它?我已在初始错误日志中包含受影响的文件列表

受影响的文件:

https://github.com/benanne/kaggle-galaxies/blob/master/try_convnet_cc_multirotflip_3x69r45_maxout2048_extradense.py

第 131-134 行

https://github.com/benanne/kaggle-galaxies/blob/master/load_data.py

第 572 行