问题标签 [kaggle]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1638 浏览

python - 使用 iloc 进行索引

现在通过 kaggle 教程,虽然我从查看输出和阅读文档中了解了它的基本概念,但我想我需要确认这里发生了什么:

我的主要问题是iloc函数的最后一行。其余的只是为了上下文。它只是将训练数据拆分?

0 投票
4 回答
671 浏览

python - Python:使用 Beautifulsoup 从 html 中获取文本

我正在尝试从此链接链接示例中提取排名文本编号:kaggle userranking no1。图像更清晰:

在此处输入图像描述

我正在使用以下代码:

结果是None。问题是soup.findAll('h4',{'data-bind':"text: rankingText"})输出:

[<h4 data-bind="text: rankingText"></h4>]

但是在检查时在链接的 html 中是这样的:

<h4 data-bind="text: rankingText">1st</h4>. 可以在图片中看到:

在此处输入图像描述

很明显,缺少文本。我怎样才能超越它?

编辑:在终端打印soup变量我可以看到这个值存在: 在此处输入图像描述

所以应该有办法通过soup.

编辑 2:我尝试使用此stackoverflow question中投票最多的答案,但未成功。可能是那里的解决方案。

0 投票
0 回答
515 浏览

python - 使用 Softmax 回归的面部关键点检测

我正在尝试使用 Tensorflow 为Kaggle 面部关键点检测竞赛构建一个基本的 Softmax 回归模型。

我按照 Tensorflow 初学者 MNIST 示例进行 Softmax 回归模型和 Daniel Nouri 的博客进行数据结构化。

我面临的问题是脚本总是将准确率预测为 0.0

我也关注了类似的问题,但没有运气:-

注意:-我正在从数据集中删除所有缺少值的行。

终端日志:

编辑 :

似乎问题出在成本/交叉熵上,将其更改为解决问题:

0 投票
2 回答
5536 浏览

python - Python Machine Learning/Data Science Project Structure

I'm looking for information on how should a Python Machine Learning project be organized. For Python usual projects there is Cookiecutter and for R ProjectTemplate.

This is my current folder structure, but I'm mixing Jupyter Notebooks with actual Python code and it does not seems very clear.

I work in the scripts folder and currently adding all the functions in files under my_module, but that leads to errors loading data(relative/absolute paths) and other problems.

I could not find proper best practices or good examples on this topic besides this kaggle competition solution and some Notebooks that have all the functions condensed at the start of such Notebook.

0 投票
1 回答
9057 浏览

python - Python3 CSV writerows,TypeError:'str'不支持缓冲区接口

我正在将以下 Kaggle 代码翻译成 Python3.4:

在输出 CSV 文件时的最后几行,

有一个类型错误

这发生在线路上open_file_object.writerow(["PassengerId","Survived"])

我相信这是因为以二进制模式打开文件以写入 csv 数据在 Python 3 中不起作用。但是,在行中添加encoding='utf8'open()不起作用。

在 Python3.4 中执行此操作的标准方法是什么?

0 投票
1 回答
2277 浏览

python - xgboost、extratreeclassifier 和 randomforrestclasiffier 有什么区别?

我对所有这些方法都很陌生,并试图得到一个简单的答案,或者也许有人可以指导我在网络上的某个地方进行高级解释。我的谷歌搜索只返回了 kaggle 示例代码。

extratree 和 randomforrest 本质上是一样的吗?xgboost 在为任何特定树选择特征时使用提升,即对特征进行采样。但是那么其他两种算法是如何选择特征的呢?

谢谢!

0 投票
1 回答
3378 浏览

r - 在 R 中下载 Kaggle zip 文件

我正在尝试直接从我的 R 代码本身的 Kaggle 空间下载 zip 文件。不幸的是,它的工作不正确。这是正在发生的事情:

旧金山犯罪数据集位于https://www.kaggle.com/c/sf-crime/data

取第一个数据集:test.csv.zip: https ://www.kaggle.com/c/sf-crime/download/test.csv.zip

我正在使用 R 代码:

代替原来的 18.75MB 文件,R 只下载一个 183 字节的文件。

会话输出:

我究竟做错了什么?

在此先感谢,拉胡尔

0 投票
2 回答
4164 浏览

python - python pandas upper() 不适用于字符串列

嗨,我正在使用 Kaggle Titanic 数据。我曾经apply(lambda x: x.upper())在多个列上工作,但它不起作用。

我把数据放在我的谷歌驱动器上,你可以在这里下载。

我对每一列进行测试,这是所有object类型的(我认为这意味着str,如果有错请纠正我)。但有些专栏报道'float' object has no attribute 'upper'

任何帮助表示赞赏。谢谢!

0 投票
1 回答
4863 浏览

r - eval 中的错误(expr、envir、enclos):找不到函数“eval”

我正在处理 Kaggle 数字识别器问题。当我尝试给定的代码时,我得到了错误。

eval 中的错误(expr、envir、enclos):找不到函数“eval”

运行以下段时出现错误。

完整代码链接: https ://www.kaggle.com/benhamner/digit-recognizer/example-handwritten-digits/code

0 投票
1 回答
3954 浏览

scikit-learn - Sklearn TruncatedSVD() ValueError: n_components must be < n_features

嗨,我正在尝试为 Kaggle 比赛运行脚本。

你可以在这里看到整个脚本

但是当我运行这个脚本时,我得到一个 ValueError

有人可以告诉我如何找出此时有多少功能。我认为当我将 n_components 设置为 0 时它不会有用。我也阅读了文档,但我无法解决这个问题。问候亚历克斯