问题标签 [kaggle]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在带有 geom_bar 的 ggplot2 中未显示绘图
我正在尝试使用ggplot()
和geom_bar()
样本数据(Titanic Kaggle 问题):
我试图显示每个年龄范围的生存和死亡堆积条(我已将年龄划分为垃圾箱)。执行命令时绘图不可见。当我添加 print() 函数时,我得到的错误是
错误:图中没有图层
请告诉我这里有什么遗漏吗?
“火车”是我存储数据的对象。
python - Python中的文本预处理
我想用 Python 为 NLP 项目构建一个文本语料库。我在 LSHTC4 Kaggle 挑战赛中看到了这种文本格式:
第一个数字对应于标签。
每组由 ':' 分隔的数字对应于向量的 (feature,value) 对,其中第一个数字是特征的 id,第二个数字是其频率(例如,id 为 18 的特征在实例中出现 2 次)。
我不知道这是否是将文本数据预处理为数字向量的常用方法。我在挑战中找不到预处理程序,数据已经预处理。
r - 如何修改R中列中的单元格
我正在处理来自 Kaggle 的数据集,这是数据集的某些部分
所以我想删除“日期”列中的时间,它只会显示“15-05-13”而不是“15-05-13 17:00”。我想知道如何编码?
我认为应该是这样的:
但是这样一来,我会永远走下去,因为数据集是巨大的......
python - 使用 caffe 用 CSV 数据训练 Lenet
打扰一下,我有一个关于使用 caffe 获取高清数据的问题吗?我尝试通过以下步骤在 Kaggle mnist csv 数据上运行一个示例
用于
h5py
将其转换为 h5 数据。(我使用 caffe-example.py 进行转换)然后修改 lenet_train_test_prototxt 并训练它。我很茫然这一步。
我在这里所做的唯一改变是
如何更改 lenet_train_test_prototxt 以适应数据?或者还有其他一些我需要更改的文件?错误日志是
python - “不推荐使用索引参数并将在 0.17 中删除(假定为真)”是什么意思?
如果这是一个非常基本的问题/错误,我刚刚开始学习 python 并道歉。
我正在做 Kaggle 生物反应教程。我收到此错误
C:\Anaconda\lib\site-packages\sklearn\cross_validation.py:65:DeprecationWarning:indices 参数已弃用,将在 0.17 stacklevel=1 中删除(假设为 True)结果:0.458614231133
有谁知道是什么意思?我已经谷歌它死了,找不到答案。
我正在运行的脚本是:
我相信它是这样称呼的:
再一次,如果这是基本的东西,真的很抱歉。我真的从来没有这样做过。
python - 用 keras 尝试 Kaggle Titanic .. 得到 loss 和 valid_loss -0.0000
嗨,对于此处发布的问题的以下代码,我得到了奇怪的结果(https://www.kaggle.com/c/titanic)-
我得到以下结果:
我正在尝试创建一个简单的 3 层网络。完全基本的代码。在 kaggle 上使用 keras 之前,我已经尝试过这类分类问题。但是这次得到这个错误。
是不是因为数据少而过拟合。我错过了什么?有人可以帮忙吗?
apache-spark - 运行 Spark 的基础设施
我正在和另外 4 个人参加 Kaggle 比赛。我们都是在 edx.org 的 MOOC 上认识的。
尽管我们可以使用 Apache Spark 引擎进行编码,但我们不知道如何设置集群并安装必要的软件以在其上运行 spark。
理想情况下,我们正在寻找一个可以让我们专注于编程的免费平台。
您知道任何易于使用且理想情况下免费的平台吗?如果没有,您能告诉我们如何设置必要的基础设施来参与挑战吗?
非常感谢您提前。
python - Python+SciKit -> 手动和 cross_val_score 预测的不同结果
我正在为泰坦尼克号的案例执行 Kaggle 的学习任务。
如果我手动分离数据或使用 cross_val_score 执行线性回归,我有不同的预测精度。逻辑回归也是如此。
例子。
- 线性回归。
手动的
结果 - 78,34%
Cross_val_score
结果 - 37.5%
- 逻辑回归。
在这里,我有 26.15% 的手动功能和 78.78% 的 cross_val_score 功能。
为什么??
python - 意外的行继续字符
我正在学习如何进行数据科学,并且正在关注泰坦尼克号的 kaggle 教程。
然而,
我在第一行得到了这个错误(data[0::,4] == "female")
错误:
SyntaxError:行继续字符后出现意外字符
python - Python中用于预测的逻辑回归分类器
我正在尝试制作一个脚本,它需要一个 json 文件(pizza-train.json)(来自这个 Kaggle 比赛。我想从列表中的每个字典中提取 request_text 字段,并构造一个字符串的单词表示(字符串到计数列表)。
下一步是训练一个逻辑回归分类器来预测变量“requester_received_pizza”。我想训练 90% 的数据并预测 10%。问题是我不知道如何预测这 10%。任何建议都会非常有帮助!