问题标签 [prediction]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1083 浏览

r - R:从 n 个子集制作 pls 校准模型,并使用它们来预测不同的测试集

我正在尝试应用我编写的一个函数,该函数使用“pls”包制作模型,然后使用它来预测几个测试集(在本例中为 9),返回每个测试集的 R2、RMSEP 和预测偏差 n从数据框中选择的子集数。功能是

选择 n 个子集(基于我的问题 [1] 的答案:通过对所有子集采用不同的行间隔和 应用函数并将 cpo 函数应用于我尝试的每个子集来选择几个子集

根据@Gavin 建议编辑

当我尝试这个时,我不断收到“eval 中的错误(expr,envir,enclos):找不到对象“蛋白质”。蛋白质用于 cpo 的 plsr 公式中,并且在数据集中。然后我尝试直接使用 plsr 函数,如下所示

当我尝试这个时,我得到了同样的错误'eval(expr,envir,enclos)中的错误:找不到对象'蛋白质'。任何有关如何处理此问题并使该功能正常工作的建议将不胜感激。

0 投票
2 回答
677 浏览

google-app-engine - 使用来自 Appengine (OAuth) 的 google API

我想从 Python Google App Engine应用程序中使用Google Prediction。Google Prediction 要求您将“预测模型”存储在Google Storage for Developers中,这实际上意味着要使用 GP,您必须使用 GSD。不幸的是,GP 和 GSD 似乎都需要 OAuth 2.0 。

不过,这个 Oauth 的东西真的很碍事!我发现的所有示例似乎都涉及想要访问用户数据/凭据/身份/使用 Oauth 的任何内容的情况。我不需要那个。我只是想使用 http 请求从我的服务器访问资源(GP 和 GSD)。重复一遍,我只是想使用他们的一些服务,我根本不需要访问任何其他用户信息!

我可以从我的 Google API 控制台中看到我已经为我的 GAE 应用程序域创建了一个 id 和 secret。难道不能只使用这些值对其他 Google API 进行 OAuth 身份验证吗?有效地说“我是域 xyz 的应用程序,这是我的凭据,让我使用你的 API”?谷歌目前强迫人们对他们试图让人们尝试的事情使用如此繁重的身份验证系统,这似乎有点荒谬?

我希望有一些神奇的很棒的库可以为我处理所有这些 OAuth 细节。除此之外,如何在 Python App Engine 中执行这些操作的代码示例将很有用。我只想从我的 python GAE 应用程序中使用 Google Prediction 和 Google Storage for Developers 服务,但是我不得不配置所有这些 OAuth 东西的负担。没有一些简单的方法可以做到这一点吗?

0 投票
1 回答
2466 浏览

java - Java、C、Python 等中的自组织模糊神经网络 (SOFNN) 实现

我们正在寻找用 Java 或其他语言(如 Python 或 C)实现自组织模糊神经网络 (SOFNN)。

看看 Neuroph,它是 Java 最好的神经网络框架之一,没有这样的网络类型。

有人知道模糊神经网络的任何工作实现吗?

干杯!

0 投票
1 回答
3497 浏览

java - 对 PMML 的 Java 支持

我是 PMML 的新手:预测模型标记语言 ( www.dmg.org ),我想知道是否有某种 Java 支持(开源/专业)来创建/解析 PMML 文件。

最初,我只考虑从 Java 环境以编程方式创建/解析 PMML 文件的可能性。

我一直在“谷歌搜索”,发现了几种可能性:

开源:

来自爪哇。

  • 杰德姆。javax.datamining。好像死了?有人有更多信息吗?

专业的。

DIY

  • 使用 XML Java 库并为自己构建一个 PMML 文件的解析器/编写器

我很欣赏你的所有意见。

提前致谢

奥斯卡

0 投票
4 回答
2523 浏览

prediction - 如何从姓氏猜出一个人的国籍?

我可以用什么方法从姓氏来预测一个人的国籍?

我有大量作者的文本和姓氏。我想确定哪些文本是由说拉丁语的人写的,哪些是由母语为英语的人写的,以便研究一组与另一组相比是否某些写作风格模式不同。

我在 google 和 pubmed 中查找了姓氏数据库,但找不到任何可免费访问的。另一种方法是使用一些正则表达式,例如“.*ez”来识别一些西班牙裔姓氏,例如“rodriguez”,但这并没有让我走得太远。

你有什么建议吗?由于我将在做出预测后手动修改所有关联,因此我不需要很高的准确性,但欢迎任何帮助或想法。

0 投票
6 回答
12114 浏览

statistics - 如何根据之前的事件预测下一个事件何时发生?

基本上,我有一个相当大的列表(一年的数据),其中包含单个离散事件发生的时间(对于我当前的项目,有人打印某些东西的时间列表)。基于此列表,我想构建某种统计模型,该模型将在给定所有先前事件时间的情况下预测下一个事件(下一个打印作业)的最可能时间。

我已经阅读了这篇文章,但是这些回复并不能完全帮助我了解我对项目的想法。我做了一些额外的研究,发现隐马尔可夫模型可能会让我准确地做到这一点,但我找不到有关如何仅使用时间列表生成隐马尔可夫模型的链接。我还发现在列表中使用卡尔曼滤波器可能很有用,但基本上,我想从实际使用过卡尔曼滤波器的人那里获得更多关于它的信息,并在尝试某些东西并希望它有效之前了解他们的局限性和要求。

非常感谢!

编辑:因此,根据 Amit 在评论中的建议,我还将其发布到Statistics StackExchange, CrossValidated。如果你知道我应该做什么,请在这里或那里发帖

0 投票
1 回答
9497 浏览

hidden - 预测下一次观察的隐马尔可夫模型

我对鸟的运动进行了 500 次观察。我想预测这只鸟的第 501 次运动会是什么。我在网上搜索,我想这可以通过使用 HMM 来完成,但是我在这个主题上没有任何经验。谁能解释用于解决此问题的算法的步骤?

0 投票
4 回答
1908 浏览

algorithm - 有哪些好的方法可以预测长流程的完成时间?

tl; dr:我想预测文件复制完成。考虑到开始时间和当前进度,有哪些好的方法?

首先,我知道这根本不是一个简单的问题,预测未来很难做好。对于上下文,我试图预测一个长文件复制的完成。

当前方法:

目前,我正在使用我自己提出的一个相当幼稚的公式:(ETC 代表预计​​完成时间)

这是假设要复制的剩余文件将以迄今为止的平均复制速度进行复制,这可能是也可能不是一个现实的假设(此处处理磁带存档)。

  • PRO: ETC 会逐渐变化,并且随着过程接近完成而变得越来越准确。
  • 缺点:它对意外事件反应不佳,例如文件副本卡住或加速过快。

另一个想法:

我的下一个想法是记录最后n秒(或几分钟,因为这些档案应该需要几个小时)的进度,然后执行以下操作:

这与第一种方法相反:

  • PRO:如果速度变化很快,ETC 将快速更新以反映当前的事务状态。
  • CON:如果速度不一致,ETC 可能会跳动很多。

最后

我想起了我在 uni 学过的控制工程科目,其目标本质上是试图让系统对突然的变化做出快速反应,但又不会不稳定和疯狂。

话虽如此,我能想到的另一个选择是计算上述两者的平均值,也许有某种加权:

  • 如果副本具有相当一致的长期平均速度,则对第一种方法的权重更大,即使它在局部跳跃一点。
  • 如果复制速度不可预测,并且可能会长时间加速/减速或长时间完全停止等操作,则更加重视第二种方法。

我真正要求的是:

  • 我给出的两种方法的任何替代方法。
  • 如果以及如何结合几种不同的方法来获得最终预测。
0 投票
1 回答
208 浏览

algorithm - 专家:基于限制(最小 x 最大)预测数字键盘中下一个键的算法

我正在尝试制作一种算法,根据预先确定的限制(最小值和最大值)计算数字键盘中可以按下的键。所以我可以隐藏那些“不可用”的键。

假设该值从 89 到 120。那么可用的“第一个”键是什么?和“第二个”键,基于第一个?等等...

任何提示(或链接)都将受到欢迎。

0 投票
3 回答
350 浏览

java - 存储词关联的数据结构

我试图通过分析句子来实现预测。考虑以下[相当无聊的]句子

我想对上述句子有一个数据结构如下:

一般来说,Word: (Word_it_appears_with, Frequency), ....

请注意此类数据的固有冗余。显然,如果 的频率ABC为 2 under Call,则 的频率Call为 2 under ABC。我该如何优化呢?

这个想法是在输入新句子时使用这些数据。例如,如果Call已经输入,从数据中,很容易说它ABC更有可能出现在句子中,并将其作为第一个建议提供,然后再和DEF

我意识到这是实现预测的一百万种可能方法中的一种,我热切期待其他方法的建议。

谢谢