问题标签 [scala-nlp]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
433 浏览

scala - 使用 ScalaNLP 分词器时过滤掉数字

scala中是否有命令忽略所有类型的数字,例如“ IgnoreNumbers() ~> ”?

我是一个 scala 新手,事实上,我只需要使用这种语言的一个脚本。

非常感谢您的帮助!

这是来自这里的标记器http://nlp.stanford.edu/software/tmt/tmt-0.4/examples/example-1-dataset.scala

0 投票
1 回答
985 浏览

scala - 将多项分布与 Scala 和 Breeze 包一起使用

我正在使用带有 Scala 2.10.3 的微风包,我想从多项分布中采样。

即我想对随机变量 Y 的值进行采样,其中

我无法实例化 Multinomial 类的实例,因为我无法从文档中辨别出我应该如何提供参数。

我想这就像

但是当我尝试以这种方式提供参数时,我收到以下错误:

Multinomial 类的文档说分布的参数应该作为类型 T 传递给构造函数,但我找不到关于该类型的太多信息。

有人知道如何在微风中实例化多项式吗?

0 投票
1 回答
1051 浏览

scala - 使用 Scala 和 Breeze 进行无替换采样

是否支持从多项分布中抽样而不进行替换?我在想象某种代码,例如:

,其中最相关的位是传递给 mult.sample() 的“replacement = false”参数。我想确保我对唯一索引进行采样,并且我想这样做而不为每次抽签定义一个新的多项分布。

或者,如果有更好的方法来实现相同的结果,我也很高兴听到这个消息。

0 投票
1 回答
265 浏览

scala - 使用 ScalaNLP 和 Breeze 将矩阵相乘

在下面的方法中,我试图将 DenseVector 乘以 DenseVector ,其中 DenseVector 之一是方法参数:

这会导致编译器错误:

此代码编译:

如何将features参数乘以dv?我不确定编译器错误的含义,与我没有在方法中指定 DenseVector 的大小有关吗?

0 投票
0 回答
198 浏览

scala - scalanlp 微风线性代数:将两个向量压缩在一起

我习惯于使用列表。如果我有两个最后一个 A 和 B 以及一个需要两个双打并返回一个双打的函数,那么我可以执行以下操作

这是我的大脑习惯于思考这些问题的方式。

现在我正在用 Breeze 做线性代数,A 和 B 都是 DenseVector[Double] 类型,它们没有 zip 方法。有没有一个很好的选择来做我想要实现的目标?

0 投票
1 回答
619 浏览

scala - 用 Scala 库微风填充矩阵

我是 Scala 的新手,我在一个看似简单的问题上遇到了障碍。我正在使用 Scala 库breeze,需要采用array buffer(可变)并将结果放入矩阵中。这……应该很简单但是?Scala 如此疯狂的类型转换breeze似乎对制作 DenseVector 时将采用的数据类型非常挑剔。这只是一些原型代码,但任何人都可以帮我想出一个解决方案吗?现在我有类似的东西......

在微风中,您可以执行类似 的操作M(0,0) = 100并将第一个值设置为 100,您也可以执行以下操作: M(0, 0 to 2) := DenseVector(1, 2, 3) 将第一行设置为 1、2、3 但我无法让它执行类似...

并成功将第一行更改为 1、2、3。那是一个列表,甚至不是一个 ArrayBuffer。

我愿意从 ArrayBuffer 更改数据类型,但根本不知道如何处理...

注意:我是一个 Python 程序员,他习惯于使用numpy并且只是给它数组。该breeze文档没有提供足够的其他数据类型示例,我无法弄清楚这一点。谢谢!

0 投票
1 回答
86 浏览

scala - 使用 scalanlp 微风优化库最大化指数方程

我有一个公式(称为 Chritoffersen 测试),如下所示: ∑(1-C(i) )(log⁡(a * b * D(i)^(b-1))-1))

其中 a = ∑(1 - C(i)/∑D(i)^b 和 b 是 double 值求和是 i 从 1 到 n ( +ve 整数) 和 C & D 是等长向量。

我想找到 0 < b < infinity 的第一个表达式的最大值

这就是我到目前为止的方式。我找不到日志,或者如何表达 b 范围(如果我说 b 是双精度,那么那些表达式和约束不起作用,如果我说 b 是实数,那么那些乘法不起作用)

是否可以轻而易举地表达这一点以找到优化的解决方案?