问题标签 [scala-nlp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
scala - 使用 ScalaNLP 分词器时过滤掉数字
scala中是否有命令忽略所有类型的数字,例如“ IgnoreNumbers() ~> ”?
我是一个 scala 新手,事实上,我只需要使用这种语言的一个脚本。
非常感谢您的帮助!
这是来自这里的标记器http://nlp.stanford.edu/software/tmt/tmt-0.4/examples/example-1-dataset.scala:
scala - 使用 Scala 和 Breeze 进行无替换采样
是否支持从多项分布中抽样而不进行替换?我在想象某种代码,例如:
,其中最相关的位是传递给 mult.sample() 的“replacement = false”参数。我想确保我对唯一索引进行采样,并且我想这样做而不为每次抽签定义一个新的多项分布。
或者,如果有更好的方法来实现相同的结果,我也很高兴听到这个消息。
scala - 使用 ScalaNLP 和 Breeze 将矩阵相乘
在下面的方法中,我试图将 DenseVector 乘以 DenseVector ,其中 DenseVector 之一是方法参数:
这会导致编译器错误:
此代码编译:
如何将features
参数乘以dv
?我不确定编译器错误的含义,与我没有在方法中指定 DenseVector 的大小有关吗?
scala - scalanlp 微风线性代数:将两个向量压缩在一起
我习惯于使用列表。如果我有两个最后一个 A 和 B 以及一个需要两个双打并返回一个双打的函数,那么我可以执行以下操作
这是我的大脑习惯于思考这些问题的方式。
现在我正在用 Breeze 做线性代数,A 和 B 都是 DenseVector[Double] 类型,它们没有 zip 方法。有没有一个很好的选择来做我想要实现的目标?
scala - 用 Scala 库微风填充矩阵
我是 Scala 的新手,我在一个看似简单的问题上遇到了障碍。我正在使用 Scala 库breeze
,需要采用array buffer
(可变)并将结果放入矩阵中。这……应该很简单但是?Scala 如此疯狂的类型转换breeze
似乎对制作 DenseVector 时将采用的数据类型非常挑剔。这只是一些原型代码,但任何人都可以帮我想出一个解决方案吗?现在我有类似的东西......
在微风中,您可以执行类似
的操作M(0,0) = 100
并将第一个值设置为 100,您也可以执行以下操作:
M(0, 0 to 2) := DenseVector(1, 2, 3)
将第一行设置为 1、2、3 但我无法让它执行类似...
并成功将第一行更改为 1、2、3。那是一个列表,甚至不是一个 ArrayBuffer。
我愿意从 ArrayBuffer 更改数据类型,但根本不知道如何处理...
注意:我是一个 Python 程序员,他习惯于使用numpy
并且只是给它数组。该breeze
文档没有提供足够的其他数据类型示例,我无法弄清楚这一点。谢谢!
scala - 使用 scalanlp 微风优化库最大化指数方程
我有一个公式(称为 Chritoffersen 测试),如下所示: ∑(1-C(i) )(log(a * b * D(i)^(b-1))-1))
其中 a = ∑(1 - C(i)/∑D(i)^b 和 b 是 double 值求和是 i 从 1 到 n ( +ve 整数) 和 C & D 是等长向量。
我想找到 0 < b < infinity 的第一个表达式的最大值
这就是我到目前为止的方式。我找不到日志,或者如何表达 b 范围(如果我说 b 是双精度,那么那些表达式和约束不起作用,如果我说 b 是实数,那么那些乘法不起作用)
是否可以轻而易举地表达这一点以找到优化的解决方案?