“chunking”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

1905 浏览

nlp - 我应该删除带有 POS 标记的停用词吗？

我是这个 NLP 的新手，但我见过的所有 POS 标记和句子分块的例子似乎都没有删除停用词。所以我有一个问题，如果我正在做 POS 标记和分块，这是否消除了删除停用词（以及词干）的需要？

2013-04-17T14:17:14.503

0 投票

1 回答

332 浏览

apache - 如何在 Redhat 系统上的 Apache 2.2.3 上启用分块

我的 Apache（redhat 上的 2.2.3 版）服务器不接受分块编码，抛出此错误：

chunked Transfer-Encoding forbidden: /services/soap.

我看到有些人有同样的问题，他们建议禁用 mod_deflate.so，我评论了那行：

#LoadModule deflate_module modules/mod_deflate.so

并重新启动 Apache，但我仍然有同样的问题。

我想念什么？！

apache redhat mod-deflate chunking

2013-05-03T12:21:53.080

0 投票

1 回答

247 浏览

c# - I can't find Memory leak

Maybe this is not a good question to post but I am kinda desperate. I have a little piece of code, and i have a memory leak, but i don't know how to overcome it. please help.

I split a large stream into smaller chunks and send them to a WCF service over SsClient.SendChunk() method. Let's say I have a file which is 700 mb, i split it into 7 pieces of 100 mb chunks, and send them one by one. but after this method is done there is around 400 mb in memory which i see as memory leak. when i debug it i see memory gets filled with chunk right after SendChunk method of web service. When the method finished here I'm left with the memory leak. GC.collect() doesn't seem to work either. I didn't even understand why there is 400 mb leftover of 700 mb file? maybe that might give some clues i don't know.

any ideas?

c#memory-leaks stream garbage-collection chunking

2013-05-05T14:30:21.817

0 投票

1 回答

820 浏览

python - 使用 nltk 对阿拉伯文本进行分块

我有一个关于阿拉伯语文本分块的项目我想知道是否可以使用 NLTK 来提取阿拉伯语文本的块 NP、VP、PP 以及如何使用阿拉伯语语料库。请任何人帮助我！

python nltk chunking

2013-05-08T08:48:04.123

0 投票

0 回答

4324 浏览

ios - 通过 http post 使用块上传大型视频

我想将大视频从 iPhone 上传到网络服务器。我尝试使用以下代码。它适用于小文件，但是当我尝试上传大文件时它会崩溃。

代码：

经过研究，我有了一个想法，如果我在数据块中发送大文件，这将是可能的。解决方案1，解决方案2。

我还浏览了Stream Programming 苹果文档。但不知道在哪里定义服务器 NSURL。将数据写入输出流后如何发送到服务器。

如果有人可以将我指向任何工作代码，那么我将能够更好地理解它。

怎么做？有什么想法吗？

ios ipad http file-upload chunking

2013-05-13T10:11:00.513

0 投票

1 回答

5665 浏览

compression - hdf5 文件中与块大小相关的压缩性能

我想问一个关于压缩性能的问题，它与 hdf5 文件的块大小有关。

我手头有 2 个 hdf5 文件，它们具有以下属性。它们都只包含一个数据集，称为“数据”。

文件 A 的“数据”：

类型：HDF5 标量数据集
尺寸数量：2
尺寸尺寸：5094125 x 6
最大限度。尺寸大小：无限 x 无限
数据类型：64位浮点
分块：10000 x 6
压缩：GZIP 级别 = 7

文件 B 的“数据”：

类型：HDF5 标量数据集
尺寸数量：2
尺寸尺寸：6720 x 1000
最大限度。尺寸大小：无限 x 无限
数据类型：64位浮点
分块：6000 x 1
压缩：GZIP 级别 = 7

文件 A 的大小：HDF5----19 MB CSV-----165 MB

文件 B 的大小：HDF5----60 MB CSV-----165 MB

与 csv 文件相比，它们都显示出对存储数据的极大压缩。但是文件A的压缩率大约是原始csv的10%，而文件B的压缩率只有原始csv的30%左右。

我尝试了不同的块大小以使文件 B 尽可能小，但似乎 30% 是最佳压缩率。我想问为什么文件A可以实现更大的压缩而文件B不能。

如果文件B也能实现，那么块大小应该是多少？

这是为了压缩目的确定 HDF5 的最佳块大小的任何规则吗？

谢谢！

compression hdf5 chunking

2013-05-28T07:40:07.267

0 投票

0 回答

644 浏览

python - jQuery 文件上传器 - Django 无法正确处理块

我已经花了几天时间试图弄清楚如何告诉 Django 我的jQuery 文件上传器正在发送块而不是 x 单独的文件。

我知道我需要一个FileUploadHandler像这里这样的习惯。

我的客户端代码发布在这个问题中。

该插件作为单独的 AJAX 调用逐块发送（至少对于 FireBug，它看起来像这样）。服务器接受它们中的每一个并将它们保存为不同的名称（在我的情况下为“_1”、“_2”、“_3”...）。是的，使用了处理程序。我通过print

顺便说一句：Content-Range标题中的内容是正确的。

BTW II：不幸的是，这个插件没有使用分块......所以我这里没有解决方案。

那么，有人知道我可能做错了什么吗？我找到了其他一些FileUploadHandlers，但它们看起来都非常相似。所以我想问题不在这里？

谢谢！

python django file-upload jquery-file-upload chunking

2013-06-24T13:27:08.867

0 投票

1 回答

678 浏览

java - 无法从打开的 nlp 分块解析器的结果中提取名词短语

嗨，我使用了 openNLP 分块解析器并解析了一些文本，并在下面的堆栈溢出问题的帮助下，我尝试仅提取名词短语

如何使用 Open nlp 的分块解析器提取名词短语

但我无法提取名词短语，下面是我的代码

请建议我从解析的内容中提取 NP

谢谢

java parsing opennlp chunking

2013-07-22T06:01:10.743

0 投票

1 回答

3523 浏览

ruby - 获取托管在 S3 上的文件的行数

我们允许人们将文件上传到 S3，然后我们显示该文件中有多少行的行数。我们通过运行一个后台进程 (DelayedJob) 来做到这一点，该进程从 S3 获取文件，然后计算文档中换行符的数量。一般来说，这工作得很好。

这是完成工作的代码：

出于某种原因，一些文件的行数完全错误。例如，一个有 10,000 行的文件显示的行数为 40,000。这并不一致。大多数文件都可以正常工作。

我试图弄清楚这是否可能是由 S3 分块阅读器的工作方式引起的，或者是否有其他原因导致了问题。知道为什么记录计数会出错吗？有没有更好的方法来做到这一点，我不知道？

ruby amazon-web-services amazon-s3 chunking

2013-07-26T17:21:41.317

0 投票

1 回答

208 浏览

python - 使用python指纹打印块

我正在尝试对文件进行分块并为这些块创建 SHA1 指纹。以下是代码。当我从 python 命令提示符生成指纹时，我的文件只有一行“测试”，我得到了不同的答案。

python sha1 chunking

user1792899

2013-08-06T19:37:13.823

问题标签 [chunking]

Reference