问题标签 [word-count]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
2447 浏览

vb.net - 计算 txt 文件 vb.net 中的特定单词

如何使用 vb.net 计算特定文本文件中的特定单词

0 投票
1 回答
870 浏览

python - 字数 Python 3.3 程序中的可迭代错误

我正在尝试完成一个简单的字数统计程序,它可以跟踪连接文件中的字数、字符数和行数。

现在,如果一切顺利,它应该打印文件中的行数、字母和单词的总数,但我得到的只是这条消息:

“words += len(words) TypeError: 'int' object is not iterable”

怎么了?

解决了!新代码:

0 投票
2 回答
2107 浏览

hadoop - hadoop-word count - 导出的 jar 没有运行

我对 Hadoop 很陌生。我设置了单节点集群 hadoop-1.0.4,我还从 apache hadoop web 下载了示例的 jar - hadoop-exaples-1.0.4.jar。使用 jar 和命令“hadoop jar hadoop-examples-1.0.4.jar wordcount 'input-dir' 'output-dir'”我能够运行简单的 wordcount 问题。

问题 :: 现在我将在 apache hadoop 网站中发现的 wordcount 问题的代码复制到 eclipse 中并导出一个现在只包含 WordCount 类的 jar 文件,我将 jar 重命名为 wc.jar 但现在使用相同的命令“ hadoop jar wc.jar wordcount 'input-dir' 'output-dir' " ...它给出了错误 :: "Exception in thread "main" java.lang.ClassNotFoundException: WordCount " .... 我重新检查了代码并确保类名是 WordCount ......但它仍然给出同样的错误......我完全不知道该怎么办?希望你能帮忙。这是我用来制作 jar 的代码链接.... http://wiki.apache.org/hadoop/WordCount

0 投票
1 回答
404 浏览

python - 字计数器不会打印外来字符

如何设置它以打印中文和重音字符?

0 投票
2 回答
2229 浏览

hadoop - 日食的字数

我正在为hadoop使用eclipse插件。我可以通过制作一个 hadoop 服务器来查看 HDFS 中的所有文件,但是当我尝试从 eclipse 运行 wordcount.java 文件时,它给了我异常,而从终端它运行顺利。例外情况如下。

0 投票
1 回答
211 浏览

java - 将行计数器方法与字计数方法相结合

我有一个方法可以计算文本文件中单词的出现次数,并返回在特定行上找到单词的次数。但是,它不会跟踪单词所在的行号。我有一个单独的方法来计算文本文件中的行数,我想将这两种方法组合成一个跟踪行号的方法,并记录每行出现的单词。

这是我想结合起来的两种方法,以给出类似“单词在 Y 行出现 X 次”的结果

这是我原来的行数计算方法

0 投票
2 回答
3800 浏览

hadoop - 在 Hadoop 中写入 HDFS 中的文件

我一直在寻找一个磁盘密集型 Hadoop 应用程序来测试 Hadoop 中的 I/O 活动,但我找不到任何这样的应用程序可以保持磁盘利用率高于 50% 或一些实际上使磁盘繁忙的应用程序。我尝试了 randomwriter,但令人惊讶的是它并不是磁盘 I/O 密集型的。

所以,我写了一个小程序来在 Mapper 中创建一个文件并在其中写入一些文本。此应用程序运行良好,但仅在主节点中使用率很高,主节点也是名称节点、作业跟踪器和从属节点之一。在其他任务跟踪器中,磁盘利用率为零或可以忽略不计。我无法理解为什么任务跟踪器中的磁盘 I/O 如此之低。如果我做错了什么,有人可以将我推向正确的方向吗?提前致谢。

这是我在 WordCount.java 文件中编写的示例代码段,用于创建 UTF 字符串并将其写入文件 -

0 投票
5 回答
2062 浏览

java - Java中的字数

我正在为我的 CS 期末练习一些练习,并且被困在这个问题上,我必须读取一个字符串,从用户那里获得最小长度,并返回至少有那么多字母的单词数量。似乎我的代码很好,但它无法打印出答案。谁能帮我吗?

似乎while循环无限运行,但我不知道为什么!

0 投票
1 回答
257 浏览

php - 获取文档中的单词数

我即将制作一个翻译网站(使用 PHP),人们可以在其中订购翻译来翻译他们的文档。人们可以从该站点上传他们的文件,然后将其连接到该站点的翻译/成员。问题是我如何制作一个从文档中计算价格的应用程序。

评价翻译价格的最常用方法是按字数计算。所以我需要知道客户上传的文档中有多少字。我认为必须有可能从文本文件(如 word 文档)中计算单词。但是,我找不到任何方法来获取 ms word 2003 文档 (.doc) 的确切数量。我找到了一种方法来计算 .docx,但不是 .doc。并且会有更多的文件,例如 PDF 或 rtf。

我见过另一种只计算文件大小的方法,但我认为它不会对不同的文档格式给出相同的结果。或者它是?我能想到的简单方法是要求访问者将他们的文本复制/粘贴到文本区域,但我认为这不是最好的方法。

有人会给我一个建议,我该如何解决这个问题?

0 投票
4 回答
1015 浏览

c# - 根据字数过滤字符串

我正在尝试根据每个字符串中的单词数过滤字符串列表。我假设您将修剪字符串末尾的任何空格,然后计算字符串中剩余的空格数,这样 WordCount = NumberOfSpaces + 1。这是最有效的方法吗?我知道对于基于字符数的过滤,以下工作正常......只是无法弄清楚如何使用 C#/LINQ 简洁地编写它。

计算单词的任何想法?

更新:这就像一个魅力......谢谢马修: