问题标签 [word-count]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
169 浏览

java - java中wordCount频率返回重复Set

我有一个将单个单词作为字符串返回的方法。我需要计算读取文本块的方法返回的所有单词。问题是我的计数正确但输出错误。它在重复。不太确定哪里出了问题?

0 投票
0 回答
1139 浏览

java - 编译hadoop 1.0.3字数代码

我收到这个错误。我正在使用 jdk1.7 和 Hadoop1.0.3

谁能告诉如何摆脱这个错误

0 投票
1 回答
225 浏览

d - 为什么这个 wc 示例中的字符串设置为 null?

今天对D语言有点好奇,于是翻了一下官网,在官网上看到了如下的wc实现:

无论如何,在第 86 行,代码在字典中第一次出现该单词时将 buf 设置为 null。

这样做有什么好处?我测试了省略那部分的方法,得到了相同的结果。

0 投票
2 回答
2362 浏览

python - 如何使用 Python 计算特定目录中文本文件的唯一单词?

我正在写一份报告,我需要计算文本文件的唯一单词。

我的文本在 D:\shakeall 中,它们总共有 42 个文件...

我对 Python 有所了解,但我现在不知道该怎么办。

这就是我所知道的它是如何工作的。

  1. 读取目录中的文件

  2. 从文本中组成一个单词列表

  3. 计算总数/唯一词

我所知道的就是这个。还有一些关于 for、while、列表和索引、变量、列表...

我想做的是制作自己的函数库并使用它来获得结果。

我非常感谢任何关于我的问题的建议。

------ps

我对 Python 几乎一无所知。我只能做一个简单的数学运算或在列表中打印单词……给定的主题对我来说太难了。对不起。

0 投票
3 回答
12209 浏览

python - 计算python中的唯一单词

直接来说,到目前为止我的代码是这样的:

我想添加一个代码来计算模式中的唯一单词(此路径中的 42 个 txt 文件),但我不知道如何。有谁能够帮助我?

0 投票
4 回答
8034 浏览

java - 如何让 WordCount.java 在 Cloudera 4 上编译?

我正在尝试在 Cloudera 4 的 linux (CentOS) 安装上编译一个简单的 WordCount.java map-reduce 示例。当我引用任何 hadoop 类时,我一直遇到编译器错误,但我无法弄清楚哪些 jars /usr/lib/hadoop 下的数百个我需要添加到我的类路径中才能编译。任何帮助将不胜感激!我最想要的是一个用于字数统计的 java 文件(以防我发现的文件由于某种原因不好)以及用于编译和运行它的相关命令。

我正在尝试仅使用 javac 而不是 Eclipse 来做到这一点。无论哪种方式,我的主要问题是 Cloudera 4 安装中的 Hadoop 库到底是什么,我需要包含这些库才能编译经典的 WordCount 示例。基本上,我需要将 Java MapReduce API 类(Mapper、Reducer 等)放在我的类路径中。

0 投票
1 回答
2284 浏览

java - Cloudera Manager 4.0 字数统计示例

我安装了 Cloudera Manager 并有 2 个节点连接到一个主节点。我正在尝试使用 cloudera 在此链接上提供的教程运行 wordcount 程序: https ://ccp.cloudera.com/display/SUPPORT/Hadoop+Tutorial#HadoopTutorial-InputsandOutputs

Cloudera 说要编译我在命令提示符下使用 nano 创建的 WordCount.java 文件。我创建了 Wordcount_Classes 目录并将 wordcount.java 文件放在那里。我不知道该目录是否应该移动到 cloudera 目录之一中的某个位置以使 java 代码工作?或者,如果我做错了什么。我安装了 Cloudera Manager,它已经在所有节点上自动安装了 ClouderaHadoop。我在我的终端上得到这个:

有人可以帮我运行 wordcount 程序或指导我应该做什么,或者如果有人知道我找不到的在线教程吗?谢谢!

0 投票
1 回答
468 浏览

asp.net - ASP.NET 的字符和消息计数

任何人都知道如何在文本框中有 160 个或更多字符时将标签增加到 2(或更多)条消息?

0 投票
4 回答
3612 浏览

c - 读取标志和文件的命令行参数 C

你好,我是 C 新手,我正在尝试开始这个实验,其中命令语法是首先列出所有命令行标志,然后列出一个或多个文件名。

我在组织如何扫描输入参数以及区分标志和文件名时遇到了麻烦。

我想过做一个循环来查看参数是标志还是文件名。但我不确定如何开始实施它。由于前 4 个参数可以是任何顺序的潜在标志,因此后面的任何内容都是文件名。但也有可能不给出标志而只以文件名开头。我根本不知道如何初始化这个循环以逐个遍历每个参数。有人可以帮忙吗?

可能的命令行参数示例:

0 投票
2 回答
5769 浏览

c - 命令行参数读取 C 中的标志和文件名

您好,我正在做一个项目,我需要我的程序从命令行运行,并且能够读取将在程序中使用的标志和文件名。

这是我当前的代码。它在不输入任何标志的情况下编译。我不认为我的 GetArgs 有任何作用。我对那部分代码有帮助。