问题标签 [scalding]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 烫伤 NoClassDefFoundError
在 OSX 上安装 java 后,scala scalding 尝试运行 WordCountJob 文件时出现以下错误
编译 WordCountJob.scala scalac -classpath /Users/me/.sbt/boot/scala-2.9.3/lib/scala-library.jar:/Drive/me/Coding/scalding/scalding-core/target/scala-2.9。 3/scalding-core-assembly-0.9.1.jar:/var/folders/5q/7bth9vvd2tv8q57f737f6jxm0000gn/T/maven/hadoop-core-1.1.2.jar:/var/folders/5q/7bth9vvd2tv8q57f737f6jxm0000gn/T/maven/ commons-codec-1.8.jar:/var/folders/5q/7bth9vvd2tv8q57f737f6jxm0000gn/T/maven/commons-configuration-1.9.jar:/var/folders/5q/7bth9vvd2tv8q57f737f6jxm0000gn/T/maven/jackson-asl-0.9.5。 jar:/var/folders/5q/7bth9vvd2tv8q57f737f6jxm0000gn/T/maven/jackson-mapper-asl-1.9.13.jar:/var/folders/5q/7bth9vvd2tv8q57f737f6jxm0000gn/T/maven/commons-lang-2.6.jar:/var /folders/5q/7bth9vvd2tv8q57f737f6jxm0000gn/T/maven/slf4j-log4j12-1.6.6.jar:/var/folders/5q/7bth9vvd2tv8q57f737f6jxm0000gn/T/maven/log4j-1.2.15.jar:/var/folders/5q/7bth9vvd2tv8q57f737f6jxm0000gn/T/maven/commons-httpclient-3.1.jar:/var/folders/5q/7bth9vvd2tv8q57f737f6jxm0000gn/T/maven/commons-cli-1.2.jar:/var/folders/5007fth90f7v65djmx856 /T/maven/commons-logging-1.1.1.jar:/var/folders/5q/7bth9vvd2tv8q57f737f6jxm0000gn/T/maven/zookeeper-3.3.4.jar -d /var/folders/5q/7bth9vvd2tv8q57f737f6jxm0000gn/T/script-在线程“main”中构建 WordCountJob.scala 异常 java.lang.NoClassDefFoundError: scala/tools/nsc/Main 原因:java.lang.ClassNotFoundException: scala.tools.nsc.Main at java.net.URLClassLoader$1.run(URLClassLoader .java:202) 在 java.security.AccessController.doPrivileged(Native Method) 在 java.net.URLClassLoader.findClass(URLClassLoader.java:190) 在 java.lang.ClassLoader.loadClass(ClassLoader.java:306) 在 sun。 misc.Launcher$AppClassLoader。loadClass(Launcher.java:301) 在 java.lang.ClassLoader.loadClass(ClassLoader.java:247)
有人知道如何解决这个问题吗?
mysql - 将 Scalding 生成的 CSV 导入 MySQL
我使用 Scalding 的默认Csv
写入器(指定p
要写入的路径的参数,而不是如何写入 CSV 数据的任何其他参数)生成了一个 CSV 文件,我希望将其导入 MySql。我在导入时遇到问题。
加载数据的示例查询:
示例数据(即~/examples.csv
):
当我使用数据文件运行查询时,结果表是(请原谅格式,我无法弄清楚如何在这里很好地制作表格):
第 3 行格式不正确,如果该字段等于,Scalding 如何输出 CSV "this" is quoted at the start
(即,它在字符串的开头有引号,并且不包含字段分隔符,在这种情况下,它看起来像第 4 行)。
有没有办法使用 MySql 中的FIELDS TERMINATED BY
,OPTIONALLY ENCLOSED BY
, etc 选项让它正确导入字段?
json - 在 Scalding 中解析 JSON 嵌套输入
我有一些 JSON 输入需要解析和处理(这是我第一次使用 JSON)。我的输入如下:
我的目标是编写一个烫伤脚本,按位置字段对输入进行分组并输出计数。所以在上面的例子中,“JPN”和“USA”的计数应该是 2。Scalding 提供了一个名为 JsonLine 的类。我的脚本如下:
上面的代码编译正常,但是在运行时会产生如下错误:
基本上,我不确定如何引用 Location 字段。“d.Location”不起作用,按复杂结构“d”进行分组会产生上述错误。我没有找到太多在烫伤中使用 json 进行嵌套输入解析的示例。另外,我不确定嵌套输入是否有比 JsonLine 更好的东西。
我会很感激你的帮助。
谢谢
mongodb - 将 Scala 类映射到 Scalding 或 MongoDB
我是 Scala 和 NoSQL 数据库的新手。我想知道是否存在将我的 Scala 对象映射到 NoSQL 数据库的 ORM 工具,就像 RDBMS 解决方案一样?
scala - 创建像 TextLine 这样的 Scalding Source,将多个文件组合成单个映射器
我们有许多需要合并的小文件。在 Scalding 中,您可以使用TextLine
以文本行的形式读取文件。问题是我们每个文件有 1 个映射器,但我们想组合多个文件,以便它们由 1 个映射器处理。
我知道我们需要将输入格式更改为 的实现CombineFileInputFormat
,这可能涉及使用级联CombinedHfs
。我们无法弄清楚如何做到这一点,但应该只需要几行代码来定义我们自己的 Scalding 源,例如CombineTextLine
.
非常感谢任何可以提供代码的人。
作为一个附带问题,我们有一些在 s3 中的数据,如果给定的解决方案适用于 s3 文件,那就太好了 - 我想这取决于是否CombineFileInputFormat
适用CombinedHfs
于 s3。
scala - 压缩输出缩放/级联 TsvCompressed
所以人们在压缩 Scalding Jobs 的输出时遇到了问题,包括我自己。谷歌搜索后,我在某个不起眼的论坛上得到了奇怪的答案,但没有适合人们复制和粘贴需求的东西。
我想要一个类似的输出Tsv
,但会写入压缩输出。
scala - 带有 SBT 插件的 IntelliJ 13 无法识别 Scalding 依赖项
我正在尝试通过 build.sbt 将 Scalding 2.10 添加为托管依赖项,如下所示:
IntelliJ 下载 jar 并将其添加为外部库(参见下面的屏幕),但无法解析 com.twitter 命名空间。
我已经尝试过使 IntelliJ 缓存无效和生成项目文件,sbt gen-idea
但两种解决方案都没有奏效。任何想法将不胜感激。
scala - 通过 key Scalding Hadoop 写入多个输出,一个 MapReduce Job
如何在单个 Map Reduce 作业中使用 Scalding(/cascading) 根据键写入多个输出。我当然可以使用.filter
所有可能的键,但这是一个可怕的 hack,它会激发许多工作。
scala - VerifyError?: 方法: 应用签名: ()Lcascading/pipe/Pipe;) 非法使用非虚函数调用
当我的代码尝试调用Checkpoint时,就会发生这种情况。我已经清理并重建了。
scala - 将元素列表转换为 tuple5,防止索引越界
我正在尝试从 scala 列表中创建一个元组:
但是elems
可能有 1 到 5 个元素,所以很明显我会遇到索引越界异常。
这样做的scala /烫伤方式是什么?我猜正确的方法是迭代从 1 到 5 的范围并从那里生成元组。
null
当元素不存在时,我想返回(出于兼容性原因)。