0

Hadoop中有nutch数据,我通过get(key,val)方法获取值,但是如何将可写数据转移到其原始类中。我的代码粘贴在下面:

Text key = new Text();
key.set(url);
Writable value = null;
value = reader.get(key, value);

值是这样的:

Version: -1
url:http://www.google.com
base: http://www.google.com
contentType: application/xhtml+xml
metadata:***
Content:
<!DOCTYPE html****

以及如何获取仅获取内容或内容类型?我可以将值转移到其原始类并使用 getContent() 方法吗?

4

1 回答 1

0

如果运行时类型为valueorg.apache.nutch.protocol.Content,则可以强制转换为该类型,然后调用该getContent()方法

Content content = (Content) value;
content.getContent();
于 2012-06-01T02:32:09.070 回答