我们有两种类型的日志:
1) 会话日志:SESSION_ID、USER_ID、START_DATE_TIME、END_DATE_TIME
2) 事件日志:SESSION_ID、DATE_TIME、X、Y、Z
我们只需要存储事件日志,但想将 SESSION_ID 替换为其对应的 USER_ID。我们应该使用哪些技术(即 Flume?)将数据存储在 HDFS 中?
谢谢!
我们有两种类型的日志:
1) 会话日志:SESSION_ID、USER_ID、START_DATE_TIME、END_DATE_TIME
2) 事件日志:SESSION_ID、DATE_TIME、X、Y、Z
我们只需要存储事件日志,但想将 SESSION_ID 替换为其对应的 USER_ID。我们应该使用哪些技术(即 Flume?)将数据存储在 HDFS 中?
谢谢!