我正在寻找一种解决方案,它可以让我将代码与数据放在一起。作为 Db,我有 Cassandra,并且希望能够获取位于特定节点上的数据。
这里的重要性在于,我尝试在不使用框架(如 Hadoop 或 Spark)的情况下从自己的代码中实现它。
我很高兴,如果有人可以解释或提供链接,因为我还没有找到解决方案。这里的问题是,如何使用 Cassandra 实现这一点。
提前致谢
我正在寻找一种解决方案,它可以让我将代码与数据放在一起。作为 Db,我有 Cassandra,并且希望能够获取位于特定节点上的数据。
这里的重要性在于,我尝试在不使用框架(如 Hadoop 或 Spark)的情况下从自己的代码中实现它。
我很高兴,如果有人可以解释或提供链接,因为我还没有找到解决方案。这里的问题是,如何使用 Cassandra 实现这一点。
提前致谢
最简单的方法是使用字节顺序分区器。这基于主键的实际字节顺序而不是使用散列将数据放置在节点上。此技术仅供专家使用,它消除了 Cassandra 的许多优点,并且只应由真正了解权衡的人使用。ByteOrderedPartitioner 还给应用程序设计人员和 sysops 团队带来了更多的负担,因为系统现在无法以易于理解的方式进行扩展。
真正的解决方案是使用 Hadoop 或 Spark。您可以通过尝试直接从磁盘读取 sstables 来获得您正在寻找的数据位置。这方面的一个例子:http ://www.fullcontact.com/blog/cassandra-sstables-offline/