json - 如何将 json 文件读入 Clojure defrecord 中（稍后搜索）

Question

我在 Clojure REPL 中创建了一个 defrecord：

user=> (defrecord Data [column1 column2 column3])
user.Data

如何通过读取 .json 文件自动向此记录添加数据？defrecord 中的每一列都与 json 数据中的一个键完全对应。如果文件包含一条记录，它看起来类似于：

[
  {
    "column1" : "value1"
    "column2" : "value2"
    "column3" : "value3"
  }
]

但是文件中有成千上万条这样的记录。

我可以像这样啜饮文件的内容：

(json/read-json (slurp "path/to/file.json")))

read-json 函数的依赖项被添加到 project.clj 文件中，该文件位于我lein repl从命令行运行的目录中：:dependencies [org.clojure/data.json "0.2.1"].

我希望能够使用 Clojure 函数搜索记录的值，这样我传递给搜索函数的值介于单个记录的 column1 和 column2 值之间（即nth-record.column1 .value <= 查询 <= nth-record.column2.value）。找到匹配记录后，我想返回同一记录中另一列的值 (nth-record.column3.value)。第 1 列和第 2 列的值将是唯一的，表示不重叠的值范围。column3 的值不是唯一的。

这似乎是一个相当微不足道的任务，但我无法弄清楚如何使用 Clojure 文档或我在网上找到的示例来完成它。对我来说，记录如何在 Clojure 内部存储并不重要，只要我可以搜索它们并返回同一记录中相关字段的值即可。

score 11 · Accepted Answer

使用data.json包：

(require '[clojure.data.json :as json])

将值读入内存：

(def all-records (json/read-str (slurp "path/to/file.json")
                :key-fn keyword))
;; ==> [ { :column1 "value1", :column2 "value2", :column3 "value3" }, ...]

查找匹配记录：

(def query "some-value")
(def matching (filter #(and (< (:column1 %) query) (< query (:column2 %))) all-records))

获取第 3 列：

(map :column3 matching)

将它们收集在一起（并使其更灵活）：

(defn find-matching [select-fn result-fn records]
   (map result-fn (filter select-fn records)))

(defn select-within [rec query]
  (and (< (:column1 rec) query) (< query (:column2 rec))))

(find-matching #(select-within % "some-value") :column3 all-records)

score 1 · Accepted Answer

可能应该使用柴郡来提高速度。
如果您的查询变得足够复杂，请考虑使用 lucene，clojure 有一个很好的包装器。

我认为您认为记录在某种程度上比地图更适合于此，据我所知，您没有使用任何使记录变得特别的功能，例如多态性。可能有办法让柴郡吐出唱片，但我不会打扰。

json - 如何将 json 文件读入 Clojure defrecord 中（稍后搜索）

2 回答 2

Related

Reference