clojure - 在 Clojure 中有没有更好的方法来做到这一点？

Question

我有这个函数来读取文件并将其转换为两个元素列表的列表：

(def f1 "/usr/example")

(defn read-file [file]
  (let [f
        (with-open [rdr (clojure.java.io/reader file)]
          (doall (map list (line-seq rdr))))]
    (cond 
      (= file f1) (map #(map read-string (split (first %) #" ")) f)
      :else (map #(map read-string (split (first %) #"\t")) f))))

我正确使用cond了split文件（我有两种类型的文件，第一种用空格分隔元素，第二种用制表符分隔）。

第一种文件类型如下：

"1.3880896237218878E9 0.4758112837388654
1.3889631620596328E9 0.491845185928218"

而第二个是：

'1.3880896237218878E9\t0.4758112837388654
1.3889631620596328E9\t0.491845185928218"

我得到了我想要的结果，例如：

((1.3880896237218878E9 0.4758112837388654) (1.3889631620596328E9 0.491845185928218))

但我想知道是否有更清洁的方法可以做到这一点，也许使用更少的map功能或不使用cond

score 4 · Accepted Answer

这将返回一个向量向量，在任意空格上分割单独的行并Double/parseDouble用于读取单独的双精度数。它不处理文件中的任何单引号或双引号字符；如果它们是实际输入的一部分，我想我只是用正则表达式对其进行预处理以摆脱它们（见下文）。

(require '[clojure.java.io :as io] '[clojure.string :as string])

(defn read-file [f]
  (with-open [rdr (io/reader f)]
    (mapv (fn [line]
            (mapv #(Double/parseDouble %) (string/split line #"\s+")))
          (line-seq rdr))))

至于前面提到的预处理，您可以使用#(string/replace % #"['\"]" "")删除所有单引号。如果它们出现在输入的开头和结尾，或者可能是单独的行，那将是合适的。（如果引用了单独的数字，那么您需要确保没有删除它们之间的所有分隔符 - 在这种情况下，最好用单个空格替换，然后用于string/trim删除末尾的任何空格字符串。）

clojure - 在 Clojure 中有没有更好的方法来做到这一点？

1 回答 1

Related

Reference