我来自 pandas,它有一个方便的skiprows
参数,如下所示:
df = pd.read_csv(tsv_file, sep="\t", encoding=encoding, skiprows=3, thousands=",")
我怎么能用 gota 做到这一点?
您可以encoding/csv
先使用来操作行。
有2种方法。
csv.Read()
读取每一行。这是示例,请参阅评论以查看第一种和第二种方法。
package main
import (
"encoding/csv"
"fmt"
"os"
"github.com/go-gota/gota/dataframe"
)
func main() {
f, err := os.Open("sample.csv")
if err != nil {
panic(err.Error())
}
defer f.Close()
csv := csv.NewReader(f)
err = SkipRows(csv, 3) // this will skip rows in csv FIRST METHOD
if err != nil {
panic(err.Error())
}
records, err := csv.ReadAll() // get all records
if err != nil {
panic(err.Error())
}
// records = records[3:] // SECOND METHOD
df := dataframe.LoadRecords(records)
fmt.Println(df.Records())
fmt.Println(df.Names())
}
func SkipRows(csv *csv.Reader, skip int) (err error) {
for i := 0; i < skip; i++ {
_, err = csv.Read()
if err != nil {
return
}
}
return
}
样本.csv
1,1,1
2,2,2
3,3,3
header1,header2,header3
5,5,5
6,6,6
7,7,7
8,8,8
9,9,9
10,10,10
11,11,11
12,12,12
13,13,13
14,14,14
15,15,15
16,16,16
17,17,17
18,18,18
19,19,19
20,20,20
21,21,21
输出
[[header1 header2 header3] [5 5 5] [6 6 6] [7 7 7] [8 8 8] [9 9 9] [10 10 10] [11 11 11] [12 12 12] [13 13 13] [14 14 14] [15 15 15] [16 16 16] [17 17 17] [18 18 18] [19 19 19] [20 20 20] [21 21 21]]
[header1 header2 header3]
ReadCSV
函数的末尾LoadRecords
就像我的例子一样调用。https://github.com/go-gota/gota/blob/f70540952827cfc8abfa1257391fd33284300b24/dataframe/dataframe.go#L1360