2

SnappyData v.0.5

我想做一些类似于加载快速启动加载脚本中的镶木地板文件的事情。

CREATE TABLE STAGING_AIRLINEREF 使用镶木地板选项(路径'../../quickstart/data/airportcodeParquetData');

但是,我有 CSV 文件而不是镶木地板文件。我在任何 RowStore 文档中都没有看到“使用镶木地板”或 CSV 版本,所以我猜测了一下,结果失败了。

使用 csv 选项创建表 STAGING_ROADS(path 'roads.csv');

如何直接从 CSV 文件创建表,其中标题行是列名,其余作为数据行加载?

编辑

好的。遵循 Spark-CSV 语法,我加载此文件并获取零行或表。

"roadId","name"
"1","Road 1"
"2","Road 2"
"3","Road 3"
"4","Road 4"
"5","Road 5"
"6","Road 6"
"7","Road 7"
"8","Road 8"
"9","Road 9"
"10","Road 10"


snappy> run '/home/ubuntu/data/example/load_roads.sql';
snappy> SET SCHEMA A;
0 rows inserted/updated/deleted
snappy> DROP TABLE IF EXISTS STAGING_ROADS;
0 rows inserted/updated/deleted
snappy> CREATE TABLE STAGING_ROADS
(road_id string, name string)
USING com.databricks.spark.csv
OPTIONS(path '/home/ubuntu/data/example/roads.csv', header 'true');
0 rows inserted/updated/deleted
4

2 回答 2

4

您可以使用以下方式:

CREATE TABLE STAGING_ROADS USING com.databricks.spark.csv OPTIONS(path 'roads.csv', header "true");
于 2016-07-25T20:54:47.597 回答
1

是的,不幸的是,shell 显示从 JDBC 返回的集合,并且可能会误导 DDL 命令。请注意,即使对于“SET SCHEMA”,它也是如此。添加了一个新的 JIRA 来跟踪此问题 - https://jira.snappydata.io/browse/SNAP-940

于 2016-07-26T00:36:26.357 回答