1

在配置单元中,如果我在表创建语句中使用 loaction 子句(提及配置单元的默认位置以外的位置)创建一个内部表,那么在删除该表时,它将从指定位置删除数据,就像数据默认时一样蜂巢的位置?

4

1 回答 1

2

是的,即使它不是配置单元的默认位置,它也会删除该位置。假设我在 /user/yashu/test5 目录的默认数据库中有测试表。

hive> desc formatted test_tmp;
+-------------------------------+-------------------------------------------------------------+-----------------------+--+
|           col_name            |                          data_type                          |        comment        |
+-------------------------------+-------------------------------------------------------------+-----------------------+--+
| # col_name                    | data_type                                                   | comment               |
|                               | NULL                                                        | NULL                  |
| id                            | int                                                         |                       |
| name                          | string                                                      |                       |
|                               | NULL                                                        | NULL                  |
| # Detailed Table Information  | NULL                                                        | NULL                  |
| Database:                     | default                                                     | NULL                  |
| Owner:                        | shu                                                   | NULL                  |
| CreateTime:                   | Fri Mar 23 03:42:15 EDT 2018                                | NULL                  |
| LastAccessTime:               | UNKNOWN                                                     | NULL                  |
| Protect Mode:                 | None                                                        | NULL                  |
| Retention:                    | 0                                                           | NULL                  |
| Location:                     | hdfs://nn1.com/user/yashu/test5                   | NULL                  |
| Table Type:                   | MANAGED_TABLE                                               | NULL                  |
| Table Parameters:             | NULL                                                        | NULL                  |
|                               | numFiles                                                    | 1                     |
|                               | totalSize                                                   | 12                    |
|                               | transient_lastDdlTime                                       | 1521790935            |
|                               | NULL                                                        | NULL                  |
| # Storage Information         | NULL                                                        | NULL                  |
| SerDe Library:                | org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe          | NULL                  |
| InputFormat:                  | org.apache.hadoop.mapred.TextInputFormat                    | NULL                  |
| OutputFormat:                 | org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat  | NULL                  |
| Compressed:                   | No                                                          | NULL                  |
| Num Buckets:                  | -1                                                          | NULL                  |
| Bucket Columns:               | []                                                          | NULL                  |
| Sort Columns:                 | []                                                          | NULL                  |
| Storage Desc Params:          | NULL                                                        | NULL                  |
|                               | field.delim                                                 | ,                     |
|                               | serialization.format                                        | ,                     |
+-------------------------------+-------------------------------------------------------------+-----------------------+--+

hadoop 目录在 test 5 目录中有一个 .txt 文件

 bash$    hadoop fs -ls /user/yashu/test5/
    Found 1 items
    -rw-r--r--   3 hdfs hdfs         12 2018-03-23 03:42 /user/yashu/test5/test.txt

Hive 表数据

select * from test_tmp;
+--------------+----------------+--+
| test_tmp.id  | test_tmp.name  |
+--------------+----------------+--+
| 1            | bar            |
| 2            | foo            |
+--------------+----------------+--+

一旦我将表放在 hive 中,那么目录 test5 也会从 hdfs 中删除

hive> drop table test_tmp;
bash$ hadoop fs -ls /user/yashu/test5/
ls: `/user/yashu/test5/': No such file or directory

因此,一旦我们删除了 hive 中的内部表即使 hive 表不在默认位置,也会删除表指向的目录(位置)。

于 2018-03-23T07:50:41.423 回答