是否可以获得上次打开文件的时间,就像ls -ltu
列出所有文件一样,使用dbutils
. 我们需要在 Databricks 注释中获取有关 ADLS 文件的统计信息。
问问题
928 次
1 回答
1
ls -ltu
不幸的是,在使用 Databricks Utilities (DBUtils) 时不能使用选项。
用法: dbuitls.fs.ls
ls命令返回的序列包含以下属性:
使用Hadoop 文件系统 API获取 Azure Databricks 中 DBFS 文件系统的上次访问时间。
此代码使用 Hadoop 文件系统的 listStatus 方法根据修改时间对 DBFS 文件进行排序。
import org.apache.hadoop.fs._
val path = new Path("/mnt/abc")
val fs = path.getFileSystem(spark.sessionState.newHadoopConf)
val inodes = fs.listStatus(path).sortBy(_.getModificationTime)
inodes.filter(_.getModificationTime > 0).map(t => (t.getPath, t.getModificationTime, t.getLen)).foreach(println)
示例 1: Databricks 笔记本中有关 ADLS 文件的统计信息
示例 2 : Databricks 笔记本中关于 DBFS 文件的统计信息
于 2020-04-29T07:03:30.460 回答