2

所以当我今天在 DataBricks 社区版上尝试一些想法时,我突然发现 python pandas 不能再读取现有的上传表。这些目录以前可以工作,但我以前上传的表都不能再读取了,都以“ File ... Not Exist”返回。有谁知道我们能做什么?

使用的命令:

import pandas as pd
df = pd.read_csv('/dbfs/FileStore/tables/iris.csv')

文件肯定在那里,这也会影响我之前上传的所有其他文件。

数据库文件系统

在此处输入图像描述

任何建议将不胜感激

4

1 回答 1

1

你是如何加载csv的?来自blob?如果来自 blob,您可能尚未安装。

您可以尝试阅读为火花吗?如果无法读取,则文件已损坏。如果可以,请尝试申请sdf.to.pandas()

sdf = spark.read.csv('/FileStore/tables/iris.csv', header="true", inferSchema="true")
于 2021-02-22T06:04:40.210 回答