您好,我正在使用 IBM Bluemix。在这里,我使用 Apache Spark 笔记本并从 dashDB 加载数据,我试图提供可视化效果,它不显示行,只显示列。
def get_file_content(credentials):
from pyspark.sql import SQLContext
sqlContext = SQLContext(sc)
props = {}
props['user'] = credentials['username']
props['password'] = credentials['password']
# fill in table name
table = credentials['username'] + "." + "BATTLES"
data_df=sqlContext.read.jdbc(credentials['jdbcurl'],table,properties=props)
data_df.printSchema()
return StringIO.StringIO(data_df)
当我使用这个命令时:
data_df.take(5)
我得到了前 5 行数据的信息,包括列和行。但是当我这样做时:
content_string = get_file_content(credentials)
BATTLES_df = pd.read_table(content_string)
我收到此错误:
ValueError:没有要从文件中解析的列
然后当我尝试查看.head()
或.tail()
仅显示列名时。
有人在这里看到可能的问题吗?我对python知之甚少。谢谢,麻烦您了。