我有大约 700 万条边的大型数据集,在广泛搜索了将这些数据可视化的方法和工具之后,pygraphistry
我正在尝试在不应用任何建模的情况下可视化边和连接。但这显示没有错误超过 6 小时没有输出
我的工作环境是 python 3.x anaconda 和 windows 64 位
import pandas
import graphistry
# "GRAPHISTRY_API_KEY".
graphistry.register(key='key_from_team')
column_names = ['node1', 'node2', 'StartTime', 'EndTime']
logs = pandas.read_csv('Edges.dat', header = None, names = column_names )
logs[:4] # Show the first three rows of the loaded dataframe
'''
logs['StartTime'] = pandas.to_datetime(logs['StartTime'], unit='s')
logs['EndTime'] = pandas.to_datetime(logs['EndTime'], unit='s')
logs[:4]
'''
plotter = graphistry.bind(source='node1', destination='node2')
plotter.plot(logs)