在我开始之前,是的,我知道我要解释的一切都是背道而驰的,但目前这是我必须处理的。
我的组织正在进行 Cognos 10 BI 实施,目前我们在数据立方体方面遇到了巨大的性能问题,严重阻碍了我们的最终用户以临时方式对数据进行切片的能力。从历史上看,我们使用从 SAP 中提取的大量数据,在 ms-access 中进行操作以提供每天更新的数据源,最终用户可以在 Excel 中进行数据透视。
由于这不是事务性数据,因此它可以正常工作,因为我们从来没有超过 50 万条记录,性能从来都不是问题。
由于我们的实施团队无法为管理提供可运行的数据立方体,我们可以使用这些数据立方体来提供静态视图和报告,我的任务是使用 Cognos 数据提取来临时重新创建旧系统。
我遇到的问题是随机,每周 3 次,下一次 1 次,文件将包含无法解析的记录。我怀疑这是一个特殊字符问题,因为我可以重新下载文件并且它在第二次或第三次运行良好。
有没有人有类似的经验?我意识到 Cognos 提供的数据集并不是为此目的而设计的,但奇怪的是 20% 的文件会包含损坏。同样奇怪的是,当我选择 .xls 电子表格作为下载格式时,它似乎是一个扩展名为 .xls 的 Unicode 文本文件
任何见解将不胜感激。
编辑:区分文件将是我的下一个实验,即使它们是逐字节可比的,但我已经比较了在一个文件中无法解析的特定记录,但在下一个文件中可以解析并且没有发现任何差异。
至于导入,我手动将文件转换为 Unicode 文本并从该格式导入。