我不是在征求意见,而是在寻求文件方面的更多信息。
我们有很多数据文件(XML、CSV、Plantext 等),需要对它们进行处理、数据挖掘。
首席数据库人员建议使用存储过程来完成任务。基本上,我们有一个临时表,文件在其中被序列化,并保存到一个 clob 或 XML 列中。然后从那里他建议进一步使用存储过程来处理文件。
我是具有 db 背景的应用程序开发人员,在应用程序开发方面更是如此,我可能有偏见,但在数据库中使用这种逻辑似乎是个坏主意,我无法找到任何文档来证明或反对我所指的内容就像将汽车放在火车轨道上以拉动货物一样。
所以我的问题是:当我们谈论正则表达式搜索、搜索和替换 clob 中的数据、dom 遍历、递归时,数据库(Oracle、DB2、MySQL、SqlServer)的性能如何?在相同的问题上,与 Java、PHP 或 C# 等编程语言相比。
编辑
所以我正在寻找的是关于特定编程语言与 DBMS 的比较/运行时分析的文档,特别是字符串搜索和替换、正则表达式搜索和替换。XML Dom 遍历。递归方法调用的内存使用情况。尤其是在遇到 10 到 100 GB 的数据时,它们的扩展能力如何。