在我正在玩的一个实验项目中,我希望能够查看文本数据并检测它是否包含表格格式的数据。当然有很多情况看起来像表格数据,所以我想知道我需要研究什么样的算法来寻找共同特征。
我的第一个想法是编写一个长的 switch/case 语句来检查由制表符分隔的数据,然后是另一个 case 来检查由管道符号分隔的数据,然后是另一个 case 来检查以另一种方式分隔的数据等等。现在我当然意识到我必须列出要检测的不同事物的列表-但我想知道是否有比对每种类型进行相对较慢的搜索更智能的方法来检测这些特征。
我意识到这个问题并不是特别雄辩地提出,所以我希望它有一些意义!
有任何想法吗?
(也不知道如何标记这个 - 所以欢迎帮助!)