当您键入具有特定模式的 3 行并将列一直向下拖动时,您就知道 Excel 中的功能 Excel 会尝试为您继续该模式。
例如
类型...
- 测试一
- 测试2
- 测试3
Excel 将继续:
- 测试4
- 测试5
- 试...
同样适用于其他一些模式,例如日期等。
我正在尝试完成类似的事情,但我也想处理更多特殊情况,例如:
- 测试蓝色的东西
- 测试黄色的东西
- 测试红色的东西
现在基于这些条目,我想说模式是:
- 测试-[动态]-某事
继续使用其他颜色的 [DYNAMIC] 完全是另一回事,我现在真的不在乎。我最感兴趣的是检测模式中的 [DYNAMIC] 部分。
我需要从大量池条目中检测到这一点。假设您有 10.000 个具有这种模式的字符串,并且您希望根据相似性对这些字符串进行分组,并检测文本的哪个部分不断变化([DYNAMIC])。
文档分类在这种情况下可能很有用,但我不知道从哪里开始。
更新:
我忘了提到也可以有多个 [DYNAMIC] 模式。
如:
- test_[动态] 12 [动态2]
我认为这并不重要,但我计划在 .NET 中实现它,但任何有关使用算法的提示都会非常有帮助。