我正在使用列表中的几个文件名,我已经选择了以 txt 结尾的文件来进行一些处理:
my_files = ['my_doc_raw.txt', 'my_doc_transformed.txt', 'some_other_doc.txt', 'requirements.txt']
在这种情况下,只有一个文件my_doc_raw.txt
需要my_doc_transformed.txt
经过下游处理,而不是两者。确保我只保留一个的最佳方法是什么?我很难弄清楚如何通过删除这两个文件来进行过滤。
请注意,我有一个脚本来确定列表中项目的数据类型。例如:
[ data_type(i) for i in my_files ]
#result
["my_doc", "my_doc", "other_doc", "requirements"]
所以考虑到现在我有重复my_doc
但我不确定从那里去哪里或采取其他方法,这让我更接近一点。有小费吗?