我有一个包含以下数据的 .CSV:
"http://iis.se/write-content/?submitted","The intro","<p>Lorem ipsum dolor sit amet, consectetur adipiscing elit. Phasellus dictum lectus eget enim condimentum, eget bibendum libero porta. Suspendisse vestibulum libero nisl, quis tempus nisl semper in. Ut mi nisl, vehicula quis tristique ut, molestie et est. Donec auctor, ante eu venenatis aliquam, felis nisi pretium turpis, ut mattis dui orci et sem. Duis vitae accumsan velit. Sed tristique lacus nisl, vehicula congue turpis ultrices sed. In hac habitasse platea dictumst. Sed dictum scelerisque nibh non venenatis. In viverra eros non arcu pellentesque, nec pulvinar turpis placerat.</p> <p>Proin suscipit metus vitae nisi dignissim ullamcorper. Nullam eleifend tempor ligula, sit amet semper metus.</p><p>Proin bibendum bibendum suscipit. Cras pretium lectus sit amet urna interdum, in ultricies eros scelerisque. Pellentesque id condimentum libero. Aenean placerat orci a dictum pharetra. Pellentesque sagittis egestas gravida. Pellentesque suscipit mauris neque, quis auctor lacus blandit et. Curabitur a quam a velit condimentum tristique. Morbi volutpat pulvinar viverra. Duis cursus lectus ac sem dictum, eu tempor risus blandit. In accumsan arcu at lorem mattis lacinia. Vestibulum vitae mollis sem, nec commodo nunc. Donec vel ultricies nunc. Nam at sapien nec libero aliquam pharetra vitae eget leo.</p><p>Read more here <a href=""http://www.google.com"">here</a></p>","Thank you!"
"http://website.com/add/?submitted","The, nice, Second","<p>Lorem ipsum dolor sit amet, consectetur adipiscing elit. Phasellus dictum lectus eget enim condimentum, eget bibendum libero porta. Suspendisse vestibulum libero nisl, quis tempus nisl semper in. Ut mi nisl, vehicula quis tristique ut, molestie et est. <a href=""http://www.altavista.com"">Donec auctor</a>, ante eu venenatis aliquam, felis nisi pretium turpis, ut mattis dui orci et sem. Duis vitae accumsan velit. Sed tristique lacus nisl, vehicula congue turpis ultrices sed. In hac habitasse platea dictumst. Sed dictum scelerisque nibh non venenatis. In viverra eros non arcu pellentesque, nec pulvinar turpis placerat.</p> <p>Proin suscipit metus vitae nisi dignissim ullamcorper. Nullam eleifend tempor ligula, sit amet semper metus.</p><p>Proin bibendum bibendum suscipit. Cras pretium lectus sit amet urna interdum, in ultricies eros scelerisque. Pellentesque id condimentum libero. Aenean placerat orci a dictum pharetra. Pellentesque sagittis egestas gravida. Pellentesque suscipit mauris neque, quis auctor lacus blandit et. Curabitur a quam a velit condimentum tristique. Morbi volutpat pulvinar viverra. Duis cursus lectus ac sem dictum, eu tempor risus blandit. In accumsan arcu at lorem mattis lacinia. Vestibulum vitae mollis sem, nec commodo nunc. Donec vel ultricies nunc. Nam at sapien nec libero aliquam pharetra vitae eget leo.</p>","Thank you!, even more!!!"
简单地,
- 在 COL1 中,我想删除顶级域之后的所有内容
- 在 COL2 中,我希望逗号、空格成为连字符,但它可能不会在任何时候加倍连字符
- COL1 和 COL2 应合并为(输出)COL1
- 在 COL3 中,除了包含在其中的域之外的所有内容都应该被删除
<a> </a>
- COL4 不可触碰
因此,在这种情况下,我希望输出变为:
"http://iis.se/the-intro","http://www.google.com","Thank you!"
"http://website.com/the-nice-second","http://www.altavista.com","Thank you!, even more!!!"
有可能还是非常先进?
我正在考虑用宏记录的 Notepad++ 中的一些 RegEx 替换。