我正在尝试根据 twitter 数据计算一些新闻文章的流行度。但是,在检索推文时,我忘记了转义最终以不可用文件结尾的字符。
这是文件中的一行:
1369283975$,$337427565662830592$,$0$,$username$,$Average U.S. 401(k) balance tops $80$,$000$,$ up 75 pct since 2009 http://t.co/etHHMUFpoo #news$,$http://www.reuters.com/article/2013/05/23/funds-fidelity-401k-idUSL2N0E31ZC20130523?feedType=RSS&feedName=marketsNews
'$,$' 模式不仅作为字段分隔符出现,而且出现在我想要删除它的推文中。正确的行是:
1369283975$,$337427565662830592$,$0$,$username$,$Average U.S. 401(k) balance tops $80000 up 75 pct since 2009 http://t.co/etHHMUFpoo #news$,$http://www.reuters.com/article/2013/05/23/funds-fidelity-401k-idUSL2N0E31ZC20130523?feedType=RSS&feedName=marketsNews
我尝试使用 cut 和 sed 但我没有得到我想要的结果。解决这个问题的好策略是什么?