目标是在每一行的数据框中的名为“text”的文本列中查找和替换来自 pdf 解析的工件。
"<U+FB01>"将被替换为"fi"&
"<U+FB02>"将被替换为"fl"
df<-data.frame(text=c('Das neue P<U+FB02>ege<U+FB01>nanzierungsgesetz','Die Kon<U+FB02>ikte zwischen Spitalrat und','Im neuen Spital<U+FB01>nanzierungsgesetz, welches'))
应该:
df2<-data.frame(text=c('Das neue Pflegefinanzierungsgesetz','Die Konflikte zwischen Spitalrat und','Im neuen Spitalfinanzierungsgesetz, welches'))
数据框截图:https ://i.imgur.com/UvFIrNg.png
我能找到最接近的解决方案(但无法使其工作):在列中搜索文本并完全替换
谢谢你的时间!