问题标签 [text]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 如何检测文本文件的编码/代码页
在我们的应用程序中,我们接收来自不同来源的文本文件(.txt
、.csv
等)。阅读时,这些文件有时包含垃圾,因为这些文件是在不同/未知的代码页中创建的。
有没有办法(自动)检测文本文件的代码页?
detectEncodingFromByteOrderMarks
构造函数上的,StreamReader
适用于UTF8
和其他 unicode 标记的文件,但我正在寻找一种方法来检测代码页,例如ibm850
, windows1252
。
感谢您的回答,这就是我所做的。
我们收到的文件来自最终用户,他们对代码页一无所知。接收者也是最终用户,到目前为止,这就是他们对代码页的了解:代码页存在,而且很烦人。
解决方案:
- 在记事本中打开接收到的文件,查看一段乱码。如果有人叫弗朗索瓦什么的,用你的人类智慧你可以猜到这一点。
- 我创建了一个小应用程序,用户可以使用它打开文件,并输入用户知道在使用正确代码页时它将出现在文件中的文本。
- 循环遍历所有代码页,并使用用户提供的文本显示给出解决方案的代码页。
- 如果弹出更多 as 一个代码页,请要求用户指定更多文本。
sql - 在 SQL 中存储任意(可能标记的)文本的规范方法是什么?
wikis/stackoverflow/等做什么。在存储文本时该怎么做?文本是否在换行符处断开?它被分成固定长度的块吗?你如何最好地存储任意长的文本块?
sql - SQL 剥离文本并转换为整数
在我的数据库(SQL 2005)中,我有一个包含评论的字段,但在评论中我有一个 id,我想只删除 id,如果可能将其转换为 int:
activation successful of id 1010101
上面的行是 db 字段中数据的确切结构。
不,我不想在应用程序的代码中这样做,我实际上不想碰它,以防万一你想知道;-)
wpf - WPF 中的自定义文本换行
有没有办法在 WPF 中的非矩形容器中包装文本?
python - python正则表达式分割段落
如何编写一个正则表达式在 python 中使用来分割段落?
一个段落由 2 个换行符 (\n) 定义。但是可以有任意数量的空格/制表符以及换行符,它仍然应该被视为一个段落。
我正在使用 python,因此该解决方案可以使用扩展的 python正则表达式语法。(可以利用(?P...)
东西)
例子:
我能提供的最好的方法是:r'[ \t\r\f\v]*\n[ \t\r\f\v]*\n[ \t\r\f\v]*'
,即
但这很丑陋。有更好的吗?
编辑:
拒绝的建议:
r'\s*?\n\s*?\n\s*?'
-> 这将使示例 2 和 3 失败,因为\s
包含\n
,因此它将允许超过 2\n
秒的段落中断。
python - 如何修改文本文件?
我正在使用 Python,并且想在不删除或复制文件的情况下将字符串插入文本文件。我怎样才能做到这一点?
xml - 用于非 Web 开发应用程序的 XML 与文本
我做了很多系统编程,其中我的应用程序无法用于通过网络进行通信或通过浏览器查看。但是,管理层一直在推动使用 XML。例如,如果我想保留时间日志,我可以使用这样的文本文件:
命令日期时间项目
在 2008/09/23 08:00:00 PROJ1
更改 2008/09/23 09:00:00 PROJ2
出 2008/09/23 12:00:00 PROJ2
在 2008/09/23 01:00: 00 PROJ3
出 2008/09/23 05:00:00 PROJ3
XML 看起来像这样:
<timelog>
<timecommand cmd=in date=2008/09/23 time=8:00:00 proj=PROJ1/>
...
<timecommand cmd=out date=2008/09/23 time=5:00:00 proj=PROJ3/>
</timelog>
我看到的文本版本的一些初始优势是它易于阅读和使用正则表达式解析。在这种情况下使用 XML 有什么好处?
text - 换行符
您的软件是否处理来自其他系统的换行符?
出于精神错乱的原因,我将在我的文本文件中使用 Linux 版本的换行符。但是,当我把我的文本文件带到 Windows 时,有些程序不能很好地处理我的文本中的换行符。你会如何处理这个问题?
c++ - 如何删除 C++ std::string 中的重音符号和波浪号
我对 C++ 中的一个字符串有疑问,该字符串在西班牙语中有几个单词。这意味着我有很多带有重音符号和波浪线的单词。我想将它们替换为没有重音的对应物。示例:我想替换这个词:“había”代表 habia。我尝试直接替换它,但使用字符串类的替换方法,但我无法让它工作。
我正在使用这段代码:
像这样的地图在哪里dictionary
(有更多条目):
和toReplace
字符串是:
我显然必须遗漏一些东西。我想不通。有没有我可以使用的图书馆?
谢谢,
c# - 解析性能(If、TryParse、Try-Catch)
我非常了解处理解析文本以获取信息的不同方式。例如,对于解析整数,可以预期什么样的性能。我想知道是否有人知道这方面的任何好的统计数据。我正在从测试过这个的人那里寻找一些真实的数字。
其中哪一个在哪些情况下提供最佳性能?