问题标签 [split]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
2759 浏览

ruby - 如何在Ruby中拆分包含逗号的单引号逗号分隔值

假设我有一个带有逗号分隔值的字符串,这些值用单引号括起来,可能包含也可能不包含逗号,如下所示:

我想把它分成一个数组

显然,如果我split(',')得到的字符串

我不明白。我想出的唯一方法是

但是有没有更优雅的方式呢?是否有我没有得到的 split 方法导致奇怪的结果?

0 投票
2 回答
896 浏览

java - 拆分字符串(尤其是在 Java 中使用 java.util.regex 或其他东西)

有谁知道如何在考虑到其转义序列的情况下拆分字符上的字符串?

例如,如果字符是 ':',则“a:b”被分成两部分(“a”和“b”),而“a:b”根本不被分割。

我认为这很难(不可能?)与正则表达式有关。

先感谢您,

凯达

0 投票
2 回答
2323 浏览

xml - 我可以使用 XSLT 将 XML 解析为子文件吗?(+ 替代语言/方法)

大家好,我有高度重复的数据,深度为 5 个节点(包括根),需要拆分。(我将在一分钟内包含一个快速示例。)我想要做的是基于 3rd-depth 节点将一个 ~5mb XML 文件解析为更小的子文件。但在那之后,它变得更加复杂。

该任务的要求如下:

  1. 子文件必须维护被提取的第 3 级节点的分层父级,包括它们的属性。
  2. 子文件必须保留所有属性和子节点。
  3. 如果 XSLT 无法处理该作业,请在 Ruby 中尝试。如果您不擅长 XSLT,但可以告诉我如何在 Ruby 甚至 Python 中做到这一点,请随时用这些语言提供答案。(否则尝试坚持使用 XSLT 或伪代码。)

DOM 层次结构:

我需要将其拆分为次要组元素,同时保留其孩子和直接父母,并将所有这些(对于每个次要组)放在一个外部文件中。我有几个文件要以这种方式拆分。

而且...以前从未在 Ruby 中解析过 XML,并且刚刚开始使用 XSLT,我还不能编写脚本来完成我的任务。

我很想知道 XSLT 是否能胜任这项任务。 :>

编辑:

这是我生成的代码,能够在文件开头显示样式表。

0 投票
4 回答
2992 浏览

unix - 如何在 unix 中拆分具有偏移值的日志文件?

我的盒子上有一个非常大的日志文件(9GB——我知道我需要修复它)。我需要拆分成块,以便将其上传到亚马逊 S3 进行备份。S3 的最大文件大小为 5GB。所以我想把它分成几个块,然后上传每个块。

这就是问题所在,我的服务器上只有 5GB 可用空间,所以我不能只进行简单的 unix 拆分。这是我想做的事情:

  1. 抓取日志文件的前 4GB 并吐出到一个单独的文件中(称为段 1)
  2. 将该段 1 上传到 s3。
  3. rm segment1 释放空间。
  4. 从日志文件中获取中间的 4GB 并上传到 s3。像以前一样清理
  5. 获取剩余的 1GB 并上传到 S3。

我找不到用偏移量分割的正确 unix 命令。Split 只做等量的事情,而 csplit 似乎也没有我需要的东西。有什么建议吗?

0 投票
2 回答
1367 浏览

c# - 将 html 拆分为单词

假设我有以下字符串:

这个字符串代表一个不被空格分隔的字符序列,在这个字符串中还插入了一个html图像。现在我想将字符串分成 words ,每个长度为 10 个字符,所以 aoutput 应该是:

所以想法是将任何 html 标记内容保持为 0 长度字符。

我写过这样的方法,但它没有考虑到html标签:

我希望看到一个执行我所描述的拆分的代码。谢谢。

0 投票
3 回答
2370 浏览

vim - 如何在vimdiff创建的拆分下方打开一个新窗口?

如果在命令提示符下,我运行

我得到一个 vim 实例,它有两个并排打开的文件,如下所示:

这很好,但有时我想打开第三个文件来查看。我不想创建另一个垂直拆分,因为否则这些行会很短,我会一直水平滚动来阅读它们。但是在屏幕底部占据几行不会有什么坏处。那么,我怎样才能从上面转到以下内容:

我尝试过使用:sp file3,但我最终得到了这个(假设我在光标位于 file1 时运行了命令):

在此先感谢您的帮助!

0 投票
14 回答
17826 浏览

ruby - 如何将一段文本解析成句子?(最好在 Ruby 中)

考虑到 Mr. and Dr. 和 USA 等案例,您如何将段落或大量文本分解成句子(最好使用 Ruby)?(假设您只是将句子放入数组数组中)

更新:我想到的一种可能的解决方案是使用词性标注器(POST)和分类器来确定句子的结尾:

从琼斯先生那里得到数据,当他走到意大利避暑别墅的阳台上时,他感觉到温暖的阳光照在他的脸上。他很高兴能活着。

分类器 Mr./PERSON Jones/PERSON 感觉/O 温暖/O 太阳/O 上/O 他/O 脸/O 作为/O 他/O 踩/O 出/O 上/O/O 阳台/O的/O 他的/O 夏天/O 家/O 在/O 意大利/LOCATION ./O 他/O 是/O 快乐/O 到/O 是/O 活着/O./O

POST Mr./NNP Jones/NNP 毡/VBD/DT 暖/JJ sun/NN on/IN his/PRP$ face/NN as/IN he/PRP step/VBD out/RP on/IN/DT 阳台/ NN 的/IN 他的/PRP$ 夏天/NN 家/NN 在/IN 意大利。/NNP 他/PRP 是/VBD 高兴/JJ 到/TO 是/VB 活着。/IN

我们可以假设,由于意大利是一个地点,句号是句子的有效结尾吗?自从以“先生”结束 没有其他词性,我们可以假设这不是一个有效的句末期吗?这是对我的问题的最佳答案吗?

想法?

0 投票
3 回答
1416 浏览

apache-flex - 从 Flex 中的 Textarea 中获取最长的字符串(以换行符结尾)

这个有点简单的任务并不是那么简单。我可以使用 mx:internals 获取 textarea 的行数,但这并不总是以换行符结尾的最长行。

我尝试了各种textArea.text.split("\n") \r <br/> {/n .. 它总是返回 1 的长度。

我永远崇拜任何能把我引向正确方向的人。

格雷格

==========

==========

0 投票
3 回答
5943 浏览

c++ - 将 escaped_list_separator 与 boost split 一起使用

我正在使用 boost 字符串库,并且刚刚遇到了 split 方法的简单性。

这会很好而且简洁......但是它似乎不适用于引号,而是我必须做类似以下的事情

我的问题是,当您引用分隔符时,可以使用拆分或其他标准算法吗?多亏了purpledog,但我已经有了一种不被弃用的方法来实现预期的结果,我只是认为它很麻烦,除非我可以用更简单更优雅的解决方案替换它,否则我一般不会在不先将其包装的情况下使用它另一种方法。

编辑:更新代码以显示结果并澄清问题。

0 投票
2 回答
595 浏览

php - 在 PHP 中拆分 SMS 网关答案

我想知道您会采取哪些其他方法在 PHP 中进行一些简单的字符串拆分。我收到来自 SMS 网关的响应,其中两个有趣的值是使用的代码和用户的文本消息。

代码可能类似于:(Freetrip小写、大写、混合大小写)

在最好的情况下,用户消息应该是例如:Freetrip 12345($code "space" XXXXX)。

每个 X 应该是 1 到 5 之间的数字。任何其他值/字符都应该返回错误。所以正则表达式将被简化为:chars=5 其中每个数字 >=1 和 <=5。

我最后需要存储的是 5 位数字中的每一个。

我最简单的方法是将整个消息字符串小写并从消息字符串中减去同样小写的代码(加上空格)。这将给我留下 5 个数字,然后我将其拆分为 5 个唯一变量以存储在数据库中。

现在棘手的部分是上述最佳情况可能难以实现。打字短信很繁琐,而且很容易出现打字错误。可能出现的一些错误如下:

  • 数字太少或太多。
  • 非数字字符。
  • XXXXX 组合后的更多字符。
  • 可能还有一些其他情况。

其中任何一个都应该返回一个单独的错误消息,我可以将其返回给发件人。