问题标签 [read-text]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
436 浏览

r - 在 R 反词错误中使用 tm 进行文本挖掘

所以我对 R 比较陌生,我正在学习如何从这个方便的网站挖掘文本:https ://eight2late.wordpress.com/2015/05/27/a-gentle-introduction-to-text-mining -使用-r/

我确实有自己的 .doc、.docx 和 .xlsx 文件的文本集,我正在尝试挖掘它们。它们位于我的工作目录中名为“files”的文件夹中,但我在简单地编写了几行代码后就遇到了错误。

我到目前为止的代码是:

此时,等待 25 秒左右后,我收到错误消息:

并且代码停止在那里运行。

我曾尝试在线搜索解决方案,但这似乎是一个相当罕见的错误,因此我在https://github.com/ropensci/antiword/issues/1只找到了 1 个可能的解决方案,但这对我不起作用。

此解决方案表明我的一个文件已损坏,并建议使用代码

将错误更改为警告以不中断文件的读取。我试过了,起初它提出了错误

之后,我用 a 加载了 antiword 库并将其library(antiword)更改stop(为 a warning(。但是,当我再次运行该data = readtext('files')线路时,它立即引发了错误

我在这里不知所措!任何帮助,将不胜感激。在这种情况下我应该使用另一个包吗?

0 投票
1 回答
104 浏览

r - Unable to read a .txt zipped file with readtext in R

I have a zipped file containing Another folder with multiple text files

It is structured like below:

The articles file has approximately 2000 text files

I tried the below command in R but it gives an error

I guess it is confusing with the multiple zip files anyway to resolve it such that I can read the text files in Article folder without un-compressing them locally

0 投票
2 回答
1120 浏览

c# - C# 在尝试读取子字符串之前检测文件中的行是否存在

我想从文本文件中读取设置。

通常,该文件将有 4 行。

我想在它自己的变量中获取每一行,如下所示:

通常,我只会循环读取行,读取每一行并设置字符串。但是,如果缺少第 4 行,并且我正在查找冒号之后的行的部分,那么如果我像这样检查它,我会收到错误...

有没有办法在我尝试获取 SubString 之前“检查是否存在特定行”(所以它不会出错),比如在一个单独的函数中,它有 try,catch,最后返回字符串我想要或“丢失”这个词,如果该行丢失(然后因为没有更多的行而停止)?

有没有更好的方法来做到这一点?ReadAllLines 还是什么?

0 投票
1 回答
436 浏览

r - 如何使用 R 导入基于标题的多个文本文件?

我正在使用“readtext”包在特定目录中导入多个文本文件。

我的问题是:有没有办法根据标题导入文本文件?我想导入标题包含特定单词的文件,例如,apple。

提前谢谢你的帮助。

0 投票
2 回答
44 浏览

java - 星 * 分隔符 txt 文件列在存储在数组列表中时返回多次列值

我有星 * 分隔符文件,最后我需要在拆分 * 分隔符后存储在数组中,它在数组中存储值并打印列,但是它不断地一次又一次地打印相同的列值。

注意:txt 文件中有 60 列。

以下是我的代码:

以下是列示例:(此文件中同样有 60 列)

我只想打印第二列一次:例如:

0 投票
0 回答
198 浏览

javascript - 如何从多个 .TXT 文件中提取数据并存储到变量中

我是 JS 新手,我想将几​​个 .TXT 文件的数据存储在变量 (ARRAY) 中。

以下是 .TXT 文件的结构:MONTH;YEAR;CUSTOMER

这是我修改的代码。警报包含正确的数据,但不包含变量。

0 投票
4 回答
134 浏览

arrays - 如何读取 .txt 文件并将其存储到数组中

我知道这是一个相当简单的问题,但我无法弄清楚如何以我想要的方式将所有值存储在我的数组中。这是 .txt 文件的一小部分:

每个值由两个空格分隔 - 如果下一个值为正 - 或一个空格和一个“-” - 如果下一个值为负

这是代码:

我知道 @array 只保存传递给它的最后一行。有没有办法让@array 保存所有行?

0 投票
2 回答
36 浏览

python - 有没有办法读取文件夹中的 n 个文本文件并存储为 n str 变量?

我想读取一个文件夹中的 N 个文本文件并将它们存储为 N 个变量。请注意,输入只是文件夹路径,其中的文本文件数量可能会有所不同(所以 n)。

手动我像下面的代码那样做,需要完全改变:

0 投票
2 回答
56 浏览

python - 从文件中提取特定单词

我正在分析一些文本文件,并且每次在文件中找到该单词时,我都想提取该特定单词。

想象一下,我在文件中有“Sports”,然后我想根据列表提取单词“SPORTS”。

我有以下代码:

我的文本文件包含以下内容:

使用我的代码,我打印所有带有“体育”和“足球”的行:

但我想看到以下结果:

如何仅打印 List 上的单词而不是所有行?

谢谢!

0 投票
0 回答
213 浏览

r - R:使用带有波兰字符的 readtext() 上传 doc 文件

让我们有一个包含以下波兰语句子的 .doc 文件(DOC 不是 DOCX !!!):

" Na każde 40 mg% powyżej 100 mg% dodać 1j NovoRapidu, przy glikemii poniżej 100 mg% odjąć 1j NovoRapidu od dawki wyliczonej na WW w posiłku głównym. Przekąski liczyć 1j/ 1WW. W przypadku hiperglikem.ii, 22.00, proszę liczyć na zbicie 1j NovoRapidu na każde 50 mg% powyżej 150 mg%。”

您也可以从这里下载 doc 文件 (my_doc.doc)

我想通过代码将此字符向量上传到 R 中:

该代码独立于使用的编码提供相同的输出。我想在 .doc 文件和 R 中获取相同的文本。我使用 Windows。我该如何编辑我的代码?