问题标签 [read-text]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
12446 浏览

hana - CDS 视图中的 READ_TEXT 类似功能

我需要读取为发票、订单等存储的文本。在 ABAP 中,我们可以使用 READ_TEXT 功能模块,但我需要在 CDS 视图中读取它。有没有办法在 SELECT 语句中直接从数据库表中读取文本?

0 投票
2 回答
1325 浏览

c++ - 将文本文件中的制表符分隔值读入数组

嘿,我对 C++ 很陌生,我遇到了一个问题:

我有一个看起来像这样的文本文件:

因此,文本文件顶部的前两个值描述了矩阵的维度。我现在想编写一个代码,它将矩阵中的所有文件读取到一个数组或int值向量中。getline我可以读取前三个值 (500, 1120,10) 并使用and将它们写入整数值stringstream,但我不知道如何读取用循环分隔的矩阵抽头。

0 投票
0 回答
1562 浏览

r - 将多个子文件夹中 .txt 文件的内容读入 R 时出现问题

我有结构数据:

  • Main_Text
    • Sub1_text
    • Sub2_text
    • 等等(我有几百个子文件夹)

每个子文件夹包含多个 .txt 文件。

我想将所有文件读入 R,以创建一个如下所示的数据框:

文件名 | 文本

文件名 | .txt 文件的内容

我尝试了以下两种方法,但都不太奏效。任何帮助,将不胜感激。

1)使用 readtext 包:虽然这个包应该循环通过子文件夹,但我不能让它这样做。循环遍历 readtext 小插图中的文件的代码应该像这样工作:

这只会产生一个错误:

但是,如果我指定子文件夹,它就可以工作,即

但鉴于我有数百个子文件夹,我需要一个更递归的解决方案。

2)我还尝试了以下两步解决方案,我首先创建文件列表,然后尝试读取文本,这也导致错误:

这会生成我所有文件的准确列表,但显然不包括内容生成步骤:

所以我也试过: mypath="/Users/Main_Folder/" txt_files_ls = list.files(path=mypath, recursive=T, pattern="*.txt")

但是,哪个有效:

引发错误:

如果我指定

我得到一个不同的错误:

所以我什至无法使用类似的东西来组合它们的最后一步

我知道为什么会这样,因为文本文件本身没有标题,并且具有随机格式(它们是新闻稿)。这是我的 .txt 文件之一的示例:

2011 年 1 月 28 日星期五 联系人:Darrell “DJ” Jordan 202-225-4876 国会议员罗伯特·阿德霍尔特关于阿尔巴尼亚暴力事件的声明 华盛顿特区 - 国会议员罗伯特·阿德霍尔特(阿拉巴马州)今天发布了 th

我确定我遗漏了一些小东西,但是任何人都可以帮助说明如何正确读取文件名+文本,或者使用我尝试过的半工作解决方案之一,或者其他什么?

0 投票
0 回答
58 浏览

matlab - MATLAB - 创建一个循环以从文本变量中读取并将其分配给变量,然后在 matlab 中执行

我对 Matlab 真的很陌生,我目前正在研究它以创建一些矩阵。我需要编写一个读取文本文件的循环,然后将每组整数分配给具有特定数字的变量,例如行的#。之后它将执行一些计算,然后最后连接矩阵 1xn 中的数组,但我遇到的是读取文件的过程,然后将其分配给动态变量,然后增加计数器。我想我的伪代码有正确的逻辑,但我正在努力使用 MATLAB 中的实际语法才能做到这一点。

我设法编写的伪代码和实际代码的某种混合:

因此,例如,结果将如下所示:

我知道第三个循环的结果正在工作并产生我想要的结果,但我的问题在于读取文本文件和前 2 个嵌套循环。

我很感激帮助。

0 投票
0 回答
73 浏览

r - 如何检查 readtext 是否无法读取文件的一部分

我正在使用 readtext() 读取文本文件。
它似乎是用 utf-8 编码的(根据 notepad++,我无法验证);
我不确定它是否编码正确或是否存在一些错误/损坏。
根据 Windows 资源管理器,磁盘上的文件大小为 200+ Mb。
当我阅读它并检查它在 RAM 中的大小时

我明白了

readtext() 在阅读时不会给出任何错误或警告

我几乎可以肯定整个文件没有被完全读取,因为稍大的文件占用 RAM 198.2 Mib,而较小的文件占用 157 MiB。

有没有办法了解 readtext 出了什么问题以及在哪里?
尽管不了解问题是什么,我是否应该将此报告为 readtext 的问题?

0 投票
1 回答
220 浏览

java - useDelimiter() 中的 Java 错误

到目前为止,这就是我为读取文本文件所做的工作,

我的文本文件看起来像这样,

我想要代码的结果,例如,

但结果与文本文件本身相同。这不是“useDelimiter(".")”假设用句点(“.”)分隔文本文件吗?

我也尝试使用 hasNext() 和 next() 而不是 hasNextLine() 和 nextLine(),但它会打印出空的 30ish 新行。

0 投票
1 回答
266 浏览

r - 从文件中自动提取章节(和章节标题)

我需要从 .Rmd 文件中提取所有小节(用于进一步的文本分析)及其标题(例如来自01-tidy-text.Rmdtidy-text-mining 书籍: https ://raw.githubusercontent.com/dgrtwo/tidy-text-mining/master /01-tidy-text.Rmd )

据我所知,一个部分从##sign 开始并一直运行到 next ###sign 或文件末尾。

整个文本已经被提取(使用dt <- readtext("01-tidy-text.Rmd"); strEntireText <-dt[1,1])并且位于变量strEntireText

我想用stringr这个。或者stringi,类似的东西:

请提出您的解决方案。谢谢

本练习的最终目标是能够从 .Rmd 文件自动创建一个 data.frame,其中每一行对应于每个部分(和小节),列包含:部分标题、部分标签、部分文本本身以及其他一些特定部分的详细信息,稍后将提取。

0 投票
2 回答
28 浏览

linux - 在 Linux shell 中读取文本并将某些特定行写入新文件

我有一个包含这种格式信息的文件(input.txt):

我需要在 Linux shell 中读取此文件并创建一个输出文件,其中包含基于第一列中的数字的输入文件的某些特定行,例如 045002、045013、045018。输出文件 (output.txt) 应该看起来像这样:

0 投票
2 回答
555 浏览

matlab - Using textscan to extract values from a text file

I have the following text file:

These are coordinates to regions of interest for each category in an image. I need to extract these regions. I know I have to use textscan to accomplish this but I am unsure of the formatspec options needed to achieve this, since whichever setting I use seem to give me some jumbled form of cell output.

What formatSpec should I use so that I get the coordinates of each region outputed in a cell?

I've tried the following:

0 投票
2 回答
113 浏览

java - Java读取没有引号的文本文件

文本文件就像

"Name","Salary", "Bernard,"200000.00"

我要显示

Name Salary Bernard 200000.00