问题标签 [read-text]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
52 浏览

python - 如何从不同文本文件的特定行中获取仅数字值

我试图从 10 个不同的文本文件中仅从特定行中获取数字。作为输出,我希望将这些数字附加为列表。我是一个新的学习者。我会很感激你的帮助。试过这个但不工作

0 投票
0 回答
246 浏览

c# - 通过 Tesseract C# 窗口形式从捕获屏幕截图中读取文本块

我尝试使用 C# 通过 Tesseract 从位图(捕获屏幕)读取文本,但结果是错误的单词语言。我的代码:

打电话...

从屏幕捕获图片 在此处输入图像描述

结果:

安然

1.

1.

l ' ' 1”: ,_ c.

wm63mm,""mm, , y

almweunnswwnedw!.

(puddellhzslo-ne?aunnel 7

. [傀儡] ns wowed om ' ; ,

quppaqhasmmudchinnnl a 0 / v: ' \ 1mm -

如果 f / - 'j 1' ' ., aurlnoiennovshndwnmum v

. \i 4"毫米'</p>

' ' 我 ',/ \ \ dwnoc-lermwunnmn 我

'他们妈妈我

我想得到单词“ WAVE ”,并得到位置绑定

见图片字“ WAVE

在此处输入图像描述

我的代码有什么问题

0 投票
1 回答
143 浏览

azure - 在本地运行 Microsoft Azure 计算机视觉认知服务读取文本容器时出错 - 非法指令

我正在尝试在本地 Red Hat Enterprise Linux Server 7.5 版上运行计算机视觉 docker 容器的预览版。我已经拉出 docker 容器containerpreview.azurecr.io/microsoft/cognitive-services-read:latest并像这样运行

服务启动,招摇可见,状态端点返回 OK。

但是,当我尝试使用/vision/v2.0/read/core/Analyze端点时,机器会给我这个日志

搜索类似的问题,这似乎是与机器的 AVX 支持相关的错误。如果我使用命令检查机器上的 AVX 支持

它似乎支持 AVX 但不支持 AVX2

但是,我在也支持 AVX 但不支持 AVX2 的 Windows 10 机器上执行了相同的步骤,并且工作正常。

0 投票
1 回答
349 浏览

r - 忽略 readtext r 中的错误

我现在正在尝试使用 readtext 提取放置在一个文件夹中的大量 docx 文件(1500 个)(在使用 list.files 创建列表之后)

你可以在这里找到类似的例子:https ://cran.r-project.org/web/packages/readtext/vignettes/readtext_vignette.html

我收到一些文件错误(下面的示例),问题是发生此错误时,提取过程停止。我可以通过更改来识别有问题的文件,verbosity = 3但随后我必须重新启动提取过程(以查找另一个有问题的文件)。

我的问题是,如果遇到错误,是否有办法避免中断进程?

我改变ignore_missing_files = TRUE了,但这并没有解决问题。

遇到的错误示例:

很抱歉没有发布可重现的示例,但我不知道如何发布带有大型 docx 文件的示例。但这是代码:

0 投票
1 回答
190 浏览

c - 我想读取每行包含电影信息的 txt 并将其保存到结构的动态数组中

我对 C 编程真的很陌生,我尝试将此作为读取文件并将它们保存到结构的动态数组的示例,txt 的信息是:

结构应该是这样的

我所知道的是我应该阅读它,fgets我认为这是某种方式,但我无法弄清楚我将如何制作结构并保存它们

0 投票
0 回答
93 浏览

python - 从导入的python文件中获取调用者脚本的包名

我有一个项目将被压缩并从 Spark 运行,我们称之为“客户端”项目。

我想,在这个客户端项目中的脚本导入的库上,读取一些静态配置文件,“客户端”程序将按照一定的结构提供。

但是,我似乎无法找到一种方法来获取导入库文件的脚本的包名,以便读取配置文件。

注意:我使用pkg_resources的项目将被打包为 Zip 文件,因此无法访问项目的文件结构。


因此,对于具有当前结构的客户项目:

main.py


在图书馆方面: library.py

所以我的问题是: 的第一个参数的值是pkg_resources.read_text多少?

0 投票
1 回答
31 浏览

c# - 从同一个文本文件中读取单个数据和数组

尝试读取包含大小和类型不同的问题数据(即单整数、双/整数/二进制数组)的 .txt 文件以进行计算实验。通过查看此处此处可用的示例,我开发了两个替代代码块,但由于某种原因(我猜 Trim 方法不起作用)它们不起作用。它给出了“输入字符串格式不正确”的错误。有谁让我知道我做错了什么或错过了什么?

数据文件如下所示:

另外,在这个实验的后面,我会为 array-x 读取更大的数据文件,例如 500x500 或 1000x1000,你认为我有任何速度或内存问题吗?我应该使用哪种方法(逐行或所有行合二为一)?我现在想相应地设计读取块。

提前致谢!

0 投票
2 回答
42 浏览

r - 是否有 R 函数可以捕获文本中的大量模式?

我的数据集中有以下文本:

[1] "q negociação c/v tipo mercado prazo especificação do título obs (*) quantidade preço / ajuste valor operação / ajuste d/c 1-bovespa c fracionario magaz luiza on eb nm # 1 25,76 25,76 d 1 -bovespa c fracionario magaz luiza on eb nm # 9 25,76 231,84 d 1-bovespa c fracionario magaz luiza on eb nm 40 25,76 1030,40 d 1-bovespa c fracionario mrv on ed nm 40 18,14 725 ,60 d resumo dos negócios"

我想提取两个标准之间的各种文本,特别是“1-bovespa”和“d”之间包含的文本。目前,我使用 str_extract readtext 包,但它仅用于找到的第一个模式。但是,我希望命令滚动浏览所有文本,并在它再次找到模式时构建一个数据框。

我正在尝试这样的事情:

0 投票
0 回答
42 浏览

javascript - 如何仅在 laravel 中使用 javascript 读取 .docx 文件的文本

我想在 laravel 项目中使用 javascript 读取 .docx 文件。我尝试使用文件阅读器阅读它这是我的代码

结果 :

0:“PK\u0003\u0004\u0014\u0000\b\u0000\b\u0000�|�R\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u000b \u0000\u0000\u0000_rels/.rels��;\u000e�0\u0010D�bmO6P" 1: "��AHi�p\u0000��8Q�l�=.(\b��\u001c��6� y... )ˠ�\u000b9\u000bM�+�=�O\u0006���\u0017AS�pwA�r�jȦ"〵���uת����\u001b�I��\r�Q��\u0001\f �\nW3�\u0017PK\u0007\bO��<�\u0000\u0000\u0000\u001c\u0001\u0000\u0000PK\u0003\u0004\u0014\u0000\b\u0000\b\u0000�|�R\u0000 \u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u001c\u0000\u0000\u0000word/ rels/document.xml.rels...\n...0\u0010E%... !“M�\u0011��R?” 2: "&�\u00076\u000f�T��\u001b\u0014Ċ�\u000b��̽�0yyU#����\f�$\u0005�Z\u00189����9��P\u0016y� #\u000f������$F�gЇw�zѣ�&gt;1\u0016uܴ�)\u001e��:j�8�\u000e�:M7Խv���4�u\u0018\u0018�I��Ex\u0012��T��4��d�jf��PM�\u000e\u0002�FL\nu�\u0000�O\n\u0010�EćyD�n���⁸+�Ń�\u001bPK\u0007\b��\u0000��\u0000\u0000\u0000�\u0001\u0000\u0000PK\u0003\u0004\u0014\u0000\b\u0000\b\u0000�|�R\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0011\u0000\u0000\u0000word/document.xml�SAn�&quot; 3: "\u0010�\n���Zj�Zu��RN=��>��ML���%q��w!v��\u000b�,�\u000e��,,��S��\u0011�l�|�\u0015R�7��~_�����Y\n��7�\u0005\u000f�&lt;\u0003���u��\u000e\u001d�(X�S5�����"�B�i\u0016z�\u000b���!��\u0010��1\u0018" 4: "b�Ω�(����$ �\r�9�}\u001e>0M�k�\���R�\u001d\u000e��E@�;ϑ��Z��"�J��o\u0018E�o��w� “~w\u0016)��\u001d���2�\u001f��e�” 5: "^\f�:�H)%\u0019kk�������MJ���=b�.\u0004MqEV �\u0002��\t.��R\u001fb\u0018�[�ye��\u0007����/N�\u0013R�\u0013�6�Dw\u0015\u001e\u0019Ɓ�LRci�z �\u001f�\u001d���9) }�@�G��MkI�E\u0003]\u0010��'qmnn9\u0011��,�ċ����x�Xu{\r�\u001fPK\u0007 \b��W\u0001\u0000\u0000Q\u0003\u0000\u0000PK\u0003\u0004\u0014\u0000\b\u0000\b\u0000�|�R\u0000\u0000\u0000\u0000\u0000\u0000\ u0000\u0000\u0000\u0000\u0000\u0000\u0012\u0000\u0000\u0000word/numbering.xml\r�A\u000e�0\f\u0004�\u0012�N]8" 6: "\u00145�� /�\u0007�Ĵ�\u001a��\u0003�...�x�~\u0017&\u0007?R�ơZ~�'妙��j�����\"jX)y��" 8: "n�%9��f^�J�G�@��L;^����o\f\u0006�?PK\u0007\b,1�q|\u0000\u0000\u0000�\u0000\u0000\u0000PK\u0003\u0004\u0014\u0000\b\u0000\b\u0000�|�R\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u000f\u0000\u0000\u0000word/styles.xml\r�A\u000e�&quot; 9: "\u0010\u0000�B�nA\u000fƐ��|�&gt;��ڒ�n�\u0012����d23����\u0017�$&\u0007�ɀB\n\u001c\u0013m\u000eޯ��\u0001J���3\u0013:8Q]�n��\u0019E���v\u0007{k��ZŽ����\u0007�p\u001f�ŷ�uӝk<*\u0007\u0014\u0019���͘�.>\u0011(� �\u0001PK\u0007\b�是的\u0000\u0000\u0000�\u0000\u0000\u0000PK\u0003\u0004\u0014\u0000\b\u0000\b\u0000�|�R\u0000\u0000\u0000 \u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0013\u0000\u0000\u0000[Content_Types].xml����N�0\u0010�_�r�b\u0007\n� P�+�)��x\u0000co\u0012��'�s =�\u0004�@H\b�J{f�\u001b��ٝ�cG�hch����9����ah。 ����㻮ٟ\u0013" 10: "#k�����{)Q��\u0015��" 11: "����U�g\u001edR��\u0006�7u}+u \f\u0005B��<�w�#�jr�=��{�fp����j�YW)9�U!]\u001e��A��\t���\u0007G����\ f��_\u0011��\u001fB�{��D=y��ϘM�Q

有什么解决办法吗?

0 投票
2 回答
69 浏览

python - 如何使用 python 读取 txt 文件并将部分 txt 格式化为表格

我正在尝试读取文本文件并将其中的特定部分提取到 CSV 文件中,

预期输出为: 预期输出