问题标签 [read-text]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何从不同文本文件的特定行中获取仅数字值
我试图从 10 个不同的文本文件中仅从特定行中获取数字。作为输出,我希望将这些数字附加为列表。我是一个新的学习者。我会很感激你的帮助。试过这个但不工作
c# - 通过 Tesseract C# 窗口形式从捕获屏幕截图中读取文本块
我尝试使用 C# 通过 Tesseract 从位图(捕获屏幕)读取文本,但结果是错误的单词语言。我的代码:
打电话...
结果:
安然
1.
1.
l ' ' 1”: ,_ c.
wm63mm,""mm, , y
almweunnswwnedw!.
(puddellhzslo-ne?aunnel 7
. [傀儡] ns wowed om ' ; ,
quppaqhasmmudchinnnl a 0 / v: ' \ 1mm -
如果 f / - 'j 1' ' ., aurlnoiennovshndwnmum v
. \i 4"毫米'</p>
' ' 我 ',/ \ \ dwnoc-lermwunnmn 我
'他们妈妈我
我想得到单词“ WAVE ”,并得到位置绑定
见图片字“ WAVE ”
我的代码有什么问题
azure - 在本地运行 Microsoft Azure 计算机视觉认知服务读取文本容器时出错 - 非法指令
我正在尝试在本地 Red Hat Enterprise Linux Server 7.5 版上运行计算机视觉 docker 容器的预览版。我已经拉出 docker 容器containerpreview.azurecr.io/microsoft/cognitive-services-read:latest
并像这样运行
服务启动,招摇可见,状态端点返回 OK。
但是,当我尝试使用/vision/v2.0/read/core/Analyze
端点时,机器会给我这个日志
搜索类似的问题,这似乎是与机器的 AVX 支持相关的错误。如果我使用命令检查机器上的 AVX 支持
它似乎支持 AVX 但不支持 AVX2
但是,我在也支持 AVX 但不支持 AVX2 的 Windows 10 机器上执行了相同的步骤,并且工作正常。
r - 忽略 readtext r 中的错误
我现在正在尝试使用 readtext 提取放置在一个文件夹中的大量 docx 文件(1500 个)(在使用 list.files 创建列表之后)
你可以在这里找到类似的例子:https ://cran.r-project.org/web/packages/readtext/vignettes/readtext_vignette.html
我收到一些文件错误(下面的示例),问题是发生此错误时,提取过程停止。我可以通过更改来识别有问题的文件,verbosity = 3
但随后我必须重新启动提取过程(以查找另一个有问题的文件)。
我的问题是,如果遇到错误,是否有办法避免中断进程?
我改变ignore_missing_files = TRUE
了,但这并没有解决问题。
遇到的错误示例:
很抱歉没有发布可重现的示例,但我不知道如何发布带有大型 docx 文件的示例。但这是代码:
c - 我想读取每行包含电影信息的 txt 并将其保存到结构的动态数组中
我对 C 编程真的很陌生,我尝试将此作为读取文件并将它们保存到结构的动态数组的示例,txt 的信息是:
结构应该是这样的
我所知道的是我应该阅读它,fgets
我认为这是某种方式,但我无法弄清楚我将如何制作结构并保存它们
python - 从导入的python文件中获取调用者脚本的包名
我有一个项目将被压缩并从 Spark 运行,我们称之为“客户端”项目。
我想,在这个客户端项目中的脚本导入的库上,读取一些静态配置文件,“客户端”程序将按照一定的结构提供。
但是,我似乎无法找到一种方法来获取导入库文件的脚本的包名,以便读取配置文件。
注意:我使用pkg_resources
的项目将被打包为 Zip 文件,因此无法访问项目的文件结构。
因此,对于具有当前结构的客户项目:
main.py
:
在图书馆方面:
library.py
所以我的问题是: 的第一个参数的值是pkg_resources.read_text
多少?
r - 是否有 R 函数可以捕获文本中的大量模式?
我的数据集中有以下文本:
[1] "q negociação c/v tipo mercado prazo especificação do título obs (*) quantidade preço / ajuste valor operação / ajuste d/c 1-bovespa c fracionario magaz luiza on eb nm # 1 25,76 25,76 d 1 -bovespa c fracionario magaz luiza on eb nm # 9 25,76 231,84 d 1-bovespa c fracionario magaz luiza on eb nm 40 25,76 1030,40 d 1-bovespa c fracionario mrv on ed nm 40 18,14 725 ,60 d resumo dos negócios"
我想提取两个标准之间的各种文本,特别是“1-bovespa”和“d”之间包含的文本。目前,我使用 str_extract readtext 包,但它仅用于找到的第一个模式。但是,我希望命令滚动浏览所有文本,并在它再次找到模式时构建一个数据框。
我正在尝试这样的事情:
javascript - 如何仅在 laravel 中使用 javascript 读取 .docx 文件的文本
我想在 laravel 项目中使用 javascript 读取 .docx 文件。我尝试使用文件阅读器阅读它这是我的代码
结果 :
0:“PK\u0003\u0004\u0014\u0000\b\u0000\b\u0000�|�R\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u000b \u0000\u0000\u0000_rels/.rels��;\u000e�0\u0010D�bmO6P" 1: "��AHi�p\u0000��8Q�l�=.(\b��\u001c��6� y... )ˠ�\u000b9\u000bM�+�=�O\u0006���\u0017AS�pwA�r�jȦ"〵���uת����\u001b�I��\r�Q��\u0001\f �\nW3�\u0017PK\u0007\bO��<�\u0000\u0000\u0000\u001c\u0001\u0000\u0000PK\u0003\u0004\u0014\u0000\b\u0000\b\u0000�|�R\u0000 \u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u001c\u0000\u0000\u0000word/ rels/document.xml.rels...\n...0\u0010E%... !“M�\u0011��R?” 2: "&�\u00076\u000f�T��\u001b\u0014Ċ�\u000b��̽�0yyU#����\f�$\u0005�Z\u00189����9��P\u0016y� #\u000f������$F�gЇw�zѣ�>1\u0016uܴ�)\u001e��:j�8�\u000e�:M7Խv���4�u\u0018\u0018�I��Ex\u0012��T��4��d�jf��PM�\u000e\u0002�FL\nu�\u0000�O\n\u0010�EćyD�n���⁸+�Ń�\u001bPK\u0007\b��\u0000��\u0000\u0000\u0000�\u0001\u0000\u0000PK\u0003\u0004\u0014\u0000\b\u0000\b\u0000�|�R\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0011\u0000\u0000\u0000word/document.xml�SAn�" 3: "\u0010�\n���Zj�Zu��RN=��>��ML���%q��w!v��\u000b�,�\u000e��,,��S��\u0011�l�|�\u0015R�7��~_�����Y\n��7�\u0005\u000f�<\u0003���u��
\u000e\u001d�(X�S5�����"�B�i\u0016z�\u000b���!��\u0010��1\u0018" 4: "b�Ω�(����$ �\r�9�}\u001e>0M�k�\���R�\u001d\u000e��E@�;ϑ��Z��"�J��o\u0018E�o��w� “~w\u0016)��\u001d���2�\u001f��e�” 5: "^\f�:�H)%\u0019kk�������MJ���=b�.\u0004MqEV �\u0002��\t.��R\u001fb\u0018�[�ye��\u0007����/N�\u0013R�\u0013�6�Dw\u0015\u001e\u0019Ɓ�LRci�z �\u001f�\u001d���9) }�@�G��MkI�E\u0003]\u0010��'qmnn9\u0011��,�ċ����x�Xu{\r�\u001fPK\u0007 \b��W\u0001\u0000\u0000Q\u0003\u0000\u0000PK\u0003\u0004\u0014\u0000\b\u0000\b\u0000�|�R\u0000\u0000\u0000\u0000\u0000\u0000\ u0000\u0000\u0000\u0000\u0000\u0000\u0012\u0000\u0000\u0000word/numbering.xml\r�A\u000e�0\f\u0004�\u0012�N]8" 6: "\u00145�� /�\u0007�Ĵ�\u001a��\u0003�...�x�~\u0017&\u0007?R�ơZ~�'妙��j�����\"jX)y��" 8: "n�%9��f^�J�G�@��L;^����o\f\u0006�?PK\u0007\b,1�q|\u0000\u0000\u0000�\u0000\u0000\u0000PK\u0003\u0004\u0014\u0000\b\u0000\b\u0000�|�R\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u000f\u0000\u0000\u0000word/styles.xml\r�A\u000e�" 9: "\u0010\u0000�B�nA\u000fƐ��|�>��ڒ�n�\u0012����d23����\u0017�$&\u0007�ɀB\n\u001c\u0013m\u000eޯ��\u0001J���3\u0013:8Q
]�n��\u0019E���v\u0007{k��ZŽ����\u0007�p\u001f�ŷ�uӝk<*\u0007\u0014\u0019���͘�.>\u0011(� �\u0001PK\u0007\b�是的\u0000\u0000\u0000�\u0000\u0000\u0000PK\u0003\u0004\u0014\u0000\b\u0000\b\u0000�|�R\u0000\u0000\u0000 \u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0000\u0013\u0000\u0000\u0000[Content_Types].xml����N�0\u0010�_�r�b\u0007\n� P�+�)��x\u0000co\u0012��'�s =�\u0004�@H\b�J{f�\u001b��ٝ�cG�hch����9����ah。 ����㻮ٟ\u0013" 10: "#k�����{)Q��\u0015��" 11: "����U�g\u001edR��\u0006�7u}+u \f\u0005B��<�w�#�jr�=��{�fp����j�YW)9�U!]\u001e��A��\t���\u0007G����\ f��_\u0011��\u001fB�{��D=y��ϘM�Q
有什么解决办法吗?
python - 如何使用 python 读取 txt 文件并将部分 txt 格式化为表格
我正在尝试读取文本文件并将其中的特定部分提取到 CSV 文件中,
预期输出为: 预期输出