问题标签 [data-importer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
145 浏览

java - Michael Hunger Batch Importer:将节点和关系导入 neo4j 数据库时遇到问题

我在导入nodesrelationships. 我正在尝试按照以下说明进行操作:batch-importer,我还从以下位置下载了导入 zip 文件:batch-import github

我已经使用maven并创建了nodesrelationships csv文件成功地构建了项目。但是,我这样做的方式不同,因为给定的命令提示符命令给了我错误。相反,我将该项目作为现有的 Maven 项目导入并TestDataGenerator.javaeclipse. 我知道这行得通,因为csv文件已创建。

我尝试了命令提示符文件来执行导入,但它没有像图片中看到的那样工作。

你能帮我么??请给我一步一步的指导,因为我是命令提示符和 maven 的新手。

我也无法发布图片,但这里是我的错误消息的描述:

0 投票
1 回答
171 浏览

apache - 通过 Apache Solr 对多个数据源进行定期索引并更新字段子集而无需更新文档

我有以下情况:

Apache Solr 应为 2 个数据源编制索引。

  1. RDBM - 持续可用
  2. CSV 文件,可不时推送到系统。

CSV 文件仅更新 Solr 中现有文档的 2 个字段。

但我有以下问题:似乎不可能通过 DataImportHandler 只更新某些字段子集。这真的不可能还是有什么技巧?

0 投票
0 回答
725 浏览

linux - Solr/Tika 数据导入临时文件权限异常

我正在尝试使用 apache tika 和 solr 从文件中设置数据导入。nfs 挂载共享上有共享文档文件夹。不幸的是,我无法执行数据导入,处理了 1 个文件,然后出现异常:

所以在写临时文件的时候,权限似乎有些问题。不幸的是,我不知道 tike 究竟在哪里尝试写入临时文件,所以我无法检查 nfs 的权限。我检查了 tika 主文件夹(核心配置)和 docs 文件夹和子文件夹的权限 - 一切正常,包括有问题的文档。

我还尝试将核心配置中的 docs 目录更改为其他目录(在同一个 nfs 共享上),一切正常。那么,您知道如何跟踪我的问题吗?

[编辑] 我只是注意到这不是真正的权限问题。一切都适用于文件 .docx 和 .pdf。但是在 .doc 文件上它失败了。你有什么想法?

0 投票
1 回答
45 浏览

mysql - 在从 MySQL 过渡到弹性搜索时处理搜索?

我有一个运行弹性搜索的普通 ec2 实例,并与 mysql 同步,其中数据以固定间隔从 mysql 导入 elasticsearch。使用的方法是在固定间隔后重新创建索引和重新导入数据。在重新索引和重新导入活动仍在运行时,可以采取什么方法来处理搜索?

导入是通过 jdbc importer 进行的。

任何见解或指导将不胜感激。

0 投票
0 回答
707 浏览

matlab - 有没有办法将跟踪文件(.trc 文件)从媒体控制论 Image Pro Plus 转换/导出为 .mat 文件类型?

我是一名生物学研究生,试图导出这些文件,以便它们可以与基于 matlab 的自动行为分类软件 JAABA 一起使用。看起来没有直接的方法可以将 .trc 文件保存为 .mat (http://www.mediacy.com/imageproplus/specifications)。至少我想找到一种方法来读取 .trc 文件的格式,这样我就可以编写一个脚本来让它们对 JAABA 有意义。如果有人熟悉这些程序中的任何一个或两者,或者可以简单地指出编写导入程序的好方法(绝对超出我的技能范围),我将非常感激。

0 投票
1 回答
88 浏览

php - 在 WooCommerce 中导入位于外部 URL 中的 CSV 文件

所以,我的主要问题是这个。现在我有一个使用 AWS 的 Elastic Beanstalk 运行的页面,其中运行了多个实例。主要问题是 CSV 导入器将文件上传到实例,但是对于下一步,WC 会再次检查文件是否存在,并且因为它可以在运行时更改实例,所以文件可能不存在。所以我想出的想法是在 S3 上上传文件并检查是否有任何方法可以通过如下链接获取、读取和处理导入:https://app-s3.s3.amazonaws.com/folder/TestFile。我设法从 PHP 读取文件的内容,但主要问题是内置的导入器类不处理字符串或数组,它实际上读取了CSV 文件的多次,所以这个选项有点没用。

我还尝试使用WC_Product_CSV_Importer类,它已经有点成功,但是映射它完全被破坏了或者我不知道如何正确设置它,因为关于这个类的 woocommerce 文档它真的没用并且不解释任何东西。

现在我在这个问题上处于 0 级,我没有想法或选项......如果有一个可以完成这项工作的外部插件,我可以尝试,但主要目标是在主题内构建它。

0 投票
1 回答
75 浏览

parsing - DXF 导入器,不确定按什么顺序进行转换,如何处理块的单位和基点?

我正在实现一个 DXF 导入器,现在我正在考虑该HEADER部分和其中只有一个变量INSUNITSTABLES部分只有一个表表BLOCK_RECORDBLOCKS部分、ENTITIES部分(、、、、、)。INSERTLINELWPOLYLINEARCCIRCLE

导入时我不知道是否需要考虑units,如果需要,我不知道如何准确考虑这一点。我的文件现在没有以正确的方式导入,很可能是由于这些单位,因为我认为我正在INSERT正确地进行转换:

当我删除 . 时,我正在导入的文件以正确的方式导入BASEPOINTTRANSLATION,但其他一些文件没有以正确的方式导入,并且绘图的某些部分被导入到离静止很远的地方。

在我看来,块的基点以英寸为单位,当我将其转换为时,它会变得更好一些。因此,如果有人知道我应该按什么顺序进行转换以及如何处理 DXF​​ 文件中的单位,我将非常感激,因为我现在被困住了。