问题标签 [reindex]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

422 问题

0 投票

3 回答

595 浏览

lucene - Alfresco 将 v4.1.2 升级到 v4.2.2.12 - 无法重建 Lucene 全索引

我将 Alfresco 从 v4.1.2 升级到 v4.2.2.12。所以首先我确实从 v4.1.2 升级到 v4.1.9.4（应用最后一个补丁），然后从 v4.1.9.4 升级到 v.4.2.2.12。一切都在日志中顺利通过，我没有注意到任何异常。

但是当我想做 FULL Lucene 索引重建时，我遇到了问题。因此，当我删除 lucene-indexes 文件夹，增加 Lucense 的日志记录并设置 index.recovery.mode=FULL 并重新启动与索引重建相关的 Alfresco 时，我在日志中看到以下内容：

11:39:29,170 DEBUG [org.alfresco.repo.node.index.FullIndexRecoveryComponent] [http-bio-443-exec-17] 为类型执行索引恢复：FULL 11:39:39,953 INFO [org.alfresco.repo. node.index.FullIndexRecoveryComponent] [http-bio-443-exec-17] 索引恢复开始：268'330 个事务。11:39:43,978 INFO [org.alfresco.repo.management.subsystems.ChildApplicationContextFactory] [indexTrackerThread2] 启动“Transformers”子系统，ID：[Transformers，默认] 11:39:44,383 INFO [org.alfresco.repo.management. subsystems.ChildApplicationContextFactory] [indexTrackerThread2] 'Transformers' 子系统的启动，ID: [Transformers, default] 完成

我离开 Alfresco 12 小时进行重新索引。但即使在 12 小时后，Lucene 索引也没有完成 10%。内容存储区大了 177GB，在测试服务器上，我最多在 2 小时内重新建立了索引。

有谁知道为什么会发生这种情况以及如何解决这个问题？

提前致谢...

lucene upgrade alfresco reindex

2014-12-03T10:10:28.383

0 投票

1 回答

3934 浏览

indexing - 通过更新索引模板来更新 Elasticsearch 映射

我目前正在使用配置模板在 ES 中存储我的索引的映射，并且想知道......如果我在模板文件中更新了我的映射，我将如何将该映射传播到已经索引的文档？目前有没有办法重新索引整个索引或索引类型？

任何帮助深表感谢！

乙

indexing elasticsearch mapping reindex

2014-12-04T17:24:50.737

0 投票

1 回答

439 浏览

python - 使用 reindex 平衡 DataFrame

我有一个 DataFrame，其中包含一个名为 _ItemId 的索引和一个 _ChannelId 列，以及下面简化为 _SomeValue 的其他值列。我想将 DataFrame 转换为每个 _Channel 模态具有完全相同的 _ItemId 元素（我将其称为“平衡”，就像在面板数据中一样）。

在下面的示例中，在我想要的 df 中，插入了 3 行，其中包含 Nan 值以平衡 DataFrame。

我以为我会使用 reindex() 函数，但我不确定如何创建插入缺失元素所需的索引。任何建议都非常感谢。

我有的：

我想要的是：

谢谢

python pandas reindex

2014-12-09T16:20:19.263

0 投票

1 回答

11098 浏览

python - 按新的日期范围重新索引数据框

我有一个包含许多观察结果的数据框：

我想重新索引数据框并标准化日期。

我想通过colourand对数据框进行排序date，然后尝试重新索引它。

但它返回一个具有正确索引但所有NaN值的新数据框。

python pandas date-range reindex

2014-12-11T11:00:06.137

0 投票

1 回答

1703 浏览

postgresql - PostgreSQL - 添加新索引时重新索引

我有一个没有索引的 100k 记录的表。我在用于左连接的列上创建了一个新索引。我需要重新索引我的表吗？

创建索引需要几毫秒。所以我猜在我重新索引我的表之前，查询不能使用这个索引（没有数据）（如果我有其他索引，我只会重新索引索引 - 我阅读了手册）。

新索引填充数据时找不到任何信息？这是自动完成的吗？什么时候？

postgresql indexing reindex

2014-12-23T11:25:16.733

0 投票

1 回答

913 浏览

python - 如何重新索引多索引熊猫数据框？

给定以下 pandas.core.frame.DataFrame，称为sorted_by_diff：

具有以下列：

以及以下指标：

如何rexindex sorted_by_diff 是这样的？

也就是说，如何将索引级别 0 和 1 分别更改为“电子邮件”和“垃圾邮件”？

python pandas multi-index reindex

2014-12-24T09:10:52.437

0 投票

1 回答

30709 浏览

python - “ValueError：无法从重复轴重新索引”

我有以下df：

我想做以下几点：

那就是：我想合并具有相同时间戳的列（我有 17 列），以 1 分钟的粒度重新采样，对于那些没有值的列，我想要 NaN。

我从以下方式开始：

和

但我收到以下错误：

我怎么解决这个问题？我只是在学习 Python，所以我根本没有经验。

谢谢！

python pandas reindex

2014-12-30T19:50:26.047

0 投票

0 回答

1399 浏览

elasticsearch - Logstash 重新索引弹性搜索问题

我正在尝试通过将弹性搜索作为输入并将数据发送回弹性搜索作为输出来重新索引数据。该脚本运行良好，但索引将无限期进行。脚本如下

这意味着如果我在 logstash-2015.02.05 索引下有 200 个文档，那么它会在 logstash-2015.02.05_new 中创建重复记录并继续运行，直到我停止 logstash 代理。有没有办法只限制新索引中的文档与旧索引完全相同？请帮忙。

elasticsearch logstash reindex

2015-02-06T03:07:13.483

0 投票

1 回答

1119 浏览

pandas - Pandas DataFrame：将按名称的索引附加到df的末尾

我有 df 它看起来像：

我希望df看起来像这样，所有名为“Net：_xexp ..”的索引都附加在df的末尾。

我目前正在像这样附加给定的索引，但我确定有更好的方法吗？

pandas append dataframe rows reindex

2015-02-11T10:49:33.017

0 投票

1 回答

1579 浏览

elasticsearch - Elasticsearch 重新索引

我想将更新的映射应用到一个索引，我已尽力遵循有关 ES 和 Stackoverflow 的文档，但现在我被卡住了。

原始索引：logstash-index-YYYY.MM其中包含数据
我创建了索引：（logstash-index-new-YYYY.MM它有一个用于新映射的模板）

使用以下查询：
/logstash-index-YYYY.MM/_search?search_type=scan&scroll=1m
{ "query": { "match_all": {} }, "size": 30000 }

我得到了一个_scroll_id并且我有不到 30k 的文档，所以我应该只需要运行一次。

如何使用该 id 将数据推送到新索引中？

elasticsearch logstash reindex

2015-02-16T16:43:03.750

1 2 3 4 5 6 7 8 9 10