0

我在 Elastic Search 上“几乎”是新手。我已经使用了一段时间,但之前从未使用过分析器。

我可以对我的项目进行全文搜索,但问题是,当我试图找到像“ Alex ”这样的名字时,我应该完全正确地输入这个名字。它不适用于“ Al ”或“ Ale ”。它说“找不到匹配项”。

我从不同的站点找到了一些源代码,但这让我感到困惑。

我应该做的是:

1)创建一个 nGram 分词器

2)然后用我的所有索引映射它?

我已经创建了很多索引,在它们上创建映射时出现错误。

我应该在索引我的记录之前一开始就创建我的分析器设置和映射吗?

我正在开发一个 Java 项目,因此非常感谢有关 JAVA API 的答案。

非常感谢!

4

1 回答 1

0

应始终先创建映射,然后再索引数据。如果可能,请删除旧索引并使用新映射重新创建。如果您担心丢失数据,那么只需为现有索引创建一个新类型。新类型可以使用新映射。

例如,这里有一段使用 Java API 创建自定义映射

public class MappingCreator {

    static Logger log = Logger.getLogger(MappingCreator.class.getName());

    final static String indexName =  "indexName";

    final static String typeName = "typeName";

    final static String mappingFileName = "pathToMapping.jsonFile";

    final static String clusterName = "elasticsearch"; // or name of your cluster

    final static String hostName = "localhost";

    public static void main(String args[]) throws IOException
    {

        MappingCreator mapCreator = new MappingCreator();

        Client myESclient = getClient();

        IndicesExistsResponse res = myESclient.admin().indices().prepareExists(indexName).execute().actionGet();

        if (res.isExists()) {

            log.warn("Index "+indexName +" already exists. Will be deleted");

            final DeleteIndexRequestBuilder deleteIndexBuilder = myESclient.admin().indices().prepareDelete(indexName);

            deleteIndexBuilder.execute().actionGet();
        }

        final CreateIndexRequestBuilder createIndexBuilder = myESclient.admin().indices().prepareCreate(indexName)
                .addMapping(typeName, mapCreator.getIndexFieldMapping());

        CreateIndexResponse createIndexResponse = createIndexBuilder.execute().actionGet();

        log.debug("Created mapping "+createIndexResponse.toString());

        myESclient.close();

    }

    private String getIndexFieldMapping() throws IOException {

        return IOUtils.toString(getClass().getClassLoader().getResourceAsStream(mappingFileName));
    }

    private static Client getClient() {

        TransportClient transportClient = null;

        try
        {
            Settings settings = ImmutableSettings.settingsBuilder().put("cluster.name", clusterName).build();

            transportClient = new TransportClient(settings);

            transportClient = transportClient.addTransportAddress(new InetSocketTransportAddress(hostName, 9300)); 

/* be very careful about the port number here. by default its 9300. note that this is the TCP port which the java api will use. unlike the http port which is 9200 */

        }
        catch (Exception e)
        {
            log.error("Error in MappingCreator creating Elastic Search Client\n"
                    + "Message "+e.getMessage()+"\n"
                            + "StackTrace "+e.getStackTrace()
                    );
        }

        return (Client) transportClient;

    }

}

我希望这有帮助。顺便说一句,您制作自己的 nGram 标记器真的很酷。我很想看看它的代码以及它是如何完成的:)

于 2015-11-02T14:27:35.017 回答