0

我有一些像“paddington road”这样的字符串,我需要从这个字符串中提取“road”这个词。我怎样才能做到这一点?

问题是我需要处理街道列表并提取一些单词,例如“road”“park”“street”“boulevard”等等。

最好的方法是什么?复杂度为 O(n*m),如果考虑到我处理超过 5000 条街道,性能应该非常重要。

我正在从 Postgres 数据库中提取值并放入列表中,但我不确定这是最好的方法,可能是哈希表查询速度更快?

我试过这样的事情:

    // Parse selectedList
    Iterator<String> it = streets.iterator();
    Iterator<String> it_exception = exception.iterator();

    int counter = streets.size();
    while(it.hasNext()) {   

        while ( it_exception.hasNext() ) {
            // remove substring it_exception.next() from it.next()              
        }               
    }

你怎么看?

4

3 回答 3

1

您需要在外循环的每次迭代中为您的关键字列表获取一个新的迭代器。最简单的方法是使用 foreach 语法:

for (String streetName : streets) {
    for (String keyword : keywords) {
        // find if the string contains the keyword, and perhaps break if found to avoid searching for the other keywords
    }
}

不要预先优化。5000 对计算机来说不算什么,街道名称是短字符串。而且,如果您将最常见的关键字(街道,而不是林荫大道)放在关键字列表的开头,您的迭代次数就会减少。

于 2012-01-11T22:41:44.323 回答
1

你可以试试Set

Set<String> exceptions = new HashSet<String>(...);
for (String street : streets) {
    String[] words = street.split(" ");
    StringBuilder res = new StringBuilder();
    for (String word : words) {
        if (!exceptions.contains(word)) {
            res.append(word).append(" ");
        }
    } 
    System.out.println(res);
}

我认为复杂度将是 O(n),其中 n 是街道上所有单词的数量。

于 2012-01-11T22:45:52.280 回答
1
List streets = new ArrayList<String>();
    streets.add("paddington road");
    streets.add("paddington park");

    for (Object object : streets) {
        String cmpstring = object.toString();
        String[] abc = cmpstring.split(" ");
        String secondwrd = abc[1];
        System.out.println("secondwrd"+secondwrd);

    }

您可以将 secondwrd 保存在列表或字符串缓冲区等中......

于 2012-01-11T22:58:22.030 回答