0

cities.txt我的res/raw 文件夹中有一个文件。它里面包含以下内容。

<div class="state">Alabama</div>
<ul><li><a href="http://auburn.org">auburn</a></li>
<li><a href="http://bham.org">birmingham</a></li> </ul>

<div class="state">Alaska</div>
<ul><li><a href="http://anchorage.org">anchorage</a></li>
<li><a href="http://fairbanks.org">fairbanks</a></li></ul>

<div class="state">Arizona</div>
<ul><li><a href="http://flagstaff.org">flagstaff</a></li>
<li><a href="http://mohave.org">mohave county</a></li></ul>

我想获取阿拉巴马州的城市并将其显示在 ListView 上。输出应该是这样的。

奥本

伯明翰

我当前的代码抓取了所有六个城市并将它们显示在 ListView 上。这是我的代码。

package com.example.readfile;

import java.io.InputStream;
import java.util.ArrayList;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import android.app.Activity;
import android.content.res.Resources;
import android.os.AsyncTask;
import android.os.Bundle;
import android.widget.ArrayAdapter;
import android.widget.ListView;

public class Cities extends Activity {

    ListView listUSCities;

    @Override
    protected void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.city_layout);
        listUSCities = (ListView) findViewById(R.id.listcities);

        new MyTask().execute();

    }

    class MyTask extends AsyncTask<Void, Void, ArrayList<String>> {

        ArrayList<String> arr_linkText = new ArrayList<String>();

        @Override
        protected ArrayList<String> doInBackground(Void... params) {

            Document doc;

            try {
                Resources res = getResources();
                InputStream in_s = res.openRawResource(R.raw.cities);

                byte[] b = new byte[in_s.available()];
                in_s.read(b);

                // Parsing using Jsoup starts here
                doc = Jsoup.parse(new String(b));

                // Parsing the states
                Elements links = doc.select("div");
                for (Element link : links) {
                    if (link.text().contains("Alabama")) {

                        // Extracting the cities
                        Elements cities = doc.select("a");
                        for (Element city : cities) {
                            arr_linkText.add(city.text());
                        }

                    }

                }

            } catch (Exception e) {
                // e.printStackTrace();

            }

            return arr_linkText; // << retrun ArrayList from here
        }

        @Override
        protected void onPostExecute(ArrayList<String> result) {
            ArrayAdapter<String> adapter = new ArrayAdapter<String>(
                    Cities.this, android.R.layout.simple_list_item_1,
                    android.R.id.text1);
            for (String temp_result : result) {

                adapter.add(temp_result);
            }
            listUSCities.setAdapter(adapter);
        }

    }

}

如何仅提取该指定州的城市?

提取城市以优化速度后,如何停止解析文件?

实际cities.txt包含更多信息,我只提供了一个示例。我会感谢你的帮助。谢谢!

4

2 回答 2

1
// Parsing the states
                Elements links = doc.select("div");
                for (Element link : links) {
                    if (link.text().contains("Alabama")) {

        // Extracting the cities
        Elements cities = link.select("a");//<- 'doc' is the whole doc, link is your state.
        for (Element city : cities) {
            arr_linkText.add(city.text());
        }
        break;//breaks off the loop, since you have found what you want.

    }

}
于 2013-01-13T20:28:26.463 回答
0

对于 HTML 文档来说,这是一个奇怪的结构。<div>仅用于标题,列表本身是关闭的。看到您修剪了实际文档,这可能会或可能不会起作用。您所追求的元素在您之后的ul元素中div,因此您需要转到下一个兄弟并在那里搜索。div这仅在您的和元素之间没有其他元素时才有效ul

Elements links = doc.select("div");
for (Element link : links) {
    if (link.text().contains("Alabama")) {
       // Extracting the cities in the list that is next in the DOM
        Elements cities = link.nextElementSibling().select("a");
        for (Element city : cities) {

            arr_linkText.add(city.text());
        }
}

}

于 2013-01-13T20:58:18.267 回答