1

所以在我程序的另一部分,我从浏览器中读出了各种 url。说我有http://www.example.com以及http://example.comhttps://example.com。对于浏览器,这三个 url 是不同的。对我来说,只有“基本”域 ( example.com) 很重要。

我现在正试图www从域中剥离,但是,不能成功。我想使用提供的 QUrl 库来执行此操作,而不是检查字符串是否包含 awww.并在之后将其删除。如您所见,这里更多的是设计决策;)

这是我当前的应用程序。

主文件

#include <QApplication>
#include <QDebug>
#include <QUrl>
#include <QList>

int main(int argc, char *argv[])
{
    QList<QUrl> urlList;
    urlList << QUrl("http://example.com/qwe/whoami/123#123141");

    urlList << QUrl("chrome://newtab/");
    urlList << QUrl("favorites://");
    urlList << QUrl("");

    urlList << QUrl("https://www.google.de/");
    urlList << QUrl("https://google.de/");
    urlList << QUrl("https://www.youtube.com/watch?v=XTPGpBBqwe");

    urlList << QUrl("https://youtube.com/watch?v=189273ijadzqiuwejk");
    urlList << QUrl("http://raspberrypi.stackexchange.com/questions/10371/whoisthisyo");
    urlList << QUrl("https://stackoverflow.com/questions/33478464/alfresco-custom");

    urlList << QUrl("http://localhost:3000");
    urlList << QUrl("localhost:3000");

    for (int i = 0; i < urlList.count(); i++) {
        qDebug() << "[" << i+1 << "] " << urlList[i].host();
    }


    return 0;
}

谢谢你的帮助!

4

1 回答 1

3

没有开箱即用的功能。

我能想到的最佳解决方案是替换URL"www." 的主机部分开头的(如果存在)。

请注意,您不应删除"www."主机中甚至 URL 其余部分中出现的任何其他字符串,因此我们检查是否以QUrl::host()开头,"www."然后从中删除这四个字符。

另请注意,从技术上讲,这会更改主机名,从而可能会将您带到不同的网站。(尽管实际上,www.出于可用性原因,每个网站都应该提供带有或不带有子域前缀的相同内容。)此外,在某些特殊情况下,它可能会导致完全意想不到的结果,例如www.甚至没有子域:域www.com将导致只是com

QUrl remove_www(QUrl url) {
    QString host = url.host();
    if (host.startsWith("www."))
        host = host.mid(4); // = remove first 4 chars
    url.setHost(host);
    return url;
}

然后使用这个函数的返回值:

for (int i = 0; i < urlList.count(); i++) {
    qDebug() << "[" << i+1 << "] " << remove_www(urlList[i]);
}
于 2015-11-02T13:55:52.433 回答