问题标签 [url-parsing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
7 回答
2242 浏览

python - 在 Python 中解析邮件地址

我正在尝试将 mailto URL 解析为一个不错的对象或字典,其中包括subject,body等。我似乎找不到实现这一目标的库或类 - 你知道吗?

0 投票
1 回答
2777 浏览

c# - 如何获取 URL 路径中的子目录?

我正在寻找一种拆分 URL 的方法,例如http://aaa/bbb/ccc/ddd/eee

我如何获得“ccc”?当然可以拆分它,但它并不有趣。

0 投票
1 回答
3767 浏览

php - 正则表达式忽略 HTML 标记中已有的 URL

我的正则表达式有点问题

我为我的网站制作了一个自定义 BBcode,但我也希望解析 URL。

我正在使用 preg_replace,这是用于识别 URL 的模式:

效果很好,但是如果 URL 在 [img][/img] 块内,上述模式也会将其拾取并产生如下结果:

我尝试使用这个:

没有运气。

任何帮助将不胜感激。

编辑: 有关解决方案,请参阅关于 stema 答案的第二条评论。

0 投票
2 回答
13639 浏览

python - 从页面上的相对 url 重构绝对 url

给定页面的绝对 url,以及在该页面中找到的相对链接,是否有办法a)明确重建或b)尽力重建相对链接的绝对 url?

就我而言,我正在使用漂亮的汤从给定的 url 读取 html 文件,剥离所有 img 标记源,并尝试构建页面图像的绝对 url 列表。

到目前为止,我的 Python 函数如下所示:

注意:不需要 Python 答案,只需要所需的逻辑。

0 投票
5 回答
309 浏览

php - 更好的方式来阅读 URL 的最后部分

此脚本应检测完整路径中的最后一部分,以及是否stackoverflow输出ok


示例 1:www.myserver.ext/something/else/stackoverflow/ 输出:ok


示例 2:www.myserver.ext/something/else/stackoverflow 输出:not ok


示例 3:www.myserver.ext/something/else/stackoverflow/foo 输出:not ok


我希望你能理解这个想法。该脚本运行良好,但我想知道是否有更好、更优雅的方式来读取 URL 的最后一部分?

0 投票
1 回答
429 浏览

objective-c - 解析 KOI8-r 编码目标 c

我需要解析实际上是 KOI8-R 编码的 url,并且正如我所浏览的那样,objective c 中没有允许这样做的编码。

它曾经是这样的 NSString* fileText = [NSString stringWithContentsOfURL: [NSURL URLWithString:@"ThePageISurf.com"] encoding: NSCyrrilicKOI8-Rencoding error:nil];

也许有一个库/方法可以将字符串转换为 KOI8-R?或者甚至直接URL?一定有办法的......

0 投票
3 回答
6454 浏览

php - 如何从完整的 ebay 项目 url 获取 ebay 项目 ID?

这些天我正在研究 ebay api,但我仍然无法弄清楚如何使用完整的项目 url 获取 ebay 项目 ID (http://www.ebay.com/ctg/TomTom-XXL-550M-US-including-Puerto-Rico-Canada-Mexico-Automotive-GPS-Receiver-/86127922?)

我尝试了很多方法,但请帮助我!有没有使用 API?或任何其他方式我只需要 ebay 项目编号..

0 投票
1 回答
7050 浏览

javascript - 如何使用 javascript 从域中删除子域

我从如下所示的域开始:

我需要删除子域以获得如下所示的值:

其他顶级域名:

0 投票
13 回答
611469 浏览

php - 如何从 URL 字符串中获取参数?

我有一个 HTML 表单字段$_POST["url"],有一些 URL 字符串作为值。

示例值为:

等等

如何email仅从这些 URL/值中获取参数?

请注意,我没有从浏览器地址栏中获取这些字符串。

0 投票
2 回答
990 浏览

python - 使用python处理json中的转义url字符串

我正在访问返回 json 的服务,如下所示:

我想要做的是解析这个 json 并在键值对中获取文件夹的 url 和 somefile 部分。

所以,基本上,在我的脚本处理完 json 之后,它会以某种分隔方式在文件中输出 url 和 somefile。

文件处理上述提供的 json 后的输出将是:

我很确定python中有许多json解析器可以解析json,但是我将如何处理已经用转义字符预处理的url字符串?我是否需要编写自己的 url-encoder 来去除 url 字符串中的转义字符?

此外,我需要标记 url 的各个组件以到达“文件”部分,是否有任何库可以帮助解决这个问题?

谢谢