问题标签 [public-suffix-list]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 公共后缀列表 C# 解析器
有没有人在 c# 中有公共后缀列表(获取真实域)解析器。
它在 code.google.com /p/domainname-parser/ (remove space before p in name) 上可用,但是项目可能已从谷歌代码中删除,因为我无法再访问项目文件夹和源代码。
javascript - 从文本文件值创建 JSON 对象
我想转换明文公共后缀列表转换为 JSON 对象,以便在我的脚本中使用它。我只想要顶级域名列表。
列表在这里https://publicsuffix.org/list/effective_tld_names.dat
我最初的想法是正则表达式匹配后缀列表的文件,但我不知道如何在 javascript 中正则表达式文件。我对javascript有点陌生。
任何有想法的人,如何实现这一目标。谢谢你
r - 从R中的url返回根域
给定网站地址,例如
如何返回根域R
,例如
出于我的目的,我将根域定义为具有结构
其中 example_name 不包括“www”,而 public_suffix 在此处的列表中:
https://publicsuffix.org/list/effective_tld_names.dat
这仍然是基于正则表达式的最佳解决方案吗:
https://stackoverflow.com/a/8498629/2109289
R
根据公共后缀列表解析根域的内容怎么样,例如:
http://simonecarletti.com/code/publicsuffix/
已编辑:根据理查德的评论添加额外信息
使用XML::parseURI
似乎返回第一个“//”和“/”之间的东西。例如
因此,问题归结为拥有一个R
可以从 URI 返回公共后缀的函数,或者在公共后缀列表上实现以下算法:
- 根据所有规则匹配域并记下匹配的规则。
- 如果没有规则匹配,则优先规则为“*”。
- 如果多个规则匹配,则主要规则是例外规则。
- 如果没有匹配的异常规则,则优先规则是标签最多的规则。
- 如果现行规则是例外规则,则通过删除最左边的标签来修改它。
- 公共后缀是来自域的一组标签,这些标签直接匹配现行规则的标签(由点连接)。
- 已注册或可注册的域是公共后缀加上一个附加标签。
java - Java api public-suffix-list 返回一个空域
我使用 java API 根据给定的 URL 提取第二个域名。
https://github.com/whois-server-list/public-suffix-list
它基于PUBLIC SUFFIX LIST
Mozilla的。
给定以下代码:
我得到以下输出:
它适用于大多数域,但对于s3.amazonaws.com
,它返回 null。但是对于类似的:s4.amazonaws.com
,它给出了正确的结果。有什么问题?
wordpress - 公共后缀列表:为什么没有列出 wordpress.com?
抱歉,如果这有点离题。我正在使用guava
which 在内部使用public suffix list。怎么blogspot.com
有而wordpress.com
没有呢?(还有etsy.com
许多其他人......)
我认为此列表的目的是帮助我检测到ihadanny.wordpress.com
并且highlyscalable.wordpress.com
不属于同一个人,而www.outbrain.com
属于traffic.outbrain.com
同一个人...
google-chrome - 在 Chrome 中禁用针对公共后缀列表的 cookie 检查
我们有一系列应用程序,我们希望在合并 PR 之前使用 Heroku 的Review Apps对其进行测试。
登录信息存储在这些应用程序之间共享的 cookie 中。由于herokuapp.com
列在Public Suffix List下,因此我们不能使用 heroku 提供的域来测试应用程序,因为 cookie 不会在该域上共享。
是否有一种简单的方法可以禁用域对 Chrome 中的公共后缀列表的检查,或者我们可以herokuapp.com
从列表中本地排除/覆盖?
validation - Mozilla 的公共后缀——它是否包含_所有_ 当前可用的 LTD?
有一个 Mozilla 的项目“ https://publicsuffix.org/ ”。我认为它会在我想要验证 URI 的库中派上用场,尤其是 ltd 部分。publicsuffix 是否包含单词中所有可能的 ltd,它们当前在 Internet 上可用并且始终是最新的?可以在生产中使用吗?
请注意,我的问题不是建议我使用库或服务来验证 URI。
powershell - 有没有办法遍历 Powershell 中的 publicsuffix 列表?
我正在尝试测试一个 Web 过滤解决方案,所以我有一个 powershell 循环遍历 URL 列表并返回 Web 响应。问题是您经常访问可能未找到未经授权的 403 或 404 的 cdn 或其他站点,您需要找到根域。
我发现的唯一合乎逻辑的解决方案是将它与 publicsuffix 列表交叉引用。从我所看到的情况来看,它唯一不能很好地运行的语言是 PowerShell。我想知道是否有人遇到过这个问题或有解决方案。
python - 为“星号前缀”后缀提取域
我使用tldextract(2.2.2 版)从 URL 中提取子域/域/后缀。
我最近注意到一个令我惊讶的结果:
不是作为域被拾取,而是althawrah
作为后缀的一部分被拾取。 为什么是这样?
稍微窥探一下,我注意到Public Suffice List本身.ye
是少数使用前导星号的后缀之一,例如
这里的含义是,这些后缀不允许直接在后缀下注册域名,而是必须注册为三级名称。但是,http://althawrah.ye/并非如此;即,未列为 .ye 的二级域。那么,这里发生了什么?althawrah
cookies - Chrome 或任何其他浏览器如何使用公共后缀列表?
只是好奇,Chrome 或任何其他浏览器都不允许在公共后缀列表中设置 cookie。.github.io 或 .compute.aws.amazon.com 等域是列表中的一些示例。
- 它如何与公共后缀列表上的更新保持同步?
- 如果我将我的域添加到公共后缀列表,浏览器系统需要多长时间才能更新?
- 那些最近添加到 PSL 的域上已经设置的 cookie 呢?