问题标签 [search-engine]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
199 浏览

search - 微软搜索服务器

如何以编程方式从 Microsoft Search Server 检索最流行的搜索词?

0 投票
1 回答
599 浏览

open-source - 托管项目元搜索引擎

无数可用的站点,如sourceforgegithubberliosruby​​forge和许多其他托管开源项目的站点,我一直想知道是否有专门的搜索引擎可以对这些不同站点上的所有可用项目进行分类。

我不是在谈论搜索实际源代码(如kodersgoogle codesearch )的搜索引擎,而是对项目本身进行编目的东西。

例如,如果我正在搜索开源文件比较/合并实用程序。我可能会把“文件比较”放到这个搜索引擎中,然后得到一堆匹配的项目。我什至可以根据操作系统、实现语言、许可证或其他标准来缩小搜索范围。

我能想到的最接近的是freshmeat,尽管在这种情况下项目所有者必须将信息提交给freshmeat,但它不会蜘蛛出信息本身。 Krugle确实有一个“开源项目”选项卡,但每当我点击它时,页面就会重新加载,所以这并没有真正的帮助......

0 投票
1 回答
174 浏览

search-engine - 新的网络标准?

谷歌、微软和雅虎现在计划创建一个新的网络标准。这对使用 html、ajax 作为开发的 Web 开发人员来说是一个优势吗?

如果发生这种情况,是否不会出现浏览器问题?

他们这样做是为了打败 adobe 的 flash 播放器和 mxml 约定吗?

就 GUI 而言,当今 Web 应用程序开发的最佳举措是什么?使用 adobe 的 flex 框架进行开发或使用各种 ajax 工具包/框架(例如 GWT、EXT、jQuery)保持现代性?

0 投票
2 回答
2337 浏览

seo - 为什么在 URL 中使用页面标题?

为什么有些网站,大多数博客,在 url 中使用帖子的标题?如:

http://www.geek.com.br/blogs/832697632/posts/9360-uni-o-europ-ia-pretende-apoiar-conex-o-universal-para-celulares

这会改善谷歌索引吗?

编辑:这是为什么有些网站会在 URL 的末尾添加“Slugs”的副本?

0 投票
1 回答
733 浏览

search-engine - 在 URLS 中表示非 ASCII 字符可以在搜索引擎中提供更好的页面排名?

世界大部分地区使用非 ASCII 字符。但有些习语使用 é、ö、á、ã、õ 等,可以“转换”为 ascii。

假设帖子的标题是:

如何在 URL 中表示它?

一个更好的表示是

维基百科在http://en.wikipedia.org/wiki/Deja_vu中这样做

这会提高搜索引擎中的页面排名吗?

如何用你最喜欢的语言做到这一点?

0 投票
3 回答
32392 浏览

search-engine - 谷歌搜索返回空白页

当我在谷歌搜索任何字符串时,它正在重新调整一个空白页面。返回页面的 html 源代码如下所示。

即没有任何东西返回给浏览器。

但是,当我在地址栏中使用 google 的 IP 地址进行搜索(而不是输入 google.com)时,搜索会返回所需的结果。(不再返回空白页)。

为什么会发生这种奇怪的行为?我很确定它没有被防火墙阻止,因为网络中与我具有相同访问权限的其他用户能够与谷歌正常工作。它也不是浏览器中的任何设置。

在我看来,当我使用域名(google.com)进行搜索时,搜索请求根本没有到达谷歌服务器。

承认这不是一个程序问题,虽然我可以使用谷歌的 IP 地址进行搜索,但使用域名时的问题对我来说仍然是一个未解之谜。

这种相当奇怪的行为可能是什么原因?

0 投票
1 回答
3003 浏览

asp.net - 如何在 Search Server 2008 Express 中设置搜索 Web 服务的访问权限?

我在 Windows 2003 服务器上安装了 Microsoft Search Server 2008 Express,并创建了一个搜索内容源(我们的公司网站)进行测试。我可以从搜索中心很好地搜索这个来源。

从 ASP.NET Web 应用程序中,我尝试查询所提供的 Web 服务,如此处所述

我在 web.config 中使用模拟设置来指定运行请求的用户帐户,但我不知道如何在搜索服务器中设置该用户以允许其进行查询。

如果我使用自己的网络凭据,则会返回结果,因为我在 Search Server 实例中设置了完全控制权限,但是当我为此使用备用域帐户 (MyDomain\QueryUser) 时,我收到此错误:

System.Web.Services.Protocols.SoapException:服务器无法处理请求。---> 试图执行未经授权的操作。

我已在 Search Server > Site Settings > Permissions > Add Users 中将用户添加到服务器,并为帐户提供了完全控制权,但它仍然无法使用 web 服务。我想念的地方有设置吗?

**编辑

好的,我已经尝试了 Gordon 的建议,并使用 Sharepoint 应用程序使用的凭据使错误消失。此外,将第二个域用户添加到服务器上的本地管理员组会使错误消失。

这些更改授予 Web 服务的权限是什么?我是否必须求助于使用这些变通办法,或者我可以在某处的 Sharepoint 中为我的域用户授予适当的权限?

0 投票
2 回答
530 浏览

language-agnostic - 解析和格式化搜索结果

搜索:

脚本+语言 Web+页面应用程序

结果:

...脚本语言最初...产生动态网页。它具有...图形应用程序...目的脚本语言是...d 创建网页作为输出...

假设我想要一个值来表示允许在匹配项的任一侧填充的字符数量,另一个值表示结果中将显示多少匹配项(即,我只想查看前 5 个匹配项,而已)。

会怎么做呢?

这与语言无关,但我将在 PHP 环境中实现该解决方案,因此请将答案限制在不需要特定语言或框架的选项上。

这是我的思考过程:从搜索词创建一个数组。确定哪个搜索词具有关于它在文章正文中的位置的最低索引。将正文的那部分收集到另一个变量中,然后从文章正文中删除该部分。返回到第 1 步。您甚至可以为每个单词添加一个计数器,当计数器达到 3 左右时跳过它。

重要的:

解决方案必须以非线性方式匹配所有搜索项。意思是,如果术语一存在于术语二之后,则它应该在术语二之后找到。同样,它也应该在第 3 学期之后找到。如果恰好在它们之前存在,则应在术语 1 和 2 之前找到术语 3。

该解决方案应允许我声明“每个术语最多允许三个匹配项,然后终止摘要。”

额外学分:

获取填充变量以可选地填充单词,而不是字符。

0 投票
13 回答
12438 浏览

user-interface - 您将如何设计一个好的搜索 UI?

我想为我的用户提供一个“高级”搜索引擎。我基本上有很多搜索条件可供选择:

  • 有些非常简单/常见,将大量使用(即时间段、项目 ID)
  • 有些不太主流
  • 还有一些不会用很多,但我还是想提供

总的来说,我有大约 30 多个标准可供选择

结果是我在网格中显示的数据集。

我在互联网上寻找灵感,甚至谷歌似乎也没有一个很好的高级搜索解决方案。

我过去设计过这种工具,但我对结果并不满意,尽管用户最终能够非常有效地使用它。

  • 你认为搜索面板应该一直可见(即显示在我的结果网格顶部)还是以单独的形式提供(这让我可以为所有控件使用更多位置)

  • 您认为最好显示所有搜索条件,还是让用户在想要查看/使用更多条件时单击“高级”?

  • 您将如何组织标准?按使用频率,或者按区域(即与用户、位置、时间等相关的标准)

  • 我应该把“搜索”按钮放在哪里?在更常见的搜索控件旁边,还是在底部,或两者兼而有之?

更一般地说,您是否有关于如何设计一个漂亮的搜索 UI 的提示要分享?在这种“高级”搜索引擎中,您通常会错过哪些功能?

0 投票
9 回答
30619 浏览

lucene - 哪些是 Lucene 的最佳替代品?

它可以在 Unix 上运行,并将用于电子邮件搜索(Dovecot、Postfix 和 maildir)。

Lucene 不是问题,我只是在分析一些替代方案。