问题标签 [search-engine]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
7 回答
212 浏览

java - 我可以在不“做高级事情”的情况下使这个搜索相关性功能更好吗?

我的搜索引擎使用以下函数来计算相关性。

没什么花哨的,而且我也没有足够的时间去做任何花哨的事情,但是我可以做任何简单的改进来使该功能更好地增加相关内容并降低不相关的内容吗?速度优化无需赘述,这只是功能的“功能部分”:)

谢谢。

0 投票
2 回答
280 浏览

search-engine - 为什么 M# 比 C# 更难谷歌?

我刚才在对另一个题为“有效谷歌搜索短名称”的问题的评论中阅读

C# 对 Google 来说一点也不差。顺便说一句,如果它被称为 M#,那就更难了

为什么?我错过了什么?

0 投票
1 回答
509 浏览

tags - 标签搜索库 (ASP).NET

我看到一些可怕的论坛搜索可怕。能够在我的数据库/应用程序中找到东西非常重要。我正在考虑自己写,但在我做之前你们认为什么是好的标签搜索库?C# .NET 或可能的 ASP.NET

注意:我不想要文本搜索,只想要标签。

0 投票
3 回答
653 浏览

search - 爬虫如何确保最大覆盖范围?

我阅读了一些关于网络爬虫的文章,学习了爬虫的基础知识。根据他们的说法,网络爬虫只是使用从其他网页检索到的 URL 并通过一棵树(实际上是一个网格)

在这种情况下,爬虫如何确保最大覆盖范围。显然,可能有很多网站没有来自其他页面/网站的推荐链接。搜索引擎是否遵循除爬取和手动注册之外的任何其他机制?(即从域名注册机构获取信息)

如果只是基于爬取,我们应该如何选择一组好的“Root”站点开始爬取呢?(我们无法预测结果。如果我们选择 100 个没有引荐链接的站点,引擎将只得出 100 个站点 + 它们的内页)

0 投票
6 回答
2791 浏览

search-engine - 谷歌在我的网站上索引了我的测试文件夹:(我如何限制网络爬虫!

帮助 帮助!谷歌在我的网站上索引了一个测试文件夹,没有人知道我应该知道的:(!我如何限制谷歌索引链接和某些文件夹。

0 投票
4 回答
569 浏览

html - 阻止某些 html 元素被搜索引擎索引

出于样式目的,我想在页面上插入一些虚拟文本,但不应将其链接到实际内容。有没有办法为搜索引擎阻止它,或者我必须为此使用好的旧图像?

或者可以通过javascript动态加载它吗?因为我听说谷歌会读取一定数量的 javascript。

0 投票
3 回答
5658 浏览

algorithm - 视觉相似度搜索算法

我正在尝试构建一个类似http://labs.ideeinc.com/multicolr的实用程序,但我不知道他们使用的是哪种算法,有人知道吗?

0 投票
2 回答
195 浏览

php - 搜索引擎将 .ASP 页面转换为 .PHP 的方式

我有基本的 .ASP 页面在 Windows 框上运行。我想将它们迁移到 Linux 主机上,当然必须将它们转换为 .PHP 并像 Google 一样开心。

如果我的网站在搜索引擎中相当受欢迎,那么最好的方法是什么?

网上有很多关于此的内容,我只是想确保我以正确的方式进行。

多谢你们!

0 投票
2 回答
273 浏览

php - 我看一些在 php 中使用 Swish 搜索引擎扩展的例子

有人在 php 中使用过这个扩展或有代码示例吗,

编辑:如果有人处理它,我想听听关于这个扩展的意见。

带有代码的教程,大型示例..

0 投票
2 回答
177 浏览

search - 搜索引擎是否有任何构建块可以抓取其他网站?

我想为一件特定的事情建立一个搜索服务。这些数据可以通过免费的分类服务和许多其他网站免费获得。

是否有任何构建块,例如我可以定制的开源爬虫 - 而不是从头开始构建,我可以使用?

关于构建这样的产品有什么建议吗?不仅仅是技术上的,还有我可能需要考虑的任何隐私/法律问题。

例如,如果我从很多地方得到它们,我是否需要在结果的来源处“给予信任”并放置原始链接?

编辑:顺便说一句,我在前端使用带有 JS 的 GWT,还没有决定后端的语言。PHP或Python。想法?