问题标签 [sphider]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
robots.txt - 使用 Sphider 搜索引擎和 robots.txt
我在我正在开发的网站上安装了 Sphider 1.3.5 搜索引擎。我正在使用共享主机(Dreamhost),一切似乎都安装得很好并且工作正常,除了一个问题。
Sphider 似乎忽略了我的 robots.txt 文件。我已经成功验证了 robots.txt 语法,检查并重新检查了我的路径以确保它们是正确的,一次又一次地在管理区域重新索引站点,无论我做什么,Sphider 都不会离开我所谓的不允许的文件。
这是文件的文本:
我注意到 Google 网站管理员工具当前将文件的文本视为:
这是文件的状态,直到今天早上我添加了其余的不允许的文件。直接链接到 robots.txt 会显示全文。我认为谷歌没有重新索引,所以这就是它看到旧文件的原因。但是我通过 Sphider 管理员手动重新索引成功,它似乎忽略了这些规则。
任何人都看到问题可能是什么?我难住了。
json - 让 Spider 输出 JSON
我最近将Sphider爬虫添加到我的网站以添加搜索功能。但是我下载的 Sphider 发行版附带的默认 search.php 太简单了,不能很好地与我网站的其他部分集成。我在网站顶部有一个小导航栏,里面有一个搜索框,我希望能够使用 Ajax 通过该搜索字段访问 Sphider 的搜索结果。为此,我认为我需要让 Sphider 以 JSON 格式返回其结果。
我这样做的方式是使用输出 JSON 的“主题”(Sphider 支持“主题化”它的输出)。我在 Sphider 网站上的这个主题上找到了这个主题。它似乎有效,但更严格的 JSON 解析器不会解析它。这是一些示例 JSON 输出:
问题是结尾附近有一个逗号。据此,在json_decode()
使用 PHP 的函数时“不允许使用尾随逗号” 。此 JSON 也无法使用此在线格式化程序进行解析。但是当我把逗号去掉时,它起作用了,我得到了这个格式更好的 JSON:
现在,我将如何以编程方式执行此操作?而且(也许更重要的是),有没有更优雅的方式来实现这一点?而且您应该知道 PHP 是我可以在我的共享主机帐户上运行的唯一语言,因此例如 Java 解决方案不适合我。
mysql - 如何将 Sphider 搜索添加到我的网站?“无法连接到数据库”
我下载了Sphider 搜索引擎,目前正在尝试通过我的本地主机运行它。我将它提取到我的根文件夹中,并在 HTML 中创建了一个搜索栏:
但是当我输入一些东西时,我得到了这个错误:
无法连接数据库,请检查用户名、密码和主机是否正确。
我对 MySQL 很install.txt
陌生,我阅读了 sphider-1.3.5 文件夹中的 , 并执行了以下操作:
mysql -u 你的用户名 -p 提示时输入你的密码。b) 在 MySQL 中,输入:CREATE DATABASE sphider_db;
但是,当我输入时,CREATE DATABASE sphider_db
我得到了这个:
我现在不知道该输入什么。我试过sphider_db
exit
但没有任何反应?
对不起,如果这个问题对大多数人来说是常识,但我刚刚开始使用 MySQL/Sphider。
search-engine - 用于垂直搜索的 Sphider
我正在研究构建垂直搜索引擎的不同工具。我遇到过http://www.sphider.eu/,我认为它工作正常。
但是,我不确定它可以索引多少页。文档中似乎没有关于此的信息。我想我将为这个特定的搜索引擎索引大约一百个站点,并且我必须每天至少重新索引一次。
蜘蛛能做到这一点吗?还是我应该寻找其他解决方案?
php - 用于在 PDF 中搜索关键字的 Sphider
可以自定义 Sphider 在 PDF 中搜索关键字吗?
我知道 Sphider 是用 PHP 编写的。
php - 将 Sphider 搜索引擎集成到网站中
我在我的网站上启动并运行了 Sphider 搜索引擎,但我遇到了两个问题。
我不清楚如何设置索引以正确显示结果。
我正在尝试获取 search.php 文件和
在位于我网站根目录的dashboard.php 文件中。
蜘蛛在
但是当我包含它时,什么也没有出现。如果有人对我遇到的问题有任何见解,我将不胜感激。是的,我在这里和那里找到了一些在线文档,但没有任何东西可以为我解决这个问题。
php - 除非手动添加,否则某些页面不会被 Sphider 索引
我最近在我的网站上安装了 Sphider,这样做很简单,索引页面也很简单,但是我遇到了一个小问题。
我的网站上有很多(严重加载)页面,其中很多没有被编入索引。我有一个页面,它需要一个 .csv 文件并使用 PHP 中的 foreach 循环创建一个表,第一列是每个项目的超链接,并带有该项目的专用页面。我的问题出现了,Sphider 不索引这些单独的页面,它只索引表格页面。我在正确的二和八,因为我不知道为什么这些页面没有被索引。
我检查了是否有,但我没有,我什至设置 Sphider 索引表中随机的单个页面,它出现在搜索中。我会对所有页面都这样做,但每次我们得到一个新项目时我都会不断添加新页面,所以我会被要添加到索引列表的东西淹没。
我的问题来了:是否有一些解决方案可以让我有一个脚本,将每个 URL 添加到 Sphider 的数据库中,因为这似乎使它们出现;或者我是一个完整的 div 并且在这里遗漏了一些非常明显的东西,因为 .csv PHP 表出现了问题,也许?
我真的很感谢你的帮助,因为我完全糊涂了。
谢谢,卡蒂
PS,包含 tl 的标准是什么;博士?这仅适用于Redditors吗?:P
mysql - Sphider MySQL 表
我正在尝试安装 Sphider 来搜索我的网站,当我尝试创建 MySQL 表时出现此错误:
我该如何解决这个问题?
php - Sphider PHP 搜索引擎中的正则表达式
我尝试在我的网站中实现 Sphider 网络搜索并开始编制索引。有 2 种意见:URL 必须包含 / URL 不得包含。我必须使用正则表达式,并且想要索引一个我知道链接结构的网站,并且我想抓取所有包含的 URLhttp://example.com/frage/....
当我输入正则表达式字段*/frage/
时,它不起作用,因为禁止访问索引。我也试过*\/frage
和*\/frage\/
。
我该如何处理?
php - 将 Sphider 搜索引擎与 CodeIgniter 集成
我想将Sphider 搜索引擎与CodeIgniter框架集成,但我不知道该怎么做。
有人对此有解决方案吗?