12

我正在尝试使用prerender.io来获取 angularjs 页面的快照。目前我有一个用于 Web 应用程序的 NodeJS 实例,并且nginx反向代理将请求从端口重定向804000.

根据 prerender nginx 手册(https://gist.github.com/thoop/8165802),我可以将搜索引擎机器人请求转发到 prerender url,但因为我已经有 NodeJS 应用程序的代理,我不知道怎么做我预渲染try_files指令。

我的问题是,如何同时使用 NodeJS 应用程序代理和 prerender 指令?

4

1 回答 1

7

我相信prerender 的例子有答案。如果 prerender 设置为 1,它使用 rewrite 然后 proxy_pass。

所以你会改变这个:

if ($prerender = 0) {
            rewrite .* /index.html break;
        }

对此:

if ($prerender = 0) {
        rewrite .* /index.html break;
        proxy_pass http://[INTERNAL IP]:[PORT];
    }

由于您使用的是 Node 并且不需要为静态文件设置一些东西,因此我会进行进一步的修改。

这是我的最终答案:

server {
   listen 80;
   server_name example.com;

   location / {
       try_files $uri @prerender;
   }

location @prerender {
    #proxy_set_header X-Prerender-Token YOUR_TOKEN;

    set $prerender 0;
    if ($http_user_agent ~* "baiduspider|twitterbot|facebookexternalhit|rogerbot|linkedinbot|embedly|quora link preview|showyoubot|outbrain|pinterest|slackbot|vkShare|W3C_Validator") {
        set $prerender 1;
    }
    if ($args ~ "_escaped_fragment_") {
        set $prerender 1;
    }
    if ($http_user_agent ~ "Prerender") {
        set $prerender 0;
    }
    if ($uri ~ "\.(js|css|xml|less|png|jpg|jpeg|gif|pdf|doc|txt|ico|rss|zip|mp3|rar|exe|wmv|doc|avi|ppt|mpg|mpeg|tif|wav|mov|psd|ai|xls|mp4|m4a|swf|dat|dmg|iso|flv|m4v|torrent|ttf|woff)") {
        set $prerender 0;
    }

    #resolve using Google's DNS server to force DNS resolution and prevent caching of IPs
    resolver 8.8.8.8;

    if ($prerender = 1) {

        #setting prerender as a variable forces DNS resolution since nginx caches IPs and doesnt play well with load balancing
        set $prerender "service.prerender.io";
        rewrite .* /$scheme://$host$request_uri? break;
        proxy_pass http://$prerender;
    }
    if ($prerender = 0) {
        proxy_pass http://[INTERNAL IP]:[PORT];
    }
}
} 

我希望这会有所帮助。我要补充的一件事是我不会使用预渲染引擎。蜘蛛甚至可以索引使用 javascript 和 PDF 的链接和页面。

只是我的两分钱。

于 2015-05-30T18:35:55.977 回答