1

注意:这是一个家庭作业项目,我将尝试编写剩余的代码,但无法弄清楚为什么无法连接到输入 URL。

我得到了骨架代码,我对其进行了一些修改以接收输入 URL。预期用途可能是:./a.out http://google.com

无论出于何种原因,它永远无法成功连接。始终打印错误消息“无法连接”。稍后我需要从 URL 中获取一个文件并将其保存到本地目录,但我会尝试弄清楚如何做到这一点(我的猜测是它与recv()下面的代码有关)。在“ http://google.com ”的情况下,我应该使用“index.html”。

骨架代码正在使用,但使用connect()的手册页似乎要快得多,但也不起作用。使用它似乎永远不会离开 for 循环(编辑:它永远不会离开,因为它似乎被卡住试图连接):getaddrinfo()bind()connect()

#include <sys/types.h>
#include <sys/socket.h>
#include <netdb.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>

int main(int argc, char** argv) {
        // Alex: Input usage (expecting one URL)
        if (argc != 2) {
                printf("Usage: ./hw1 URL\n");
                exit(1);
        }

        // Alex: Set noHttp as argv[1] and remove "http://"
        char* noHttp = argv[1];
        char http[] = "http://";
        if (strlen(noHttp) > 7 && !strncmp(noHttp, http, 7)) noHttp += 7;
        else {
                printf("Invalid URL, expecting http://host/path\n");
                exit(1);
        }
        printf("%s\n", noHttp);

        struct addrinfo hints;
        struct addrinfo* result, * rp;
        int sock_fd, s;

        // Alex: I moved assigning hints.ai_socktype after memset()
        memset(&hints, 0, sizeof(struct addrinfo));
        //hints.ai_socktype = SOCK_STREAM;

        s = getaddrinfo(noHttp, "8080", &hints, &result); // To Stack Overflow: This changed to "80", I am leaving it here because there are comments about it
        if (0 != s) {
                perror("Error populating address structure");
                exit(1);
        }

        int i = 0;
        for (rp = result; rp != NULL; rp = rp->ai_next) {
                printf("i = %d\n", i);
                i++;

                //printf("rp->ai_flags = %d\n", rp->ai_flags);
                printf("rp->ai_family = %d\n", rp->ai_family);
                printf("rp->ai_socktype = %d\n", rp->ai_socktype);
                printf("rp->ai_protocol = %d\n", rp->ai_protocol);

                sock_fd = socket(rp->ai_family, rp->ai_socktype, rp->ai_protocol);
                printf("sock_fd = %d\n", sock_fd);
                if (sock_fd == -1) continue;

                // Success
                if (connect(sock_fd, rp->ai_addr, rp->ai_addrlen) != -1) break;
                close(sock_fd);
        }

        if (rp == NULL) {
                fprintf(stderr, "could not connect\n");
                exit(1);
        }

        freeaddrinfo(result);

        char buf[255];
        memset(&buf, 0, sizeof(buf));

        int recv_count = recv(sock_fd, buf, 255, 0);
        if (recv_count < 0) {
                perror("Receive failed");
                exit(1);
        }

        printf("%s",buf);
        shutdown(sock_fd, SHUT_RDWR);
        return 0;
}

编辑:我替换"8080""80"Uku Loskit 推荐的。

4

3 回答 3

2

您的程序对我来说看起来netcat不错,在端口 8080 上运行并连接到主机:

$ echo "Hello" | ncat -l 8080

将返回:

$ gcc -Wall sample.c 
$ ./a.out http://127.0.0.1
127.0.0.1
i = 0
rp->ai_family = 2
rp->ai_socktype = 1
rp->ai_protocol = 6
sock_fd = 3
Hello
$ 

为了连接到 HTTP,你需要先发送 HTTP 请求,否则会阻塞,在第 64 行之后添加:

    freeaddrinfo(result);

    send(sock_fd, "GET / HTTP/1.1\n\n", 16, 0); // HTTP request

    char buf[255];
    memset(&buf, 0, sizeof(buf));

这将发送请求:

GET / HTTP/1.1

并将端口更改为80,它应该可以工作:

$ ./a.out http://google.com
google.com
i = 0
rp->ai_family = 2
rp->ai_socktype = 1
rp->ai_protocol = 6
sock_fd = 3
HTTP/1.1 200 OK
Date: Sun, 01 Sep 2013 21:05:16 GMT
Expires: -1
Cache-Control: private, max-age=0
Content-Type: text/html; charset=ISO-8859-1
P3P: CP="This is not a P3P policy! See http://www.google.com/support/accounts/bin/answer.py?hl=en&answer=151
$ 
于 2013-09-01T21:03:36.013 回答
1

当您将端口号更改为80并连接到 时http://google.com,它会按预期工作,但会挂起recv()呼叫,因为 HTTP 服务器不会向您发送任何内容,直到您请求它。Sp. 的回答为您提供了一个示例,说明如何通过send()在您的呼叫之前添加呼叫来做到这一点recv()

现在发生的事情是你正在连接到它,它正在等待你告诉它你想要什么。你正在做的只是等待它通过你的recv()电话向你发送一些东西,所以你们都会等到它超时。

于 2013-09-01T21:13:55.310 回答
1

您应该连接端口 80,而不是 8080。端口 80 是 HTTP 的默认端口。

于 2013-09-01T20:53:34.523 回答