13

作为一个彻头彻尾的函数式程序员,我发现很难不尝试将我最喜欢的范式硬塞进我正在使用的任何语言中。在编写一些 CI 时发现我想 curry 我的一个函数,然后传递部分应用的函数。阅读后有没有办法在 C 中进行柯里化?并注意http://gcc.gnu.org/onlinedocs/gcc/Nested-Functions.html#Nested-Functions我想出的警告:

#include <stdio.h>

typedef int (*function) (int);

function g (int a) {
    int f (int b) {
        return a+b;
    }
    return f;
}

int f1(function f){
    return f(1);}

int main () {
    printf ("(g(2))(1)=%d\n",f1(g(2)));
}

按预期运行。但是,我的原始程序与doubles 一起使用,所以我想我只需更改适当的类型就可以了:

#include <stdio.h>

typedef double (*function) (double);

function g (double a) {
    double f (double b) {
        return a+b;
    }
    return f;
}

double f1(function f){
    return f(1);}

int main () {
    printf ("(g(2))(1)=%e\n",f1(g(2)));
}

这会产生如下内容:

bash-3.2$ ./a.out 
Segmentation fault: 11
bash-3.2$ ./a.out 
Illegal instruction: 4

错误的选择似乎是随机的。此外,如果任一示例是使用-O3编译器本身编译的,则会抛出Segmentation fault: 11自身。我在任何时候都没有收到来自 gcc 的警告,而且我无法弄清楚发生了什么。有谁知道为什么第二个程序失败而第一个程序没有?或者更好的是如何修复第二个?

我的 gcc 是i686-apple-darwin11-llvm-gcc-4.2 (GCC) 4.2.1 (Based on Apple Inc. build 5658) (LLVM build 2336.11.00),我的内核是Darwin Kernel Version 12.1.0: Tue Aug 14 13:29:55 PDT 2012; root:xnu-2050.9.2~1/RELEASE_X86_64.

编辑:要清楚,我知道我想做的是愚蠢的。这段代码不会在好奇号火星车或纽约证券交易所运行。我试图更多地了解(GNU)C 中的函数指针是如何工作的,并解释我发现的一些有趣的东西。我保证永远不会在现实世界中做这样的事情。

4

4 回答 4

6

一个有趣的问题,我查看了引用的答案中的论文(在 C/C++/Objective-C 中具有 Curried 函数的更多功能可重用性)。

因此,以下是您可能想去的建议路径。我不认为这真的是一个 Curried 函数,因为我不完全理解论文在说什么,而不是一个函数式程序员。然而,做一些工作,我发现这个概念的一些有趣的应用。另一方面,我不确定这是否是您想要的,这让我大吃一惊,您可以在 C 中做到这一点。

似乎有两个问题。

首先是能够处理带有任意参数列表的任意函数调用。我采用的方法是使用标准 C 库变量参数功能(带有 va_start()、va_arg() 和 va_end() 函数的 va_list),然后将函数指针与提供的参数一起存储到数据区域中,以便它们然后可以在以后执行。我借用并修改了printf()函数如何使用格式行来了解提供了多少参数及其类型。

接下来是函数及其参数列表的存储。我只是使用了一个任意大小的结构来尝试这个概念。这将需要更多的思考。

这个特定版本使用一个被视为堆栈的数组。有一个函数可以用来将某个任意函数及其参数推送到堆栈数组中,还有一个函数可以将最顶层的函数及其参数从堆栈数组中弹出并执行它。

但是,您实际上可以在某种集合中包含任意结构对象,例如哈希映射,这可能非常酷。

我只是从论文中借用了信号处理程序示例,以表明该概念适用于那种应用程序。

所以这里是源代码,我希望它可以帮助你想出一个解决方案。

您需要向开关添加其他情况,以便能够处理其他参数类型。我只是做了一些概念证明。

这也不会执行调用函数的函数,尽管从表面上看这似乎是一个相当简单的扩展。就像我说的,我不完全明白这个咖喱的东西。

#include <stdarg.h>
#include <string.h>

// a struct which describes the function and its argument list.
typedef struct {
    void (*f1)(...);
    // we have to have a struct here because when we call the function,
    // we will just pass the struct so that the argument list gets pushed
    // on the stack.
    struct {
        unsigned char myArgListArray[48];   // area for the argument list.  this is just an arbitray size.
    } myArgList;
} AnArgListEntry;

// these are used for simulating a stack.  when functions are processed
// we will just push them onto the stack and later on we will pop them
// off so as to run them.
static unsigned int  myFunctionStackIndex = 0;
static AnArgListEntry myFunctionStack[1000];

// this function pushes a function and its arguments onto the stack.
void pushFunction (void (*f1)(...), char *pcDescrip, ...)
{
    char *pStart = pcDescrip;
    AnArgListEntry MyArgList;
    unsigned char *pmyArgList;
    va_list argp;
    int     i;
    char    c;
    char   *s;
    void   *p;

    va_start(argp, pcDescrip);

    pmyArgList = (unsigned char *)&MyArgList.myArgList;
    MyArgList.f1 = f1;
    for ( ; *pStart; pStart++) {
        switch (*pStart) {
            case 'i':
                // integer argument
                i = va_arg(argp, int);
                memcpy (pmyArgList, &i, sizeof(int));
                pmyArgList += sizeof(int);
                break;
            case 'c':
                // character argument
                c = va_arg(argp, char);
                memcpy (pmyArgList, &c, sizeof(char));
                pmyArgList += sizeof(char);
                break;
            case 's':
                // string argument
                s = va_arg(argp, char *);
                memcpy (pmyArgList, &s, sizeof(char *));
                pmyArgList += sizeof(char *);
                break;
            case 'p':
                // void pointer (any arbitray pointer) argument
                p = va_arg(argp, void *);
                memcpy (pmyArgList, &p, sizeof(void *));
                pmyArgList += sizeof(void *);
                break;
            default:
                break;
        }
    }
    va_end(argp);
    myFunctionStack[myFunctionStackIndex] = MyArgList;
    myFunctionStackIndex++;
}

// this function will pop the function and its argument list off the top
// of the stack and execute it.
void doFuncAndPop () {
    if (myFunctionStackIndex > 0) {
        myFunctionStackIndex--;
        myFunctionStack[myFunctionStackIndex].f1 (myFunctionStack[myFunctionStackIndex].myArgList);
    }
}

// the following are just a couple of arbitray test functions.
// these can be used to test that the functionality works.
void myFunc (int i, char * p)
{
    printf (" i = %d, char = %s\n", i, p);
}

void otherFunc (int i, char * p, char *p2)
{
    printf (" i = %d, char = %s, char =%s\n", i, p, p2);
}

void mySignal (int sig, void (*f)(void))
{
    f();
}

int main(int argc, char * argv[])
{
    int i = 3;
    char *p = "string";
    char *p2 = "string 2";

    // push two different functions on to our stack to save them
    // for execution later.
    pushFunction ((void (*)(...))myFunc, "is", i, p);
    pushFunction ((void (*)(...))otherFunc, "iss", i, p, p2);

    // pop the function that is on the top of the stack and execute it.
    doFuncAndPop();

    // call a function that wants a function so that it will execute
    // the current function with its argument lists that is on top of the stack.
    mySignal (1, doFuncAndPop);

    return 0;
}

您可以从中获得的另一个乐趣是pushFunction()在一个被调用的函数中使用该函数,doFuncAndPop()以使另一个函数可以与其参数一起放入堆栈。

例如,如果您将otherFunc()上面源代码中的函数修改为如下所示:

void otherFunc (int i, char * p, char *p2)
{
    printf (" i = %d, char = %s, char =%s\n", i, p, p2);
    pushFunction ((void (*)(...))myFunc, "is", i+2, p);
}

如果您随后添加另一个调用,doFuncAndPop()您将看到 firstotherFunc()被执行,然后执行myFunc()被插入otherFunc()的调用,然后最后myFunc()调用被推送的main ()调用。

编辑 2: 如果我们添加以下函数,这将执行所有已放入堆栈的函数。这将允许我们通过将函数和参数压入堆栈然后执行一系列函数调用来创建一个小程序。这个函数还允许我们推送一个没有任何参数的函数,然后推送一些参数。当从堆栈中弹出函数时,如果参数块没有有效的函数指针,那么我们所做的就是将该参数列表放在堆栈顶部的参数块上,然后执行它。也可以对上述函数进行类似的更改doFuncAndPop()。如果我们在执行的函数中使用 pushFunction() 操作,我们可以做一些有趣的事情。

实际上,这可能是Threaded Interpreter的基础。

// execute all of the functions that have been pushed onto the stack.
void executeFuncStack () {
    if (myFunctionStackIndex > 0) {
        myFunctionStackIndex--;
        // if this item on the stack has a function pointer then execute it
        if (myFunctionStack[myFunctionStackIndex].f1) {
            myFunctionStack[myFunctionStackIndex].f1 (myFunctionStack[myFunctionStackIndex].myArgList);
        } else if (myFunctionStackIndex > 0) {
            // if there is not a function pointer then assume that this is an argument list
            // for a function that has been pushed on the stack so lets execute the previous
            // pushed function with this argument list.
            int myPrevIndex = myFunctionStackIndex - 1;
            myFunctionStack[myPrevIndex].myArgList = myFunctionStack[myFunctionStackIndex].myArgList;
        }
        executeFuncStack();
    }
}

编辑 3: 然后我们使用以下附加开关进行更改pushFunc()以处理双精度:

case 'd':
  {
     double d;
     // double argument
     d = va_arg(argp, double);
     memcpy (pmyArgList, &d, sizeof(double));
     pmyArgList += sizeof(double);
   }
break;

因此,使用这个新功能,我们可以执行以下操作。首先创建类似于原始问题的两个函数。我们将在一个函数中使用 pushFunction() 来推送参数,然后堆栈上的下一个函数使用这些参数。

double f1 (double myDouble)
{
    printf ("f1 myDouble = %f\n", myDouble);
    return 0.0;
}

double g2 (double myDouble) {
    printf ("g2 myDouble = %f\n", myDouble);
    myDouble += 10.0;
    pushFunction (0, "d", myDouble);
    return myDouble;
}

新我们将我们的新功能与以下一系列语句一起使用:

double xDouble = 4.5;
pushFunction ((void (*)(...))f1, 0);
pushFunction ((void (*)(...))g2, "d", xDouble);
executeFuncStack();

这些语句将首先执行g2()值为 4.5 的函数,然后该函数g2()将其返回值推送到我们的堆栈中,以供f1()首先推送到我们堆栈中的函数使用。

于 2012-10-20T22:18:09.650 回答
4

您试图依赖未定义的行为:一旦内部函数因为外部函数退出而超出范围,则通过某个指针调用该内部函数的行为是未定义的。任何事情都可能发生。事情意外地适用于整数情况的事实并不意味着您可以期望 double 相同,或者您甚至可以期望 int 在不同的编译器、不同的编译器版本、不同的编译器标志或不同的目标体系结构上相同。

所以不要依赖未定义的行为。不要声称自己“注意[ed] the warnings”,而实际上您是在违反这些警告的。警告明确指出:

如果您在包含函数退出后尝试通过其地址调用嵌套函数,那么一切都会崩溃。

C中没有闭包,因此在这个意义上不能进行柯里化。如果您将一些数据传递给函数调用,您可以获得类似的效果,但这看起来与正常的函数调用完全不同,因此不会感觉像正常的柯里化。C++ 在那里具有更大的灵活性,因为它允许对象在语法上表现得像函数。在 C++ 世界中,柯里化通常称为函数参数的“<a href="http://www.boost.org/doc/libs/1_51_0/libs/bind/bind.html" rel="nofollow">绑定” .

如果您真的想知道为什么一段代码可以工作而另一段代码失败,您可以获取汇编代码(例如由 生成gcc -S -fverbose-asm)并在您的脑海中模拟执行,看看您的数据和内容会发生什么。或者您可以使用调试器查看失败的地方,或数据位置的变化。可能需要一些工作,我怀疑这是否值得花时间。

于 2012-10-20T19:11:29.973 回答
0

请原谅我没有得到它,但你为什么不wrap而不是curry,因为你在编译时声明了函数呢?柯里化的优点是——或者至少在我看来——你可以在运行时定义一个部分应用的函数,但在这里你没有这样做。还是我错过了什么?

#include <stdio.h>

// Basic function summing its arguments
double g (double a, double b)
{
    return a+b;
}

double f1(double a)
{
    /* "1" can be replaced by a static initialized
       by another function, e.g.
       static double local_b = g(0, 1);
    */
    return g(a, 1);
}

int main () {
    printf ("(g(2))(1)=%f\n", f1(2));
}
于 2012-10-21T13:21:02.010 回答
0

上述代码的固定版本

#include <stdio.h>

typedef double (*function) (double,double);

// Basic function summing its arguments
double g (double a, double b)
{
        return a+b;
}

double f1(function wrapfunc,double a)
{
 /* "1" can be replaced by a static initialized
     by another function, e.g.
     static double local_b = g(0, 1);
 */
 return wrapfunc(a, 1);  
}

int main () {
        printf ("(g(2))(1)=%f\n", f1(g,2));
}

更多关于带有示例参数示例的不同操作功能的信息

#include<iostream>
#include<cstdio>

using namespace std;

#define N 4

#define LOOP(i) for(i=0; i<N; i++)

#define F(i) ( (int(*)(int,int))opt[i] )
#define FI F(i)
#define FJ F(j)
#define FK F(k)


int add(int a, int b) { return a + b; }

int sub(int a, int b) { return a - b; }

u int mul(int a, int b) { return a * b; }

int div(int a, int b) {
    if (b == 0 || a % b)
        return 2401;
    return a / b;
}

char whichOpt(int index)
{
    if (index == 0) return '+';
    else if (index == 1) return '-';
    else if (index == 2) return '*';
    return '/';
}

void howObtain24(int num[], void *opt[])
{
    int i, j, k, a, b, c, d;
    int ans=0;
    LOOP(i) LOOP(j) LOOP(k)
         LOOP(a) LOOP(b) LOOP(c) LOOP(d)
    {
        if (a == b || a == c || a == d || b == c || b == d || c == d)
            continue;
        if (FI(FJ(FK(num[a], num[b]), num[c]), num[d]) == 24) {
            std::cout << "((" << num[a] << whichOpt(k) << num[b] << ')'
                 << whichOpt(j) << num[c] << ')' << whichOpt(i) << num[d] << endl;
            ans++;
            continue;
        }
        if (FI(FJ(num[a], num[b]), FK(num[c], num[d])) == 24) {
            std::cout << '(' << num[a] << whichOpt(j) << num[b] << ')'
                 << whichOpt(i) << '(' << num[c] << whichOpt(k) << num[d] << ')' << endl;
            ans++;
            continue;
        }
    }
    if(ans==0)
    std::cout << "Non-Answer" << std::endl;
    return;

}

//=======================================================================
int main() {

    int num[N];

    void *opt[N] = { (void *)add, (void *)sub, (void *)mul, (void *)div };

    std::cout << "Input 4 Numbers between 1 and 10\n"
    for (int i = 0; i < N; i++)
        cin >> num[i];

    for (int j = 0; j < N; j++)
        if (num[j] < 1 || num[j] > 10) {
            std::cout << "InCorrect Input\n"

            return 0;
        }
        howObtain24(num, opt);

        return 0;
}
于 2013-09-16T06:05:15.897 回答