3

我有两种类型的表达式,我想解析和计算结果。

  • 算术表达式:+、-、*、/ 和 sqrt() 函数;例如:“2 + 3 * sqrt(100*25)” -> 应该计算为 152

  • 函数:GetSubString() 和 ConcatenateStrings() 例如:“GetSubString('100str1', 0, 3)” -> 应计算为 100

我有 2 个单独的语法来解析这些表达式类型。现在我想将这两种语法结合起来,并可以一起定义这些表达式。

前任:

  • "GetSubString('100str1', 0, 2+1) + sqrt(9)" -> 结果= 103
  • “2 + 3 * sqrt(GetSubString('100str1', 0, 2+1))” -> 结果= 32

我试图通过使用置换运算符来组合以下两种语法。但它不编译。

    expr_    =
        ( *( (function_call_ ^ arithmeticexpression_)| string_ ));

那么这是结合我的 function_call_ 和算术表达式_ 规则的正确方法还是我应该如何做到这一点?

typedef boost::variant<int, float, double, std::wstring> RetValue;


RetValue CTranslationFunctions::GetSubString(RetValue const& str, RetValue position, RetValue len)
{
    std::wstring strToCut;
    size_t posInt = 0;
    size_t lenInt = 0;

    try
    {
        strToCut = boost::get<std::wstring>(str);
        posInt = boost::get<int>(position);
        lenInt = boost::get<int>(len);
    }
    catch (const boost::bad_get&)
    {
        throw;
    }

    return strToCut.substr(posInt, lenInt);
}

RetValue CTranslationFunctions::ConcatenateStrings(RetValue const& a, RetValue const& b) 
{
    wostringstream woss;
    woss << a << b;
    return woss.str();
}

double CTranslationFunctions::Negate(double num)
{
    return -num;
}

double CTranslationFunctions::Add(double num1 , const double num2)
{
    return num1 + num2;
};

double CTranslationFunctions::Subtruct(double num1 , double num2)
{
    return num1 - num2;
};

double CTranslationFunctions::Multiply(double num1 , double num2)
{
    return num1 * num2;
};

double CTranslationFunctions::Divide(double num1 , double num2)
{
    return num1 / num2;
};

double CTranslationFunctions::Sqrt(double num)
{
    return sqrt(num);
}

class InvalidParamEx{};

double CTranslationFunctions::ConvertStringToDouble(RetValue val)
{
    wostringstream wss;
    double dNum;
    wss << val;
    std::wistringstream iss;
    iss.str(wss.str());
    try
    {
        iss >> dNum;
    }
    catch (...)
    {
        throw InvalidParamEx();
    }

    return dNum;
}


BOOST_PHOENIX_ADAPT_FUNCTION(RetValue, ConcatenateStrings_, ConcatenateStrings, 2)
BOOST_PHOENIX_ADAPT_FUNCTION(RetValue, GetContainerId_, GetContainerId, 2)

BOOST_PHOENIX_ADAPT_FUNCTION(double, Add_, Add, 2)
BOOST_PHOENIX_ADAPT_FUNCTION(double, Subtruct_, Subtruct, 2)
BOOST_PHOENIX_ADAPT_FUNCTION(double, Multiply_, Multiply, 2)
BOOST_PHOENIX_ADAPT_FUNCTION(double, Divide_, Divide, 2)
BOOST_PHOENIX_ADAPT_FUNCTION(double, Negate_, Negate, 1)
BOOST_PHOENIX_ADAPT_FUNCTION(double, Sqrt_, Sqrt, 1)
BOOST_PHOENIX_ADAPT_FUNCTION(double, ConvertStringToDouble_, ConvertStringToDouble, 1)

// Grammar to parse map functions
template <typename It, typename Skipper = qi::space_type >
struct MapFunctionParser : qi::grammar<It, RetValue(), Skipper, qi::locals<char>  >
{
    MapFunctionParser() : MapFunctionParser::base_type(expr_)
    {
        using namespace qi;

        function_call_ = 

        | (lit(L"GetSubString") > '(' > expr_ > ',' > expr_ > ',' > expr_ > ')')               
            [ _val = GetSubString_(_1, _2, _3) ]
        | (lit(L"ConcatenateStrings") > '(' > expr_ > lit(',') > expr_ > ')')               
            [ _val = ConcatenateStrings_(_1, _2) ];


        string_ = as_wstring[omit    [ char_("'\"") [_a =_1] ]        
        >> no_skip [ *(char_ - char_(_a))  ]
        >> lit(_a)];

        arithmeticexpression_ =
            term_                        [_val = _1]
        >>  *( ('+' >> term_           [_val = Add_(_val,_1)])
             |   ('-' >> term_           [_val = Subtruct_(_val, _1)])
            );

        term_ =
            factor_              [_val = _1]
        >> *( ('*' >> factor_  [_val = Multiply_(_val, _1)])
            |   ('/' >> factor_  [_val = Divide_(_val, _1)])
            );

        factor_ =
            double_                            [_val = _1]
          string_                            [_val = ConvertStringToDouble(_1)]
      |   ('-' >> factor_                  [_val = Negate_(_1)])
      |   ('+' >> factor_                  [_val = _1])
        |   (L"Sqrt" > '(' > double_ > ')'  )     [_val = Sqrt_(_1)]);


        expr_    =
            ( *( (function_call_ ^ arithmeticexpression_)| string_ ));


        on_error<fail> ( expr_, std::cout
            << phx::val("Error! Expecting ") << _4 << phx::val(" here: \"")
            << phx::construct<std::string>(_3, _2) << phx::val("\"\n"));

        BOOST_SPIRIT_DEBUG_NODE(function_call_);
        BOOST_SPIRIT_DEBUG_NODE(expr_);
        BOOST_SPIRIT_DEBUG_NODE(string_);
        BOOST_SPIRIT_DEBUG_NODE(funcparameter_);
        BOOST_SPIRIT_DEBUG_NODE(arithmeticexpression_);
        BOOST_SPIRIT_DEBUG_NODE(factor_);
        BOOST_SPIRIT_DEBUG_NODE(term_);
    }

private:
    qi::rule<It, RetValue(), Skipper, qi::locals<char> > function_call_, expr_, funcparameter_;
    qi::rule<It, wstring(), Skipper, qi::locals<char> > string_;
    qi::rule<It, double(), Skipper> arithmeticexpression_, factor_,  term_;
};
4

1 回答 1

6

编辑 将我的早期响应移至底部

大更新

那花了一段时间。主要是因为显示的代码有奇怪的问题:

  • 一些规则包含语法错误(function_callfactor_
  • 有参考GetContainerIdGetSubstring但从未改编自凤凰城
  • 该类型CTranslationFunctions不存在,并且正在声明成员函数
  • 但是 ADAPT_FUNCTION 宏仍然引用成员函数名称,就好像它们应该在封闭的命名空间中一样(?!)

所以我基本上最终做的是重写。是的,我知道。我疯了。不过,让我带你了解一下,解释我改变的一些事情以及原因。

#define BOOST_SPIRIT_USE_PHOENIX_V3
// #define BOOST_SPIRIT_DEBUG
#include <boost/spirit/include/qi.hpp>
#include <boost/spirit/include/phoenix.hpp>
#include <boost/phoenix/function/adapt_function.hpp>
#include <boost/lexical_cast.hpp>

namespace qi    = boost::spirit::qi;
namespace phx   = boost::phoenix;

typedef boost::variant<int, double>               NumValue;
typedef boost::variant<int, double, std::wstring> GenericValue;

马上,我将数值通用值的概念分开。这是因为区分对于某些表达式(主要是算术表达式)很重要。我仍然可以GenericValue在任何地方使用,但我们稍后会看到如何NumValue使处理算术评估更简单。

struct InvalidParamEx : public virtual std::exception 
{
    const char* what() const noexcept { return "Invalid type of operand/parameter"; }
};

有你的异常类型,展示了一些好的做法。我们在期望一个数值时抛出它,但其中GenericValue包含一些不兼容的东西。如何?让我们来看看:

struct AsNumValue : boost::static_visitor<NumValue>
{
    int      operator()(int i)                 const { return i; }
    double   operator()(double d)              const { return d; }
    NumValue operator()(std::wstring const& s) const
    { 
        try { return boost::lexical_cast<int>(s); }    catch(...) {}
        try { return boost::lexical_cast<double>(s); } catch(...) {}
        throw InvalidParamEx();
    }
};

class CTranslationFunctions
{
    // helper
    NumValue static num(GenericValue const& v) { return boost::apply_visitor(AsNumValue(), v); }

那里。我为您定义了缺少的类,并立即添加了转换的助手GenericValue → NumValue。如您所见,我使用boost::lexical_cast它是因为重新发明轮子没有用。请注意,您之前的方法ConvertStringToDouble有几个大问题:

  1. 它总是会产生一个double值,而您的函数可能需要int
  2. 它将'100str1'被视为100没有警告的值
  3. 它发生在错误的时间:任何简单的字符串term都会被转换为双精度,即使它真的是一个字符串。(为什么这是相关的,当您看到修改expr_term_规则时会变得清楚。

让我们继续:

  public:
    static GenericValue GetSubString(GenericValue const& str, GenericValue position, GenericValue len);
    static GenericValue ConcatenateStrings(GenericValue const& a, GenericValue const& b);

是的,我们稍后会定义它们。现在,为算术运算函数做好准备:

#define DEFUNOP(name, expr) private: struct do_##name : boost::static_visitor<NumValue> {    \
        template <typename T1> NumValue operator()(T1 const& a) const { return expr; }       \
    }; \
    public: static NumValue name(GenericValue const& a) { auto na=num(a); return boost::apply_visitor(do_##name(), na); }
#define DEFBINOP(name, infix) struct do_##name : boost::static_visitor<NumValue> {           \
        template <typename T1, typename T2> NumValue operator()(T1 const&a, T2 const&b) const\
        { return a infix b; }                                                                \
    }; \
    public: static NumValue name(GenericValue const& a, GenericValue const& b) { auto na=num(a), nb=num(b); return boost::apply_visitor(do_##name(), na, nb); }

    // define the operators polymorphically, so `int` + `double` becomes `double`, but `int` * `int` stays `int`
    DEFBINOP(Add     , +);
    DEFBINOP(Subtruct, -);
    DEFBINOP(Multiply, *);
    DEFBINOP(Divide  , /);
    DEFUNOP (Negate  , -a);
    DEFUNOP (Sqrt    , sqrt(a));
};

Whoaaaaah那里发生了什么?好吧,评论说明了一切:

  • 您需要区分int+intdouble+int等。这称为多态评估。示例:GetSubString('100str1', 0, 2+1)永远无法工作,因为2+1需要评估为 a int(3),但您double Add(double,double)总是产生 a double
  • 我已经使用 MACRO 来消除为每个运算符创建多态函数对象的繁琐工作
  • 我让decltype检测混合情况下的结果类型
  • 这是NumValue上面的优点GenericValue:因为NumValue只能是intor double,我们知道通用 operator()实现涵盖了所有合法组合。
  • 为了确保所有参数实际上都是 NumValues,asNumeric在调用函数对象之前传递它们。

这彻底解决了您的算术运算,并有另一个好处:它消除了对 的“需要”ConvertStringToDouble,因为您可以转换到NumValue需要它的时间,即对算术运算的评估。当我们修复您的语法以支持您想要的输入表达式时,这是一件很重要的事情。

如果你已经走到这一步,你已经看到了粗糙的部分。剩下的就一帆风顺了

GenericValue CTranslationFunctions::GetSubString(GenericValue const& str, GenericValue position, GenericValue len)
{
    using boost::get;
    return get<std::wstring>(str).substr(get<int>(position), get<int>(len));
}

是的,我把它缩短了一点。

GenericValue CTranslationFunctions::ConcatenateStrings(GenericValue const& a, GenericValue const& b) 
{
    std::wostringstream woss;
    woss << a << b;
    return woss.str();
}

BOOST_PHOENIX_ADAPT_FUNCTION(GenericValue, ConcatenateStrings_, CTranslationFunctions::ConcatenateStrings, 2)
BOOST_PHOENIX_ADAPT_FUNCTION(GenericValue, GetSubString_      , CTranslationFunctions::GetSubString      , 3)

BOOST_PHOENIX_ADAPT_FUNCTION(NumValue    , Add_               , CTranslationFunctions::Add               , 2)
BOOST_PHOENIX_ADAPT_FUNCTION(NumValue    , Subtruct_          , CTranslationFunctions::Subtruct          , 2)
BOOST_PHOENIX_ADAPT_FUNCTION(NumValue    , Multiply_          , CTranslationFunctions::Multiply          , 2)
BOOST_PHOENIX_ADAPT_FUNCTION(NumValue    , Divide_            , CTranslationFunctions::Divide            , 2)
BOOST_PHOENIX_ADAPT_FUNCTION(NumValue    , Negate_            , CTranslationFunctions::Negate            , 1)
BOOST_PHOENIX_ADAPT_FUNCTION(NumValue    , Sqrt_              , CTranslationFunctions::Sqrt              , 1)

打哈欠。我们已经知道如何为 Phoenix 调整功能;让我们来看看语法定义!

// Grammar to parse map functions
template <typename It, typename Skipper = qi::space_type >
struct MapFunctionParser : qi::grammar<It, GenericValue(), Skipper>
{
    MapFunctionParser() : MapFunctionParser::base_type(expr_)
    {
        using namespace qi;

        function_call_ = 
          (no_case["GetSubString"]       > '(' > expr_ > ',' > expr_ > ',' > expr_ > ')') [ _val = GetSubString_(_1, _2, _3)   ]
        | (no_case["ConcatenateStrings"] > '(' > expr_ > ',' > expr_ > ')')               [ _val = ConcatenateStrings_(_1, _2) ]
        | (no_case["Sqrt"]               > '(' > expr_ > ')')                             [ _val = Sqrt_(_1)                   ]
        ;

        string_ = // keep it simple, silly (KISS)
            (L'"' > *~char_('"') > L'"')
          | (L"'" > *~char_("'") > L"'");  

        arithmeticexpression_ =
            term_                  [ _val = _1                  ]
        >>  *( ('+' >> term_       [ _val = Add_(_val,_1)       ])
             | ('-' >> term_       [ _val = Subtruct_(_val, _1) ])
             );                      

        term_ =                      
              factor_              [ _val = _1                  ]
            >> *( ('*' >> factor_  [ _val = Multiply_(_val, _1) ])
                | ('/' >> factor_  [ _val = Divide_(_val, _1)   ])
                );

        factor_ =
                int_               [ _val = _1          ]
            |   double_            [ _val = _1          ]
            |   string_            [ _val = _1          ]
            |   ('-' >> factor_)   [ _val = Negate_(_1) ]
            |   ('+' >> factor_)   [ _val = _1          ]
            |   function_call_     [ _val = _1          ]
            ;

        expr_ = arithmeticexpression_;

        on_error<fail> ( expr_, std::cout
            << phx::val("Error! Expecting ") << _4 << phx::val(" here: \"")
            << phx::construct<std::string>(_3, _2) << phx::val("\"\n"));

        BOOST_SPIRIT_DEBUG_NODES((function_call_) (expr_) (string_) (funcparameter_) (arithmeticexpression_) (factor_) (term_))
    }

private:
    qi::rule<It, std::wstring()> 
        string_; // NO SKIPPER (review)
    qi::rule<It, GenericValue(), Skipper> 
        function_call_, expr_, funcparameter_, // NO LOCALS (review)
        arithmeticexpression_, term_, factor_;
};

出色地。我们这里有什么。发生了什么变化?

  • 我删除qi::locals了仅在string_规则中使用过的那个,我重写了它以尊重KISS 原则
  • 我还解决了字符串中空格的问题(您的解析器将解析" oops "为与 相同"oops")。我通过从string_声明中删除船长来做到这一点。这与将整个规则包含在 中具有相同的效果qi::lexeme[]
  • 我转向Sqrtfunction_call_规则,因为,嗯,这是一个函数调用。
  • 我将函数名称调整为no_case[]不区分大小写,因为您的示例表明sqrt(9)应该可以
  • 请注意Sqrt现在采用任何表达式,而旧情况有

    | (L"Sqrt" > '(' > double_ > ')') // Wait, whaaat?
    

    是的,这永远不会解析你的第二个例子,真的:|

现在真正的操作来了。为了让sqrt(GetSubstring(....))parse,我们必须让 letfunction_call_成为 a 的可能值term_。一旦出现这种情况,我们就不必再做任何事情了,expr_因为expr_可能包含一个已经factor_包含一个term_代表 a的单个function_call_,所以

expr_    = ( *( (function_call_ ^ arithmeticexpression_)| string_ ));

蒸发成

expr_    = arithmeticexpression_;

那里发生了什么事string_?好吧,它仍然在term_,它在哪里,但是 在ConvertStringToDouble那里被删除了。除非在需要s 的算术运算的上下文中需要它们,否则字符串将很高兴地成为字符串NumValue。那时他们将被强制输入一个数字,而不是更早(如上所示)。

int main()
{
    static const MapFunctionParser<std::wstring::const_iterator> p;

    std::wstring input;
    while (std::getline(std::wcin, input))
    {
        std::wstring::const_iterator f(begin(input)), l(end(input));

        GenericValue value;
        assert(qi::phrase_parse(f, l, p, qi::space, value));

        if (f!=l)
            std::wcout << L"remaining unparsed: '" << std::wstring(f,l) << L"'\n";

        std::wcout << input << " --> " << value << std::endl;
    }
}

当我将您问题中的两行内容输入这个小测试程序时,它尽职尽责地生成了以下文本:

GetSubString('100str1', 0, 2+1) + sqrt(9) --> 103
2 + 3 * sqrt(GetSubString('100str1', 0, 2+1)) --> 32

你可以在 Coliru 上看到完整的代码(遗憾的是,编译时间太长了)。


最初这个答案从以下开始:

:我尝试通过使用置换运算符来组合以下两种语法。但它没有编译

你期望置换运算符做什么?该文件指出

置换运算符 a ^ b 以任意顺序匹配一个或多个操作数(a、b、...等)
...

在此处输入图像描述

如您所见,它会产生一个属性

 boost::variant<
      fusion::vector2<optional<RetValue>, optional<double>>,
      std::wstring>

这显然是不兼容的。现在,我假设你只想要一个/或语义,所以

 expr_    = string_ | function_call_ | arithmeticexpression_;

应该做得很好,导致boost::variant<RetValue, double, std::wstring> which 可分配给 a RetValue

现在,在跳过十几个圈以使您的示例代码编译(为什么...)之后,这里有一个修复:

于 2013-07-22T20:39:42.547 回答