2

我有一个 Qi 语法定义,用于解析输入。后来我有一个 Karma 生成器,它以类似于输入的方式输出。

这可能吗?似乎解析器语法可以自动转换为生成器语法(??)。

#include <boost/config/warning_disable.hpp>
#include <boost/spirit/include/qi.hpp>
#include <boost/spirit/include/karma.hpp>
#include <iostream>
int main(){

    //test input
    std::string s = "Xx     1.233    pseudo";

    //input variables
    std::string element;
    double mass;
    std::string pseudo;

    auto GRAMMAR = 
            boost::spirit::qi::lexeme[+(boost::spirit::qi::char_ - ' ' - '\n')] 
            >> boost::spirit::qi::double_
            >> boost::spirit::qi::lexeme[+(boost::spirit::qi::char_ - ' ' - '\n')];

    bool r = boost::spirit::qi::phrase_parse(
            s.begin(), s.end(), 
            GRAMMAR, 
            boost::spirit::qi::space, element, mass, pseudo
    );

    std::cout << boost::spirit::karma::format(
            GRAMMAR ??? is it possible? 
            , 
            element,
            mass,
            pseudo
    );
}
4

1 回答 1

5

遗憾的是,不可能以一般方式实现您想要的(或者至少我不知道如何),但如果您愿意只使用 Spirit.Qi 的有限子集,则以下方法可以工作。

首先要知道的是,当您使用以下内容时:

int_ >> double_

您只有一个 Boost.Proto 表达式,它描述了几个终端以及它们之间的关系。该表达式本身并不“知道”任何关于如何解析一个 int 和一个 double 的内容。每当您使用parse/phrase_parse或将这些 Proto 表达式之一分配给ruleSpirit 时,都会为域(Qi 或 Karma)“编译”该表达式并创建执行实际工作的解析器/生成器。

在这里你可以看到一个小例子,它显示了 Proto 和编译好的 Qi 表达式的确切类型:

Raw proto type:
boost::proto::exprns_::expr<boost::proto::tagns_::tag::shift_right, boost::proto::argsns_::list2<boost::spirit::terminal<boost::spirit::tag::int_> const&, boost::spirit::terminal<boost::spirit::tag::double_> const&>, 2l>

"Pretty" proto type:
shift_right(
    terminal(boost::spirit::tag::int_)
  , terminal(boost::spirit::tag::double_)
)

Compiled Qi type:
boost::spirit::qi::sequence<boost::fusion::cons<boost::spirit::qi::any_int_parser<int, 10u, 1u, -1>, boost::fusion::cons<boost::spirit::qi::any_real_parser<double, boost::spirit::qi::real_policies<double> >, boost::fusion::nil_> > >

只要您可以访问原始表达式,您就可以使用 Proto 转换/语法将其转换为合适的 Karma 表达式。

在下面的示例中,我使用了以下转换:

Qi          |Karma          |Reason  
------------|---------------|------  
lexeme[expr]|verbatim[expr] | lexeme does not exist in Karma
omit[expr]  |no_delimit[eps]| omit consumes an attribute in Karma
a >> b      |a << b         |
a > b       |a << b         | < does not exist in Karma
a - b       |a              | - does not exist in Karma

为了实现这种转换,您可以使用boost::proto::or_类似于以下内容的方法:

struct Grammar : proto::or_<
                     proto::when<Matcher1,Transform1>,
                     proto::when<Matcher2,Transform2>,
                     Matcher3,
                     Matcher4
>{};

我将尝试解释这是如何工作的。
MatcherN在下面的示例中可以是:

  • proto::terminal<boost::spirit::tag::omit>: 只匹配那个特定的终端。
  • proto::terminal<proto::_>: 匹配之前没有特别匹配的任何终端。
  • proto::subscript<proto::terminal<boost::spirit::tag::omit>,proto::_>: 匹配可以是任何东西的omit[expr]地方。expr
  • proto::shift_right<ToKarma,ToKarma>: 匹配expr1 >> expr2whereexpr1并且expr2必须递归地符合ToKarma语法。
  • proto::nary_expr<proto::_,proto::vararg<ToKarma> >a(b,c,d,e): 匹配表达式的每个元素都符合 ToKarma 语法的任何 n 元(一元、二进制或实际上的 n 元,如函数调用)。

此示例中的所有TransformN内容都是表达式构建器,以下是一些解释:

  • _make_terminal(boost::spirit::tag::lexeme()): 构建一个proto::terminal<boost::spirit::tag::lexeme>(注意必须()在标签之后添加,如果你忘记它们,你会得到一个可怕的错误)。
  • _make_subscript(_make_terminal(tag::no_delimit()), _make_terminal(tag::eps())): 构建一个proto::subscript<proto::terminal<tag::no_delimit>, proto::terminal<tag::eps> >,或等效于no_delimit[eps].
  • _make_shift_left(ToKarma(proto::_left), ToKarma(proto::_right)):proto::_left表示取原始表达式的 lhs。ToKarma(proto::_left)意味着递归地将 ToKarma 语法/转换应用于原始表达式的 lhs。整体_make_shift_left基本建成transformed_lhs << transformed_rhs

AMatcherN本身(不是 inside proto::when)是构建相同类型的表达式的简写,使用递归地将变换应用于原始元素的结果作为元素。


完整示例(在 WandBox 上运行)

#include <iostream>
#include <string>
#include <tuple>
#include <boost/config/warning_disable.hpp>
#include <boost/spirit/include/qi.hpp>
#include <boost/spirit/include/karma.hpp>
#include <boost/fusion/include/std_tuple.hpp>

namespace proto= boost::proto;


struct ToKarma: proto::or_<
    //translation of directives
    proto::when<proto::terminal<boost::spirit::tag::lexeme>, proto::_make_terminal(boost::spirit::tag::verbatim())>, //lexeme -> verbatim
    proto::when<
        proto::subscript<proto::terminal<boost::spirit::tag::omit>,proto::_>, //omit[expr] -> no_delimit[eps]
        proto::_make_subscript(proto::_make_terminal(boost::spirit::tag::no_delimit()),proto::_make_terminal(boost::spirit::tag::eps()))
    >,

    proto::terminal<proto::_>, //if the expression is any other terminal leave it as is

    //translation of operators
    proto::when<proto::shift_right<ToKarma,ToKarma>, proto::_make_shift_left(ToKarma(proto::_left),ToKarma(proto::_right)) >, //changes '>>' into '<<'
    proto::when<proto::greater<ToKarma,ToKarma>, proto::_make_shift_left(ToKarma(proto::_left),ToKarma(proto::_right)) >, //changes '>' into '<<'
    proto::when<proto::minus<ToKarma,ToKarma>, ToKarma(proto::_left)>, //changes 'expr-whatever' into 'expr'

    proto::nary_expr<proto::_,proto::vararg<ToKarma> > //if it's anything else leave it unchanged and recurse into the expression tree
>{};


template <typename ... Attr, typename Parser>
void test(const std::string& input, const Parser& parser)
{
    std::cout << "Original: \"" << input << "\"\n";

    std::tuple<Attr...> attr;

    std::string::const_iterator iter = input.begin(), end = input.end();

    bool result = boost::spirit::qi::phrase_parse(iter,end,parser,boost::spirit::qi::space,attr);

    if(result && iter==end)
    {
        ToKarma to_karma;
        std::cout << "Generated: \"" << boost::spirit::karma::format_delimited(to_karma(parser), boost::spirit::karma::space, attr) << '"' << std::endl;
    }
    else
    {
        std::cout << "Parsing failed. Unparsed: ->" << std::string(iter,end) << "<-" << std::endl;
    }
}



int main(){
    using namespace boost::spirit::qi;

    test<std::string,double,std::string >("Xx     1.233    pseudo", lexeme[+(char_-' '-'\n')] >> double_ >> lexeme[+(char_-' '-'\n')]);
    test<int,double>("foo 1 2.5", omit[lexeme[+alpha]] > int_ > double_);
}

PS:
绝对行不通的事情:

  • qi::rule
  • qi::grammar
  • qi::symbols

Karma 中不存在的东西:

  • qi::attr
  • qi::matches
  • qi::hold
  • 排列解析器^
  • 顺序或解析器||

Karma 中具有不同语义的事物:

  • qi::skip
  • 与谓词解析器&
  • 非谓词解析器!
于 2016-09-16T17:17:04.937 回答