2

我为我的 Boost Spirit Lexer 编写了一个语义操作,将字符串中的转义序列转换为它们所代表的内容。它运行良好,我想将其转换为 Boost Phoenix 表达式,但无法编译该表达式。

这是有效的:

// the semantic action
struct ConvertEscapes
{
    template <typename ItT, typename IdT, typename CtxT>
    void operator () (ItT& start, ItT& end, lex::pass_flags& matched, IdT& id, CtxT& ctx)
    {
        static boost::wregex escapeRgx(L"(\\\\r)|(\\\\n)|(\\\\t)|(\\\\\\\\)|(\\\\\")");
        static std::wstring escapeRepl = L"(?1\r)(?2\n)(?3\t)(?4\\\\)(?5\")";
        static std::wstring wval; // static b/c set_value doesn't seem to copy

        auto const& val = ctx.get_value();
        wval.assign(val.begin(), val.end());
        wval = boost::regex_replace(wval, 
                                    escapeRgx, 
                                    escapeRepl, 
                                    boost::match_default | boost::format_all);
        ctx.set_value(wval);
    }
};

// the token declaration
lex::token_def<std::wstring, wchar_t> literal_str;

// the token definition
literal_str  = L"\\\"([^\\\\\"]|(\\\\.))*\\\""; // string with escapes

// adding it to the lexer
this->self += literal_str [ ConvertEscapes() ];

这是我试图转换它:

this->self += literal_str 
[ 
    lex::_val = boost::regex_replace(lex::_val /* this is the place I can't figure out */,
                                     boost::wregex(L"(\\\\r)|(\\\\n)|
                                     (\\\\t)|(\\\\\\\\)|(\\\\\")"), 
                                     L"(?1\r)(?2\n)(?3\t)(?4\\\\)(?5\")", 
                                     boost::match_default | boost::format_all) 
];

Awstring不能从 构造_val_val也没有begin()or end(),到底应该怎么用?

std::wstring(lex::_start, lex::_end)也失败了,因为这些参数不被识别为迭代器。

这个问题中,我发现了phoenix::construct<std::wstring>(lex::_start, lex::_end),但这也并没有真正导致wstring.

如何获取wchar_t当前令牌的字符串或一对迭代器?

4

1 回答 1

2

我要念诵经常听到的“为什么”?

这一次,有充分的理由。

一般来说,避免语义动作:Boost Spirit:“语义动作是邪恶的”?.

Phoenix Actors 不必要地比专用函子复杂。它们有一个甜蜜点(主要是简单的赋值或内置操作)。但是,如果演员是任何非平凡的,你会看到复杂性迅速增加,不仅对人类而且对编译器也是如此。这将导致

  • 编译慢
  • 次优的发射代码
  • 更难维护源
  • 新的错误类别(例如,当表达式模板包含对本地/临时对象的引用时,Boost Proto(以及因此 Phoenix)不会阻止或发出信号。事实上,它通过假设所有模板表达式都是短暂的来鼓励它,但我离题了) .

有趣的是:Spirit X3 完全放弃了 Phoenix,尽管 Phoenix 曾经是 Spirit³ 的智囊。

新样式使用 c++14 多态 lambda,看起来 90% 像原始代码中的辅助函数对象,但内联为 lambda。

这个具体案例

不能工作。完全没有。

问题是您将惰性/延迟演员与直接调用混合在一起。那永远行不通。的类型phoenix::construct<std::wstring>(lex::_start, lex::_end)应该std::wstring. 当然。它应该是一个懒惰的演员¹,可以在以后使用它来创建一个std::wstring.

现在我们知道(以及为什么)phoenix::construct<std::wstring>(lex::_start, lex::_end)是一个演员类型,应该清楚为什么调用它是完全虚假的boost::regex_replace。你不妨说

struct implementation_defined {} bogus;
boost::regex_replace(bogus, re, fmt, boost::match_default | boost::format_all);

并想知道为什么它不会编译。

概括:

您可能应该只拥有专用的仿函数。您当然可以调整 Phoenix 所需的正则表达式函数,但它所做的只是将复杂性税转移到一些语法糖上。

我总是选择更幼稚的方法,对于经验丰富的 c++ 程序员来说,这将更容易理解,并避免走高线行为带来的陷阱²。

不过,如果您好奇,这里有一个指针:

http://www.boost.org/doc/libs/1_63_0/libs/phoenix/doc/html/phoenix/modules/function.html

Live On Coliru

#include <iostream>
#include <boost/regex.hpp>
#include <boost/phoenix.hpp>
#include <boost/spirit/include/lex_lexer.hpp>
#include <boost/spirit/include/lex_lexertl.hpp>
#include <boost/spirit/include/lex.hpp>

namespace lex = boost::spirit::lex;

BOOST_PHOENIX_ADAPT_FUNCTION(std::wstring, regex_replace_, boost::regex_replace, 4)

template <typename... T>
struct Lexer : lex::lexer<T...> {
    Lexer() {
        // the token definition
        literal_str  = L"\\\"([^\\\\\"]|(\\\\.))*\\\""; // string with escapes

        // adding it to the lexer
        this->self += literal_str [
            lex::_val = regex_replace_(lex::_val,
                 boost::wregex(L"(\\\\r)|(\\\\n)|(\\\\t)|(\\\\\\\\)|(\\\\\")"), 
                 L"(?1\r)(?2\n)(?3\t)(?4\\\\)(?5\")", 
                 boost::match_default | boost::format_all) 

        ];
    }

    // the token declaration
    lex::token_def<std::wstring, wchar_t> literal_str;
};

int main() {
    typedef lex::lexertl::token<std::wstring::const_iterator, boost::mpl::vector<std::wstring, wchar_t>> token_type;
    typedef Lexer<lex::lexertl::actor_lexer<token_type>> lexer_type;
    typedef lexer_type::iterator_type lexer_iterator_type;
}

¹ 考虑可以在以后调用的组合函数对象

² 如果您将其设计为 EDSL 以供非专家进一步配置,则平衡可能会倾斜,但是您将有额外的责任记录您的 EDSL 以及可以使用它的限制

³ 我们应该说,大脑的精神孩子吗?

于 2017-03-29T19:17:03.560 回答