我需要使用 JFlex 创建一个解析器,以从输入文件中提取所有单词,包括带有重音字符的单词,例如 á、é、í、ó、ú、ñ、...
我的问题是,即使将所有文件设置为 UTF8 编码和 %unicode 标记,我也无法让它识别这些字符。
.lex 文件是这样的:
import java_cup.runtime.*;
%%
%class ParserLex
%unicode
%public
%final
%cup
%init{
%init}
%{
    private Symbol sym(int type) {
        return sym(type, yytext());
    }
    private Symbol sym(int type, Object value) {
        return new Symbol(type, yyline, yycolumn, value);
    }
%}
Token       = [áéíóú]
ANY         = .
%%
{Token}
    { System.out.println(yytext()); }
{ANY}
    {   }
我的测试课是这样的:
class ParserTest {
    public static void main(String[] args) throws IOException {
        InputStreamReader reader = new InputStreamReader(new FileInputStream(args[0]), "UTF8");
        ParserLex parser = new ParserLex(reader);
        for (Symbol sym = parser.next_token(); sym.sym != 0; sym = parser.next_token()) {
        }
        reader.close();
    }
}
关于这个问题的任何想法或建议?