我有一个自定义令牌过滤器设置来解析关键字,例如
oracle,java,sybase,vb.net etc.
进入
oracle java sybase vb.net
并且工作正常,但是其中一个测试文档具有以下文本
,oracle java,sybase,unix
我正在尝试从
,oracle
使用下面的代码
public override bool IncrementToken()
{
if (!input.IncrementToken())
return false;
char[] buffer = termAtt.TermBuffer();
int bufferLength = termAtt.TermLength();
...
else if (bufferLength > 1 && buffer[0] == ',')
{
// strip the starting , off !
offsetAtt.SetOffset(offsetAtt.StartOffset + 1, offsetAtt.EndOffset);
// where offsetAtt = AddAttribute<IOffsetAttribute>();
}
...
return true;
}
但是,这不会删除逗号
关于如何完成这项工作的任何帮助?
谢谢