我想使用 StreamTokenizer 从 java 文件中提取名称。我已将空格设置为逗号
inputTokenizer.whitespaceChars(',', ',');
但是,当我解析输入文件中的名称(名字与姓氏之间有空格)时,标记器将名字视为一个标记,将姓氏视为另一个标记。我希望他们两个都被视为同一个令牌,我该怎么做?
例如,“Billy Jean”被视为两个单独的令牌(Billy - token1 Jean - token2),我希望它被视为一个。
谢谢
我想使用 StreamTokenizer 从 java 文件中提取名称。我已将空格设置为逗号
inputTokenizer.whitespaceChars(',', ',');
但是,当我解析输入文件中的名称(名字与姓氏之间有空格)时,标记器将名字视为一个标记,将姓氏视为另一个标记。我希望他们两个都被视为同一个令牌,我该怎么做?
例如,“Billy Jean”被视为两个单独的令牌(Billy - token1 Jean - token2),我希望它被视为一个。
谢谢
您的问题是(显然)默认情况下将空格视为分隔符(不足为奇);您已将逗号设置为空白字符,因此逗号和空格都被视为空白字符。下面的程序做我认为你想要的;注意将空格设置为“wordChars”的行。
import java.io.IOException;
import java.io.StreamTokenizer;
import java.io.StringReader;
public class TokenTeaser
{
public static void main(String[] args)
{
try
{
String testString = "one two, three, four five";
StringReader sr = new StringReader(testString);
StreamTokenizer st = new StreamTokenizer(sr);
st.whitespaceChars(',', ',');
st.wordChars(' ', ' ');
int currentToken = st.nextToken();
while (currentToken != StreamTokenizer.TT_EOF)
{
System.out.println(st.sval);
currentToken = st.nextToken();
}
}
catch (IOException e)
{
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}