
StringTokenizer
StringTokenizer是java中object类的一个子类,继承自 Enumeration接口。此类允许一个应用程式进入一个令牌(tokens),而且StringTokenizer类用起来比StreamTokenizer 类更加简单。StringTokenizer不会区分对象、函式、数组、或引证字元串。
StringTokenizer
StringTokenizer的实例有两种方式,这两种方式取决于returnDelims 标记位的值是true或false。
true
标记为true,那些分隔设定字元本身即为标记。因此标记要幺是一个分隔设定字元,要幺是那些连续字元(不是分隔设定)的最大序列。
false
标记为false,则分隔设定字元用来分隔标记。标记是连续字元(不是分隔设定)的最大序列。
StringTokenizer类的对象在内部已经标识化的字元串中维持了当前位置。一些操作使得在现有位置上的字元串提前得到处理。 一个令牌的值是由获得其曾经创建StringTokenizer类对象的字串所返回的。
具体函式:
StreamTokenizer定义了几种基本的常量用于标识解析过程:TT_EOF(流结尾)、TT_EOL(行结尾)、
TT_NUMBER(数字元号, 0 1 2 3 4 5 6 7 8 9 . -都属于数字语法)、TT_WORD(一个单词)。
其含有的基本方法介绍一下:
commenChar(int ch) - 指定某个字元为注释字元,此字元之后直到行结尾都被stream tokenizer忽略。
eolIsSignificant(boolean flag) - 决定一个行结束符是否被当作一个基本的符号处理,如果是true,则被当作一个基本符号,不当作普通的分隔设定,如果是false,则保持原义,即当作普通的分隔设定。
lineno() - 返回当前流所在的行号。
lowerCaseMode(boolean flag) - 决定是否读取一个单词时是否转变成小写。
nextToken() - 分析下一个。
ordinaryChar(int ch) - 指定字元在这个tokenizer中保持原义,即只会把当前字元认为普通的字元,不会有其他的语义。
ordinaryChars(int low, int hi) - 指定範围内的字元保持语义,同上
parseNumbers() - 当stream tokenizer遭遇到一个单词为双精度的浮点数时,会把它当作一个数字,而不是一个单词。
pushBack() - 回退,会引起下一个nextToken方法返回当前值。
quoteChar(int ch) - 指定当前字元为当前tokenizer中的分隔设定,在两个符号之间被当作一个字元串解析。
resetSyntax() - 重置语法表使所有的字元都被认为是“ordinary”。
slashSlashComments(boolean flag) - 如果为true,则/*与*/之间的都被认为是注释,反之,不是。
slashStartComments(boolean flag) - 如果为true,则//之后到行结尾的所有都被认为是注释,反之,不是。
whitespaceChars(int low, int hi) - 字元low与hi之间的所有字元都被当作为空格符,即被认识为tokenzier的分隔设定。
wordChars(int low, int hi) - 字元low与hi之间的所有字元都被当作为单词的要素。
一个单词是由一个单词要素后面跟着0个或者更多个单词要素或者数字要素。
TT_NUMBER(数字元号, 0 1 2 3 4 5 6 7 8 9 . -都属于数字语法)、TT_WORD(一个单词)。
其含有的基本方法介绍一下:
commenChar(int ch) - 指定某个字元为注释字元,此字元之后直到行结尾都被stream tokenizer忽略。
eolIsSignificant(boolean flag) - 决定一个行结束符是否被当作一个基本的符号处理,如果是true,则被当作一个基本符号,不当作普通的分隔设定,如果是false,则保持原义,即当作普通的分隔设定。
lineno() - 返回当前流所在的行号。
lowerCaseMode(boolean flag) - 决定是否读取一个单词时是否转变成小写。
nextToken() - 分析下一个。
ordinaryChar(int ch) - 指定字元在这个tokenizer中保持原义,即只会把当前字元认为普通的字元,不会有其他的语义。
ordinaryChars(int low, int hi) - 指定範围内的字元保持语义,同上
parseNumbers() - 当stream tokenizer遭遇到一个单词为双精度的浮点数时,会把它当作一个数字,而不是一个单词。
pushBack() - 回退,会引起下一个nextToken方法返回当前值。
quoteChar(int ch) - 指定当前字元为当前tokenizer中的分隔设定,在两个符号之间被当作一个字元串解析。
resetSyntax() - 重置语法表使所有的字元都被认为是“ordinary”。
slashSlashComments(boolean flag) - 如果为true,则/*与*/之间的都被认为是注释,反之,不是。
slashStartComments(boolean flag) - 如果为true,则//之后到行结尾的所有都被认为是注释,反之,不是。
whitespaceChars(int low, int hi) - 字元low与hi之间的所有字元都被当作为空格符,即被认识为tokenzier的分隔设定。
wordChars(int low, int hi) - 字元low与hi之间的所有字元都被当作为单词的要素。
一个单词是由一个单词要素后面跟着0个或者更多个单词要素或者数字要素。
实例
接下来是运用此类的一个实例。 代码:
StringTokenizer st = new StringTokenizer("this is a test");
while (st.hasMoreTokens())
{
System.out.println(st.nextToken());
}
列印出来之后是:
this
is
a
test
接下来的实例阐明了String.split方法如何将一个字元串分解成其基本令牌的。 String[] result = "this is a test".split("\\s");
for (int x=0; x<result.length; x++)
System.out.println(result[x]);
列印出来之后是:
this
is
a
test
StringTokenizer 是出于兼容性的原因而被保留的遗留类(虽然在新代码中并不鼓励使用它)。建议所有寻求此功能的人使用 String 的 split 方法或 java.util.regex 包