EMMA Coverage Report (generated Thu Jan 24 13:37:04 CST 2013)
[all classes][org.springframework.batch.item.file.transform]

COVERAGE SUMMARY FOR SOURCE FILE [DelimitedLineTokenizer.java]

nameclass, %method, %block, %line, %
DelimitedLineTokenizer.java100% (1/1)90%  (9/10)99%  (269/273)97%  (56/58)

COVERAGE BREAKDOWN BY CLASS AND METHOD

nameclass, %method, %block, %line, %
     
class DelimitedLineTokenizer100% (1/1)90%  (9/10)99%  (269/273)97%  (56/58)
setDelimiter (char): void 0%   (0/1)0%   (0/4)0%   (0/2)
DelimitedLineTokenizer (): void 100% (1/1)100% (4/4)100% (2/2)
DelimitedLineTokenizer (char): void 100% (1/1)100% (23/23)100% (7/7)
doTokenize (String): List 100% (1/1)100% (121/121)100% (26/26)
isDelimiterCharacter (char): boolean 100% (1/1)100% (8/8)100% (1/1)
isQuoteCharacter (char): boolean 100% (1/1)100% (8/8)100% (1/1)
isQuoted (String): boolean 100% (1/1)100% (14/14)100% (3/3)
maybeStripQuotes (String): String 100% (1/1)100% (49/49)100% (9/9)
setIncludedFields (int []): void 100% (1/1)100% (28/28)100% (4/4)
setQuoteCharacter (char): void 100% (1/1)100% (14/14)100% (3/3)

1/*
2 * Copyright 2006-2007 the original author or authors.
3 *
4 * Licensed under the Apache License, Version 2.0 (the "License");
5 * you may not use this file except in compliance with the License.
6 * You may obtain a copy of the License at
7 *
8 *      http://www.apache.org/licenses/LICENSE-2.0
9 *
10 * Unless required by applicable law or agreed to in writing, software
11 * distributed under the License is distributed on an "AS IS" BASIS,
12 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13 * See the License for the specific language governing permissions and
14 * limitations under the License.
15 */
16 
17package org.springframework.batch.item.file.transform;
18 
19import java.util.ArrayList;
20import java.util.Collection;
21import java.util.HashSet;
22import java.util.List;
23 
24import org.springframework.util.Assert;
25import org.springframework.util.StringUtils;
26 
27/**
28 * A {@link LineTokenizer} implementation that splits the input String on a
29 * configurable delimiter. This implementation also supports the use of an
30 * escape character to escape delimiters and line endings.
31 * 
32 * @author Rob Harrop
33 * @author Dave Syer
34 * 
35 */
36public class DelimitedLineTokenizer extends AbstractLineTokenizer {
37        /**
38         * Convenient constant for the common case of a tab delimiter.
39         */
40        public static final char DELIMITER_TAB = '\t';
41 
42        /**
43         * Convenient constant for the common case of a comma delimiter.
44         */
45        public static final char DELIMITER_COMMA = ',';
46 
47        /**
48         * Convenient constant for the common case of a " character used to escape
49         * delimiters or line endings.
50         */
51        public static final char DEFAULT_QUOTE_CHARACTER = '"';
52 
53        // the delimiter character used when reading input.
54        private char delimiter;
55 
56        private char quoteCharacter = DEFAULT_QUOTE_CHARACTER;
57 
58        private String quoteString;
59 
60        private Collection<Integer> includedFields = null;
61 
62        /**
63         * Create a new instance of the {@link DelimitedLineTokenizer} class for the
64         * common case where the delimiter is a {@link #DELIMITER_COMMA comma}.
65         * 
66         * @see #DelimitedLineTokenizer(char)
67         * @see #DELIMITER_COMMA
68         */
69        public DelimitedLineTokenizer() {
70                this(DELIMITER_COMMA);
71        }
72 
73        /**
74         * Create a new instance of the {@link DelimitedLineTokenizer} class.
75         * 
76         * @param delimiter the desired delimiter
77         */
78        public DelimitedLineTokenizer(char delimiter) {
79                Assert.state(delimiter != DEFAULT_QUOTE_CHARACTER, "[" + DEFAULT_QUOTE_CHARACTER
80                                + "] is not allowed as delimiter for tokenizers.");
81 
82                this.delimiter = delimiter;
83                setQuoteCharacter(DEFAULT_QUOTE_CHARACTER);
84        }
85 
86        /**
87         * Setter for the delimiter character.
88         * 
89         * @param delimiter
90         */
91        public void setDelimiter(char delimiter) {
92                this.delimiter = delimiter;
93        }
94 
95        /**
96         * The fields to include in the output by position (starting at 0). By
97         * default all fields are included, but this property can be set to pick out
98         * only a few fields from a larger set. Note that if field names are
99         * provided, their number must match the number of included fields.
100         * 
101         * @param includedFields the included fields to set
102         */
103        public void setIncludedFields(int[] includedFields) {
104                this.includedFields = new HashSet<Integer>();
105                for (int i : includedFields) {
106                        this.includedFields.add(i);
107                }
108        }
109 
110        /**
111         * Public setter for the quoteCharacter. The quote character can be used to
112         * extend a field across line endings or to enclose a String which contains
113         * the delimiter. Inside a quoted token the quote character can be used to
114         * escape itself, thus "a""b""c" is tokenized to a"b"c.
115         * 
116         * @param quoteCharacter the quoteCharacter to set
117         * 
118         * @see #DEFAULT_QUOTE_CHARACTER
119         */
120        public final void setQuoteCharacter(char quoteCharacter) {
121                this.quoteCharacter = quoteCharacter;
122                this.quoteString = "" + quoteCharacter;
123        }
124 
125        /**
126         * Yields the tokens resulting from the splitting of the supplied
127         * <code>line</code>.
128         * 
129         * @param line the line to be tokenized
130         * 
131         * @return the resulting tokens
132         */
133        protected List<String> doTokenize(String line) {
134 
135                List<String> tokens = new ArrayList<String>();
136 
137                // line is never null in current implementation
138                // line is checked in parent: AbstractLineTokenizer.tokenize()
139                char[] chars = line.toCharArray();
140                boolean inQuoted = false;
141                int lastCut = 0;
142                int length = chars.length;
143                int fieldCount = 0;
144 
145                for (int i = 0; i < length; i++) {
146 
147                        char currentChar = chars[i];
148                        boolean isEnd = (i == (length - 1));
149 
150                        if ((isDelimiterCharacter(currentChar) && !inQuoted) || isEnd) {
151                                int endPosition = (isEnd ? (length - lastCut) : (i - lastCut));
152 
153                                if (isEnd && isDelimiterCharacter(currentChar)) {
154                                        endPosition--;
155                                }
156 
157                                if (includedFields == null || includedFields.contains(fieldCount)) {
158                                        String value = maybeStripQuotes(new String(chars, lastCut, endPosition));
159                                        tokens.add(value);
160                                }
161 
162                                fieldCount++;
163 
164                                if (isEnd && (isDelimiterCharacter(currentChar))) {
165                                        if (includedFields == null || includedFields.contains(fieldCount)) {
166                                                tokens.add("");
167                                        }
168                                        fieldCount++;
169                                }
170 
171                                lastCut = i + 1;
172                        }
173                        else if (isQuoteCharacter(currentChar)) {
174                                inQuoted = !inQuoted;
175                        }
176 
177                }
178 
179                return tokens;
180        }
181 
182        /**
183         * If the string is quoted strip (possibly with whitespace outside the
184         * quotes (which will be stripped), replace escaped quotes inside the
185         * string. Quotes are escaped with double instances of the quote character.
186         * 
187         * @param string
188         * @return the same string but stripped and unescaped if necessary
189         */
190        private String maybeStripQuotes(String string) {
191                String value = string.trim();
192                if (isQuoted(value)) {
193                        value = StringUtils.replace(value, "" + quoteCharacter + quoteCharacter, "" + quoteCharacter);
194                        int endLength = value.length() - 1;
195                        // used to deal with empty quoted values
196                        if (endLength == 0) {
197                                endLength = 1;
198                        }
199                        value = value.substring(1, endLength);
200                        return value;
201                }
202                return string;
203        }
204 
205        /**
206         * Is this string surrounded by quote characters?
207         * 
208         * @param value
209         * @return true if the value starts and ends with the
210         * {@link #quoteCharacter}
211         */
212        private boolean isQuoted(String value) {
213                if (value.startsWith(quoteString) && value.endsWith(quoteString)) {
214                        return true;
215                }
216                return false;
217        }
218 
219        /**
220         * Is the supplied character the delimiter character?
221         * 
222         * @param c the character to be checked
223         * @return <code>true</code> if the supplied character is the delimiter
224         * character
225         * @see DelimitedLineTokenizer#DelimitedLineTokenizer(char)
226         */
227        private boolean isDelimiterCharacter(char c) {
228                return c == this.delimiter;
229        }
230 
231        /**
232         * Is the supplied character a quote character?
233         * 
234         * @param c the character to be checked
235         * @return <code>true</code> if the supplied character is an quote character
236         * @see #setQuoteCharacter(char)
237         */
238        protected boolean isQuoteCharacter(char c) {
239                return c == quoteCharacter;
240        }
241}

[all classes][org.springframework.batch.item.file.transform]
EMMA 2.0.5312 (C) Vladimir Roubtsov