Lorsque l'on souhaite lire un fichier de configuration au format CSV ou ini, il n'est pas nécessaire d'utiliser de grosses librairies pour parser les fichiers. Voici 2 exemples de lecture rapide d'un string séparé par un délimiteur.
Méthode avec la fonction split()
Dans cet exemple, l'ensemble de la chaine est stocké dans un buffer, puis séparé en fonction d'un délimiteur ';'. Le résultat est un tableau de string d'un taille de 5 blocs.
/**
* Découper une chaine avec split()
* @author fobec.com 2010
*/
public class StringSpliter {
static public void main(String args[]) throws Exception {
final String txtCSV = "Marcel;duchemin;5,rue de la gare;75000;PARIS";
String[] n = txtCSV.split(";");
if (n.length == 0) {
System.err.print("Delimiteur non trouvée");
} else {
System.out.println(txtCSV);
System.out.println("est composé des sous-chaines:");
for (int i = 0; i < n.length; i++) {
System.out.println("- "+n[i]);
}
}
}
}
Les 2 premières lignes correspondent à des logs, à savoir quelle string a été traité. Les 5 derniers blocs sont le contenu du tableau de string.
Marcel;duchemin;5,rue de la gare;75000;PARIS
est composé des sous-chaines:
- Marcel
- duchemin
- 5,rue de la gare
- 75000
- PARIS
est composé des sous-chaines:
- Marcel
- duchemin
- 5,rue de la gare
- 75000
- PARIS
Méthode avec la fonction StringTokenizer()
Dans cet exemple, l'objet StringTokenizer est placé sur la chaine à analyser. A chaque fois qu'un délimiteur est trouvé, la fonction renvoie une copie du string se trouvant entre les 2 délimiteurs. Son fonctionnement ressemble à une analyse évènementielle comme le fera SAX pour le format XML.
import java.util.StringTokenizer;
/**
* Découper une chaine avec StringTokenizer()
* @author fobec.com 2010
*/
public class StringSpliter {
static public void main(String args[]) throws Exception {
final String txtNUM = "zero|un|deux|trois";
StringTokenizer stringTokenizer = new StringTokenizer(txtNUM, "|");
System.out.println(txtNUM);
System.out.println("est composé des sous-chaines:");
while (stringTokenizer.hasMoreTokens()) {
System.out.println("- " + stringTokenizer.nextToken());
}
}
}
Les 2 premières lignes sont des logs, ensuite les 4 lignes suivantes sont les sous-chaines renvoyées par la fonction StringTokenizer().
zero|un|deux|trois
est composé des sous-chaines:
- zero
- un
- deux
- trois
est composé des sous-chaines:
- zero
- un
- deux
- trois
La différence entre les deux fonctions est le type de délimiteur. Alors que StringTokenizer n'accepte que des caractères, il est possible d'utiliser un regex avec la fonction Split().