Muchas veces, cuando estás analizando texto, necesitas dividir cadenas en un carácter de coma (o nuevas líneas, pestañas, etc.), pero ¿qué pasa si necesitas usar una coma en tu cadena y no dividirla? Un ejemplo de esto podría ser un gran número. Entonces, tal vez tengamos una cadena como esta:
age: 28, favorite number: 26, salary: $1,234,108
Dividir por comas en esto daría como resultado:
Te puede interesar:Configurar un clúster de Node.jsage: 28
favorite number: 26
salary: $1
234
108
Cerca, pero no del todo.
Para propósitos de formato, muchos números tienen comas como esta, por lo que realmente no podemos evitarlo.
Te puede interesar:¿Qué es Arduino?Una forma de resolver este problema es poner comillas alrededor de la cadena que no debe dividirse. Entonces, nuestro ejemplo anterior se vería así:
age: 28, favorite number: 26, "salary: $1,234,108"
Entonces, ahora para dividir esto, necesitaremos crear una cadena de expresiones regulares que diga «dividir en todos los caracteres de coma a menos que esté entre comillas».
Te puede interesar:Cómo instalar Node.js en UbuntuUsando Java y Regex, esto debería funcionar:
String[] strArray = text.split(",(?=([^"]*"[^"]*")*[^"]*$)");
Usando la cadena de expresiones regulares anterior, así es como dividiríamos una cadena usando Java:
Te puede interesar:Cómo escribir middleware Express.jsString input = "age: 28, favorite number: 26, "salary: $1,234,108"";
String[] splits = input.split(",(?=([^"]*"[^"]*")*[^"]*$)");
for (int i = 0; i < splits.length; i++) {
System.out.println(splits[i].trim());
}
// Output:
// age: 28
// favorite number: 26
// salary: $1,234,108
Esta cadena de expresiones regulares usa lo que se llama una «búsqueda anticipada positiva» para verificar las comillas sin hacer coincidirlas.
Esta es una característica realmente poderosa en regex, pero puede ser difícil de implementar.
Te puede interesar:Adición de autenticación a Express con PassportPara practicar, intente mirar la expresión regular que le dimos y vea si puede modificarla para dividirla en un carácter diferente, como un punto y coma (;
). Si le resultó fácil, intente modificarlo para que tenga dos comillas en cada lado de la cadena.
¿Tiene una cadena de expresiones regulares más simple o algunos consejos para crearlas? ¡Háznoslo saber en los comentarios!
Te puede interesar:Error de NPM «no se pudo recuperar del registro» al instalar el módulo