Tuve que clasificar y uniq (cree un sistema único de secuencias) una lista grande con las porciones de duplicado. Mis opciones eran escribirla en Java o transferir el cygwin y funcionar: archivo del gato | clase | uniq > resultado

La transferencia directa de Cygwin nunca trabaja para mí. Después de que pase las porciones de tiempo que seleccionan una lista jugosa de utilidades, falla siempre en alguna parte en el proceso de la transferencia directa. Tuve gusto de ella mucho mejor cuando era una sola transferencia directa.

Opté por la ruta de Java naturalmente. Después de todos era apenas una sola línea de código realmente.

para (artículo de la secuencia: getFileAsSet (args [0])) System.out.println (artículo);

Usted se está preguntando obviamente adonde las puñetas yo consiguen el getFileAsSet. Es apenas uno de las muchas utilidades reutilizables de Java que creé para hacer mi trabajo más fácil. La parte crucial del código para esta utilidad es:

TreeSet fijó = nuevo TreeSet ();
mientras que ((temp = reader.readLine ()) ¡! = falta de información) {
            temp = temp.trim (); Espacios del odio de //; Su kilometraje puede variar
            si (temp.length () > 0) {
                	set.add (temp);
            }
}

La belleza de este código es que TreeSet es una puesta en práctica de SortedSet. El adición al sistema asegura automáticamente la eliminación de duplicados tan bien como clasificando. Toda lo que tuve que hacer era apenas impresión el resultado.