🎺 ❣️ 🕧 Clasificación multiproceso utilizando un grupo de subprocesos en Java 🧙🏾 🍝 🧒🏼

Esta publicación explicará cómo implementar la ordenación en Java usando ExecutorService. La esencia general de la clasificación es la siguiente:

La matriz se divide en partes.
Cada parte de la matriz está ordenada.
Pasamos por las matrices ordenadas, las fusionamos en una

Aquí se aplican las ideas de clasificación de fusión, pero la matriz se divide solo en dos partes (no se utiliza la recursión).

Puede usar la siguiente función para fusionar:

public static String[] merge( String[] leftPart, String[] rightPart ) {
        int cursorLeft = 0, cursorRight = 0, counter = 0;
        String[] merged = new String[leftPart.length + rightPart.length];
        while ( cursorLeft < leftPart.length && cursorRight < rightPart.length ) {
            if (leftPart[cursorLeft].compareTo(rightPart[cursorRight] ) < 0 ) {
                merged[counter] = leftPart[cursorLeft];
                cursorLeft+=1;
            } else {
                merged[counter] = rightPart[cursorRight];
                cursorRight+=1;
            }
            counter++;
        }
        if ( cursorLeft < leftPart.length ) {
            System.arraycopy( leftPart, cursorLeft, merged, counter, merged.length - counter );
        }
        if ( cursorRight < rightPart.length ) {
            System.arraycopy( rightPart, cursorRight, merged, counter, merged.length - counter );
        }
        return merged;
    }

Fusionar código de función tomado de aquí .

La esencia de la fusión es esta: al principio, los punteros están en el primer elemento para ambas matrices. A continuación, se comparan los valores de los elementos correspondientes a las posiciones del puntero y el puntero para el elemento más pequeño se desplaza al siguiente elemento, el elemento mismo se agrega a la matriz resultante. El ciclo continúa hasta llegar al final de una de las matrices, luego el resto de la segunda matriz se copiará al final de la matriz resultante. Por lo tanto, la salida es una matriz ordenada.

También se creó una clase para la ordenación multiproceso; se creó un método de ejecución, que se ejecuta cuando el método start () se aplica a un objeto de tipo Thread. En nuestro caso, ejecutorService será responsable de esto. Aquí está el código de la clase de fusión, cuyos objetos se crearán para implementar la ordenación multiproceso:


public class Merger implements Runnable{
    private String[] unsorted, sorted;
    public Merger(String[] unsorted) {
        this.unsorted = unsorted;
    }

    public void run() {
        int middle;
        String[] left, right;
        // array is sorted
        if ( unsorted.length <= 1 ) {
            sorted = unsorted;
        } else {
            //
            middle = unsorted.length / 2;
            left = new String[middle];
            right = new String[unsorted.length - middle];
            //split array on two
            System.arraycopy(unsorted, 0, left, 0, middle);
            System.arraycopy(unsorted, middle, right, 0, unsorted.length - middle);
            SimpleMerger leftSort = new SimpleMerger(left);
            SimpleMerger rightSort = new SimpleMerger(right);
            leftSort.sort();
            rightSort.sort();
            //sort and merge
            sorted = SimpleMerger.merge(leftSort.getSorted(), rightSort.getSorted());
         }
        }
    public String[] getSorted() {
        return sorted;
    }
}

Para ordenar las partes de la matriz, se utilizó la ordenación Java incorporada. El siguiente es el código para ordenar usando un grupo de subprocesos. Las mediciones de tiempo se llevan a cabo para versiones multihilo y convencionales (spoiler: multihilo da aceleración solo en una gran cantidad de datos):


public static void main(String[] args) throws Exception {
        int arrSize = 1_000_000_0;
        String[] unsorted = new String[arrSize];
        Random randomizer = new Random();

        for ( int i = 0; i < arrSize; i++ ) {
            unsorted[i] = Integer.toString(randomizer.nextInt( 100_000_0 ));
        }

        List<Future> futures = new ArrayList<>();
        int processorCount = Runtime.getRuntime().availableProcessors();
        int batchSize = arrSize/processorCount;
        long startTime = System.currentTimeMillis();
        // create ExecutorService
        final ExecutorService executorService = Executors
                .newFixedThreadPool(Runtime.getRuntime().availableProcessors());
        ArrayList<Merger> mergers = new ArrayList<>();
        for (int i = 0; i < processorCount; i++) {
            String[] part = new String[batchSize];
            System.arraycopy( unsorted, i*batchSize, part, 0, batchSize );
            // create merger
            Merger merger = new Merger(part);

            futures.add(executorService.submit(merger));
            //add merger to list to get result in future
            mergers.add(merger);
        }
        for (Future<Double> future : futures) {
            future.get();
        }
        executorService.shutdown();
        int j = 0;
        // array to get result
        String[] mergered = new String[arrSize];
        // sequential merge of all part of array
        for (Merger merger:mergers){
            if (j == 0) {
                mergered = merger.getSorted();
                j+=1;
            }
        else{
                String[] part = merger.getSorted();
                mergered = SimpleMerger.merge( mergered, part);
            }
   }
        long timeSpent = System.currentTimeMillis() - startTime;
        System.out.println("Program execution time is " + timeSpent + " milliseconds");
        if (arrSize < 100) {System.out.print(Arrays.toString(mergered));}
        startTime = System.currentTimeMillis();
        Arrays.sort(unsorted);
        timeSpent = System.currentTimeMillis() - startTime;
        System.out.println("\n Program (non parallel )execution time is " + timeSpent + " milliseconds");
    }

Al comienzo de la función principal, la matriz se llena con líneas arbitrarias que contienen números del 0 al 10,000,000. El número de hilos en el dispositivo se toma como el número de hilos. La variable batchSize es responsable de la dimensión de las matrices para ordenar en paralelo. Luego se crea un ejecutorService con un número fijo de subprocesos.

Para cada subproceso, se crea su propio objeto de fusión de clase, luego este coloca la tarea de clasificación en la cola para su ejecución. Con la ayuda del futuro, esperamos hasta que todo se calcule, recopilamos todas las partes ordenadas de la matriz y las fusionamos en la matriz resultante. Paramos el servicio ejecutor y podemos ver los costos de tiempo de una implementación en serie y paralela.

El codigo esta aqui

Clasificación multiproceso utilizando un grupo de subprocesos en Java

More articles: