Forum: Digitale Signalverarbeitung / DSP / Machine Learning Array "sortieren" mit SIMD Architektur


von derMosphet (Gast)


Lesenswert?

Hallo Forum,

Ich suche einen Algorithmus der mir in einem Array, Elemente die eine 
Bedingung erfüllen an den Anfang des Arrays bringt. Soweit wäre das ja 
noch ganz einfach, allerdings soll der Algorithmus auf einer SIMD 
Architekture (genauer GPU via OpenCL) effizient laufen.

Die Struktur des Arrays schaut beispielhaft so aus:
1
[XXXOOOOO|XOOOOOOO|OOOOOOOO|XXXXXXX]
und es soll folgendermaßen aus dem Algorithmus herauskommen:
1
[XXXXXXXX|XXXXOOOO|OOOOOOOO|OOOOOOOO]
Folgende Randbedingungen gibt es:

Die Elemente mit X sollen also an den Anfang, was mit den O Elementen 
passiert ist nicht wichtig, sie können auch verworfen werden.

Die Reihenfolge der X Elemente ist nicht wichtig.

Die X Elemente starten immer am Anfang eines mit "|" begrenzten Blocks, 
diese Blöcke sind in der Realität 16 Elemente lang.

Die Anzahl der X Elemente in einem mit "|" begrenztem Block ist bekannt 
und kann von 0 bis 16 Schwanken.

Der Algorithmus muss nicht unbedingt in place sein, zuviel zusätlicher 
Speicher steht allerdings nicht zur Verfügung.

Über Google bin ich auf den 
Bitonic-Sort(https://en.wikipedia.org/wiki/Bitonic_sorter) Algorithmus 
gestoßen, dieser scheint für parallele Verarbeitung gut geeignet zu 
sein, aber er sortiert halt komplett, was ich nicht benötige. Geht das 
mit meinen zusätzlichen Randbedingungen schneller als mit dem Bitonic 
Sort? Ist mein Problem 100% Äquivalent zum kompletten sortieren wo es 
bei jedem Element auf die Reihenfolge ankommt?


lg

derMosphet

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.