もうチャレンジ可能なようです。
規定課題部門はソーティングです。
マルチコア+SIMD+狭メモリ空間という、
可能性と制約に満ち溢れたチップの中で何が最適なソートなのか、
興味深いところです。
odd-even merge sort で巨大なソーティングネットワークを作るのが無難か。
oemsに関しては
d.hatena.ne.jp/yupo5656/20060617/p3 が非常に参考になります。
ただ、8要素までなら shufb * 2 + cmpgt + selb * 2 で、SIMDの恩恵を簡単に受けられるけど、
要素数が膨大になってくると、simd比較命令にかけるためのデータを用意するコストが馬鹿にならない気がする。
あと、ただの並び替えだったらいいけど、データ系列をキーに従って並び替えるのも、単純なSIMD化の妨げになりそう。
って、並列ソートの本とか読んだことないので、
恐らくそのあたりの解決策は既にある…といいな。