> вы ошибаетесь, во время выхода был не совсем допиленный opencl для vliw4,
> потом допилили и все стало хорошо. (: Да ничего там хорошего: оптимизнули и сократили число поточных процессоров, уменьшив потребление и площадь кристалла. IIRC, за счет этого урезания и сократилась ширина VLIW команды, так что стал VLIW4 вместо VLIW5, 4 вместо 5 как бы намекает нам.
Зато натолкали более крутых железок для графики, в частности воткнули крутые тесселяторы. Поэтому чип стал чуть поэкономнее (меньше SIMD - меньше жрут) и подтянули графические операции в 3D.
Но для GPGPU вычислений на тесселяторы и прочую графическую байду - плевать! Все решает число SIMD процессоров. Чем больше - тем лучше получается крушить параллелизуемые задачи (а другие нет смысла на GPU спихивать). В этом плане 5xxx серия - лучше: это тот же техпроцесс, поэтому жрет при прочих равных примерно так же. А при прочих равных там больше поточных процессоров - тем быстрее считает.
По этому поводу все старшие 59хх тотально расхапаны майнерами биткоинов и крякерами хешей и в диком виде практически не попадаются, особенно по гуманным ценам. Найти 59хх в продаже, даже БУшный - не сложно, а очень сложно.
Получить представление что из кого можно выжать на сильно параллелящейся задаче типа массового брута хешей можно где-то там: https://en.bitcoin.it/wiki/Mining_hardware_comparison - ну и из таблиц прекрасно видно что вся 6xxx линейка на штатных частотах - несколько унылее чем 5ххх. Потому что число поточных процессоров меньше.
Кстати там же можно посмотреть на эпичный слив нвидии: стобаксовый 5770 считает примерно как супердорогая "тесла", что очень доставляет фанам нвидии на таких типах вычислений. У нвидии попросту поточных ядер сильно меньше, ну вот и получается то что получается.