forum.opennet.ru

"Релиз набора компиляторов LLVM 11.0 "

Форум Разговоры, обсуждение новостей
Версия для распечатки	Пред. тема \| След. тема

Исходное сообщение

[ Отслеживать ]

Есть идеи по улучшению форума и сайта ? Пишите.

. "Релиз набора компиляторов LLVM 11.0 "	+/–
Сообщение от n00by (ok), 15-Окт-20, 11:04
>> mov edx, 0 ; Зачем? > Так быстрее, хотя можно поспорить о том стоит ли игра свеч. > Насколько помню, вариант кода от GCC в 2 раза (или даже в > 3) быстрее на нулях. Про быстрее при 0 я писал https://www.opennet.ru/openforum/vsluhforumID3/122094.html#67 (у popcnt на ряде архитектур Latency=3 Throughput=1, тогда как у cmove Latency=1 Throughput=0.5) Вопрос именно в обнулении edx. cmove выполняется, если в edi ноль. То есть нужные данные и так есть. И зависимость cmove по данным (ZF) от test и так есть. test edi, edi mov edx, 0 cmove eax, edx test edi, edi cmove eax, edi Т.е не ясно, почему 1й вариант, а не 2й. > Т.е. если считать кол-во единичных бит в массиве, то "магия" добавленная gcc > позволяет экономить по такту на каждом слове. На массиве нулей. А если данные случайны? На каждом одном слове из 256, то есть 1/256 такта. При этом кеш инструкций расходуется непропорционально. Тут надо иметь ввиду, что у разработчиков премиальные процессоры с большим кешем, а в реальности у пользователя Целерон и многозадачная система, где крутится 68 онлайн-мессенджеров. > Кроме этого, при последующих вычислениях разница может быть еще более значительной (cmov > может порождать два пути спекулятивного выполнения). > При этом, поведение актуального gcc 10.2 очень прецизионное. Добавляемая "магия" меняется > в зависимости от целевого ядра (опция -march=), всего 4 варианта не > считая цикла при отсутствии popcnt. > Ну и вишенка - gcc можно было-бы упрекнуть в генерации лишнего кода, > но если задать -Os, то останется только popcnt. > Собственно, поэтому я говорю что сейчас gcc умеет больше чем llvm. Дело может быть в области применения, а так же в том, что в Ваши задачи входит писать быстрый код, потому в конкретных и оптимизированных решениях GCC выигрывает, присваивая себе заслуги автора кода. А вот эта моя поделка https://www.opennet.ru/opennews/art.shtml?num=53778 собранная GCC, выполняется в 2 раза медленнее (согласно и top, и perf). Написал как попало, принципиально не заморачиваясь оптимизацией (ну, только синус табличный), в цикле считаются float-ы, примерно так: if (!i) { vert->color = src; } else { vert->color.r = src.r * (1.0f + fsin(vert->pos.x + omega_bk + i)); vert->color.g = src.g * (1.0f + fsin(vert->pos.y + omega_bk + i)); vert->color.b = src.b * (1.0f + fsin(vert->pos.x + vert->pos.y + omega_bk + i)); vert->color.a = src.a; } Причину не искал, потому не могу пока говорить про данный случай предметно. Просто пример, когда первый попавшийся чайник берёт Clang и выигрывает.
Ответить \| Правка \| Наверх \| Cообщить модератору

Оглавление

Релиз набора компиляторов LLVM 11.0 , opennews, 12-Окт-20, 22:53 [смотреть все]

Нужно, не копайте, Аноним, 12-Окт-20, 22:53 (1)
Для чего Fortran использовать можно, кроме вычислений А то ощущение, что язык п, Аноним, 12-Окт-20, 23:01 (3) //
- А зачем нужен фортран, если есть C, C , OpenCL, SyCL, а если и их мало, то Boos, Аноним, 12-Окт-20, 23:12 (5) //
  - Зачем библиотеки перечислять , Аноним, 12-Окт-20, 23:26 (6) //
    - Потому что без них BLAS оптимизированные операции линейной алгебры, вроде скаля, Аноним, 12-Окт-20, 23:31 (7)
    - Чтобы показать, что он про них читал , YetAnotherOnanym, 13-Окт-20, 09:45 (36)
  - Патамушта это все не для людей,это все для погроммистов, чюдо ты наше , Gefest, 13-Окт-20, 20:21 (62)
- Fortran вечен , Я, 12-Окт-20, 23:44 (10) //
  - Можно на нём операционную систему написать или микроконтроллеры прогать , Аноним, 12-Окт-20, 23:54 (12) //
    - Я под ВЭБ на нем прогаю, вместо жаваскрипта Олдскульненько так , Аноним, 13-Окт-20, 00:16 (15)
      - блин, я аж пивом подавился когда распарсил , ksjdjfgklsjdklgfj, 13-Окт-20, 08:29 (33)
    - Можно ли молотком хлеб порезать или полы подмести , ИмяХ, 13-Окт-20, 11:22 (39)
      - Некорректное сравнение , Аноним, 13-Окт-20, 12:25 (47)
      - Заморозь в форме ножа, желательно хлебного как пила чтобы лезвие было Мойка в, Аноним, 16-Окт-20, 11:45 (80)
- Для повышения чсв разве что , Аноним, 13-Окт-20, 00:48 (18)
- Ни для чего В llvm он нужен только для поддежрки кое-какого распространнного ле, Аноним, 13-Окт-20, 01:05 (19) //
  - Уровень опеннетовских анонимных экспертов порой просто поражает , Аноним, 14-Окт-20, 02:01 (65)
- Да, он изначально заточен и его продолжают затачивать прежде всего под цели вычи, yep, 13-Окт-20, 07:06 (26)
- Это язык для физиков и математиков, а не для программистов Нахрен им его ещё дл, nobody, 13-Окт-20, 11:02 (37) //
  - а вам все готовое подавай пс не подскажите каким языком пользуются макаки , Sw00p aka Jerom, 13-Окт-20, 11:14 (38) //
    - AppleScript, Zlo, 13-Окт-20, 11:53 (44)
  - А как же Haskell Разве не Haskell язык для математиков , fsb4000, 14-Окт-20, 17:10 (72)
- Фортран это почти ассемблер с человеческим лицом Что-то сложное типа БД на нем , Аноним, 13-Окт-20, 13:51 (51)
А грёбанный долгоиграющий баг с неправильными флагами компоновки при использован, Аноним, 12-Окт-20, 23:05 (4) //
- А можно чуть поподробнее, пожалуйста Интересно , Аноним, 13-Окт-20, 11:36 (40) //
  - Можно https github com pocl pocl blob master cmake clangLinkerWorkaround shhtt, Аноним, 14-Окт-20, 10:25 (68)
- Юзай GCC , Аноним, 13-Окт-20, 13:39 (49)
1 Большая деградация производительности 2 Требует SSE2 , Аноним, 12-Окт-20, 23:41 (8) //
- Который есть во всех х64 процессорах Что сказать-то хотел , Аноним, 13-Окт-20, 00:02 (13) //
  - В aarch64 этого набора инструкций нет А сказать я хотел, что есть люди которы, Аноним, 13-Окт-20, 00:30 (16) //
    - Нихрена себе у старьёвщиков кукуха поехала, дошло уже до теории заговоров, а эго, Аноним, 13-Окт-20, 01:10 (20)
      - Годный потребитель порвался P S Кукушка не едет, она прилетает P P S Я сам к, Аноним, 13-Окт-20, 07:40 (28)
        
        а вот и кремлеботы подтянулись, ksjdjfgklsjdklgfj, 13-Окт-20, 08:30 (34)
        
        Кремлеботы - за цензуру , Аноним, 13-Окт-20, 08:38 (35)
    - К сожалению, в обществе этот закон прекрасно работает, Fracta1L, 13-Окт-20, 07:28 (27)
      - Не, в обществе ты толкнёшь кого-то вниз, сам полетишь наверх, но всё общество це, Аноним, 13-Окт-20, 07:42 (29)
        
        Но им-то - наплевать Самому взобраться на броневичок над остальными рабами гораз, пох., 13-Окт-20, 11:53 (43)
        
        хорошо ты Ленина мазанул, на корзину печенья и банку варенья заработал , Аноним, 13-Окт-20, 12:22 (46)
        
        Но я броневик хочу Печенье и варенье потом сам реквизирую, у недобитых плохишей, пох., 13-Окт-20, 16:35 (55)
        Это где выдают Кроме троцкистких недобитков никто пропагандой сейчас не занима, Аноним, 16-Окт-20, 11:25 (79)
- 3 Необязательна -mno-lvi-cfi -mno-lvi-hardening , topin89, 13-Окт-20, 23:17 (63) //
  - Есть нюанс - требует либо пересборки софта очень долго и ресурсоёмко в случае F, Аноним, 14-Окт-20, 10:30 (69)
Зато PIC несколько лет назад выпилили Теперь лифтинг делать некуда и натравлива, Аноним, 12-Окт-20, 23:43 (9)
А толку Их всё равно кроме Visual Studio ни одна система сборки не использует , Аноним, 12-Окт-20, 23:46 (11) //
- Cmake, нет , Имя, 13-Окт-20, 02:48 (22) //
  - И внезапно visual studio так же может использовать clang llvm , Аноним, 13-Окт-20, 05:18 (23) //
    - Не спорю, я и GCC прикручивал к студии, VS это только среда А вы говорите про M, Имя, 13-Окт-20, 05:20 (24)
  - Спасибо, значит уже добавили Помню, как мне пришлось их из кода выпиливать, ког, Аноним, 13-Окт-20, 07:45 (30)
- debug-info в отдельном файле -- это удобно Можно хоть всю систему собрать с отл, Ordu, 13-Окт-20, 16:20 (54) //
  - Это вообще не та штука И objcopy для этой цели используется примерно во всех би, Аноним, 13-Окт-20, 19:57 (60)
С таким прогрессом впору GCC именовать LLVM-совместимым , zzz, 13-Окт-20, 00:13 (14)
С поддержкой Cortex-A77 как-то протормозили , Андрей, 13-Окт-20, 01:33 (21)
Ненужно GCC по всем параметрам уделывает LLVM, Иваня, 13-Окт-20, 06:44 (25) //
- Возможно, что зависит от программы, архитектуры, для которой соберается, и от ка, Аноним, 13-Окт-20, 08:04 (31) //
  - ошибка, для native дельта вообще 9 миллисекунд, но у native время больше, чем, н, Аноним, 13-Окт-20, 08:09 (32)
  - кто-то кого-то порвал Сам тест сколько миллисекунд длился , Аноним, 13-Окт-20, 11:43 (42) //
    - 100500, Аноним, 13-Окт-20, 12:19 (45)
    - https github com KOLANICH research_compiler_optimizations_comparison tree mast, Аноним, 14-Окт-20, 10:36 (70)
- Влажность мечт 146 , Аноним, 13-Окт-20, 11:37 (41) //
  - Исследовал тему, более чем, 9-й и тем более 10-й GCC именно что уделывает Пару л, erthink, 13-Окт-20, 13:02 (48) //
    - И зря Ты не знаешь как начинался проект LLVM Изначально разработчики тупо скоп, Аноним, 13-Окт-20, 13:47 (50)
      - Минус что llvm уже существует и второй не нужен, Аноним, 13-Окт-20, 13:59 (52)
      - А они о том, что вернулись , знают o_O code cat hello c gcc hello c -fdump, Аноним84701, 13-Окт-20, 14:24 (53)
        
        gt оверквотинг удален А что это -fdump-final-insns выводит внутреннее предста, n00by, 13-Окт-20, 17:00 (57)
        
        Дык, Register Transfer Language DI тут кстати Double Integer mode represent, Аноним84701, 13-Окт-20, 18:42 (58)
        
        То есть язык, описывающий машинные инструкции целевой платформы В общем-то и, n00by, 14-Окт-20, 07:45 (66)
      - И зачем здесь демонстрировать свое невежество , Sem, 14-Окт-20, 01:38 (64)
    - Интересно, что оптимизаторы определяют семантику высокоуровнего кода, но есть ра, n00by, 13-Окт-20, 16:44 (56)
      - Скорее всего спекуляция , потому что на этапе промежуточного кода gimple оно , Аноним84701, 13-Окт-20, 19:16 (59)
        
        test edi, edi mov edx, 0 cmove eax, edxЕсли о спекулятивном и, n00by, 14-Окт-20, 08:06 (67)
        
        Да нет, это я так спекулирую в смысле, с умным видом рассуждаю Примерно да h, Аноним84701, 14-Окт-20, 12:15 (71)
      - Так быстрее, хотя можно поспорить о том стоит ли игра свеч Насколько помню, вари, erthink, 14-Окт-20, 19:54 (73)
        
        Про быстрее при 0 я писал https www opennet ru openforum vsluhforumID3 122094 , n00by, 15-Окт-20, 11:04 (74)
        
        Там четыре варианта в зависимости от целевого ядра Поиграйтесь флагом -march на , erthink, 15-Окт-20, 23:28 (77)
        
        Так варианты машинного кода не объясняют причину, почему выбрана именно такая В, n00by, 16-Окт-20, 13:07 (81)
        
        Ну как-бы очевидно что компилятор руководствуется подобными правилами, которые б, erthink, 16-Окт-20, 15:45 (82)
        
        Так вопрос в том, насколько эти правила адекватны железу Когда-то мне приходило, n00by, 17-Окт-20, 17:55 (84)
        Проверил гипотезу так объявил задействованные функции как static inline включил , n00by, 18-Окт-20, 08:38 (85)
        
        Как насчёт pgo Все эти ручные твики на редкость не универсальны А сам компилят, Аноним, 21-Окт-20, 10:51 (87)
        
        В данном конкретном случае Clang безо всяких твиков выполнил во время трансля, n00by, 21-Окт-20, 12:44 (88)
- Вот когда по удобству кросс-компиляции уделает, тогда приходи со своим экспертны, Аноним, 13-Окт-20, 19:58 (61) //
  - Человек-снежинка , erthink, 15-Окт-20, 23:30 (78) //
    - n00by, erthink, Аноним84701 - втроём полнедели обсуждали обсуждали да таки ничег, Аноним, 17-Окт-20, 17:49 (83)
      - Ну да, я не понял, какое отношение имеет оптимизация графа вызовов когда оптими, n00by, 18-Окт-20, 08:46 (86)
Не мог пройти мимо и не потыкать палочкой Проверка Clang 11 с помощью PVS-Stud, Andrey_Karpov, 27-Окт-20, 15:03 (89)

Форумы | Темы | Пред. тема | След. тема

Партнёры:

Хостинг:

Закладки на сайте
Проследить за страницей

Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру