Одна из самых больших проблем современных архитектур кроется в увеличении производительности однопоточных вычислений. Intel за последние годы продвигалась в этом направлении маленькими шажками, AMD с новой архитектурой Zen планирует сделать серьезный рывок вперед, по крайней мере,...
Показано с 1 по 10 из 38
Комбинированный просмотр
-
16.02.2016, 12:05 #1
- Регистрация
- 06.04.2012
- Сообщений
- 4,766
Архитектура VISC: значительное улучшение однопоточной производительности
-
22.05.2016, 16:12 #2
- Регистрация
- 26.09.2014
- Сообщений
- 1,135
1) Ты отвечай за себя и свои глупости, которые строчишь в каждом посте! Ну а я за свои слова всегда отвечал и приводил море пруфов !!!
2) На данный момент балабольством на этом форуме занимаешься именно ты ! Ничего умного в подтверждении своей версии, или опровергающую мои слова, ты пока не привел ! Да ты вообще ничего еще не сказал ! Ты как попугай смог за всю жизнь выучить только одно слово — бред !
3) Было бы неплохо, если бы ты научился отвечать за слова, приводить аргументы и не спорить с инженерами и создателями процессорных архитектур !
В противном случае, все твои потуги — пустое балабольство неадеквата, вызванное какими-то медицинскими расстройствами.
-
23.05.2016, 01:33 #3
- Регистрация
- 21.08.2013
- Сообщений
- 387
del
Последний раз редактировалось kachaev; 23.05.2016 в 02:55.
-
24.05.2016, 01:15 #4
- Регистрация
- 21.08.2013
- Сообщений
- 387
Чипас, разберём твой скрин по запчастям. Попробую сделать это так, что бы самый тупой чел мог это понять.
Итак - сам скрин. http://cdn.wccftech.com/wp-content/u...s-a-beast1.png.
Поехали. Первое и самое главное - тесты в относительных величинах, никаких абсолютных цифр в тестах нет. Что бы нельзя было проверить достоверность на основе сторонних материалов.
Второе. Сморим на компилятор и флаги. Чипс, вопрос к тебе - почему указано , что SPECтест на интеле компилился GCC с флагом -о3, и не указано на компиляции под АРМ? Почему там указано просто - о3 сетингс? В чём разница , Чипси? Надеюсь, прописные истины тебе объяснять не надо?
Почему не использовался флаг -march=native? Для сравнения именно процессоров этот флаг предподчтительнее, ибо учитывет особенности именно конкретных процессоров.
Далее - по поводу выбора компилятора. Почему не использовался ICC для интела? Он даёт больший выигрыш в производительности по сравненнию с GCC.
Следущее- переходим к тесту памяти. DEll venue pro11 c CoreM-5Y10C имеет 4гига оперативки в однокональном режиме(!). Почему не взяли для тестов DEll venue pro11 с 5Y71 с 8-ю гигами оперативки в двухканале? Тебе это не кажется странным?
Ещё далее - Чипс.глянь спецификацию CoreM-5Y10C. Обрати внимание на базовую частоту - 800мгц. В примечаниях с тесту указано , что в мультипроцессорном тесте корка термальнолимитирована и не работала на целевой цастоте. Где график частот и троттлинга Корки? Ан нет его, нам его не показали. Если прочтёшь стороние обзоры деловской планшетки,то увидишь,что в тестах с полной загрукой проца корка не только не бустила,а троттлила, то есть производительность была даже меньше,чем на базовой частоте.
А теперь внимание - вИнимание!
Так что с чем сравнивают? Реальносуществующий младший CoreM-5Y10C, неизвестно на какой частоте(зажатой теплопакетом), с потреблением 4ватт(как, когда, в какие моменты) и с одноканальным доступом в память, но не с "какой-то" реальносуществующей платформой на Cortex-A72, а с RTL моделью Cortex-A72 2.5ггц. Чипс, что такое RTL(register transfer logic) модель? То есть сравнили реально существующую систему на младшей корке М с виртуальной моделью на Cortex-A72 с виртуальным потреблением 1ваттта. Круто, чё?
"Да ладно бы просто с виртуальным процессором. Нет - они сравнили реальные процессоры Интела (со всеми I/O, шинами, контроллерами, огромным кэшем) с виртуальными ядрами C-A72 оторванными от всего.
ARM в своем репертуаре - когда все настолько убого, что навязать достойную конкуренцию просто невозможно (те же Авотоны по показателям реальной эенргоэффективности рвут ARM-хлам на части, а проблемы с серверным ПО у ARM огромные), появляются такие вот высосанные из... пусть будет пальца, рекламные слайды."(с)Nimrael. - тот момент, когда я согласен с Nimraelем на 99%(с пальцем я, пожалуй, не согласен).
Только полный идиот может вестись на такую хрень.
Если будут ещё вопросы - продолжу дальше.Последний раз редактировалось kachaev; 25.05.2016 в 00:02. Причина: грам.ошибки
-
24.05.2016, 23:52 #5
- Регистрация
- 21.08.2013
- Сообщений
- 387
Чипи, ау, ты куда подевалси? Что не так теперь с аргументами?
-
25.05.2016, 02:22 #6
- Регистрация
- 26.09.2014
- Сообщений
- 1,135
У тебя есть аргументы ? Посмеялся.. Твои аргументы — простынь бреда !
Я тебе еще раз повторяю, ты лучше свою голову разбери на запчасти, если ничего на знаешь — молчи ! Куда тебя вообще понесло !!!
Вы только послушайте этого несчастного, он пытается объяснить инженерам то, о чем сам даже не ведает !!! Ты бы сперва образование получил..
Сравнительные тесты так и делаются. ARM подтасовкой результатов не занимается, а также никогда не использует для своих процессоров выгодные для себя условия тестирования.
Объясняю. "-o3" — это и есть флаг ! Вернее говоря, параметр "-o3" включает в себя набор флагов, а -march=native — это лишь один из флагов пакета. Так что ARM тестировала оба процессора и с одинаковыми версиями компилятора, и с одинаковой сборкой пакета уровня "Level-o3"
Не умничай про компиляторы в будущем !
Кто тебе эти глупости сказал ?
1) У компилятора ICC есть свои ограничения.
2) Intel занималась халтурой при помощи своего компилятора ICC, когда она при его помощи пыталась весь мир обмануть поддельными тестами своего процессора Atom. Позже все вскрылось.
Снова бредишь ? Процессоры Core-M 5Y10 и Core-M 5Y71 оба работают в двухканальном режиме и разницы в тестах памяти между ними практически нет ! Разница в производительности есть только из-за более высокой частоты Core-M 5Y71.
Ты хочешь сказать, что процессор Core-M 5Y10 работал на частоте 800 МГц и показал результат сопоставимый (Cortex A72 - 2.5 ГГц) !!!??? Если ты дальше планируешь развивать спор на эту тему, приводи пруфы ! Но мой совет тебе, лучше угомонись, дабы еще глубже лицом в грязь не влезть.
Повторяю тебе, ARM никогда не будет приводить сравнения в невыгодных условиях для конкурирующих производителей ! Если бы процессор Core-M 5Y10 снизил в тестах частоту с 2000 - до 800 МГц, он бы показал в Geekbech половину от результата Cortex A72 !
Про память "одноканальную", я тебе уже выше ответил, а что касается энергопотребления "4 Вт у Core-M 5Y10" — это и есть развод на идиота таких как ты от Intel ! Процессор Core-M потребляет под нагрузкой больше 20 Вт даже младшая версия 2 ГГц, а не 1 Вт !!! Это так Intel лохует всех своим настраиваемым TDP. Вот тебе скрин ниже. Надеюсь, складывать потребление ядер ты можешь ? Как видишь, частота от троттлинга снизилась всего на 500 МГц, а энергопотребление рухнуло в 2 РАЗА по обоим графическим шкалам !!! Вот и прикинь, сколько будут потреблять оба его ядра на реальной частоте 2 ГГц под нагрузкой, сколько на 2.5 ГГц и сколько на максимальной 2.9 ГГц в старшей версии ?
Что это еще за "Аватоны" такие ??? Научись нормально писать по русски !
Ну так это же ты пытался здесь нести глупости про компиляторы, обвинять ARM в мошенничестве с результатами тестов и т.д. ? Я тебе дал исчерпывающие ответы на все твои идиотские вопросы.
P.S. Если ты чего то там не знаешь - это еще не значит, что другие идиоты !Последний раз редактировалось Chipi; 25.05.2016 в 03:33.
-
25.05.2016, 02:59 #7
- Регистрация
- 21.08.2013
- Сообщений
- 387
Мне лень после каждого пункта писать, что ты идиот.
-O1
Optimize. Optimizing compilation takes somewhat more time, and a lot more memory for a large function.
With -O, the compiler tries to reduce code size and execution time, without performing any optimizations that take a great deal of compilation time.
-O turns on the following optimization flags:
-fauto-inc-dec
-fbranch-count-reg
-fcombine-stack-adjustments
-fcompare-elim
-fcprop-registers
-fdce
-fdefer-pop
-fdelayed-branch
-fdse
-fforward-propagate
-fguess-branch-probability
-fif-conversion2
-fif-conversion
-finline-functions-called-once
-fipa-pure-const
-fipa-profile
-fipa-reference
-fmerge-constants
-fmove-loop-invariants
-freorder-blocks
-fshrink-wrap
-fsplit-wide-types
-fssa-backprop
-fssa-phiopt
-ftree-bit-ccp
-ftree-ccp
-ftree-ch
-ftree-coalesce-vars
-ftree-copy-prop
-ftree-dce
-ftree-dominator-opts
-ftree-dse
-ftree-forwprop
-ftree-fre
-ftree-phiprop
-ftree-sink
-ftree-slsr
-ftree-sra
-ftree-pta
-ftree-ter
-funit-at-a-time
-O also turns on -fomit-frame-pointer on machines where doing so does not interfere with debugging.
-O2
Optimize even more. GCC performs nearly all supported optimizations that do not involve a space-speed tradeoff. As compared to -O, this option increases both compilation time and the performance of the generated code.
-O2 turns on all optimization flags specified by -O. It also turns on the following optimization flags:
-fthread-jumps
-falign-functions -falign-jumps
-falign-loops -falign-labels
-fcaller-saves
-fcrossjumping
-fcse-follow-jumps -fcse-skip-blocks
-fdelete-null-pointer-checks
-fdevirtualize -fdevirtualize-speculatively
-fexpensive-optimizations
-fgcse -fgcse-lm
-fhoist-adjacent-loads
-finline-small-functions
-findirect-inlining
-fipa-cp
-fipa-cp-alignment
-fipa-sra
-fipa-icf
-fisolate-erroneous-paths-dereference
-flra-remat
-foptimize-sibling-calls
-foptimize-strlen
-fpartial-inlining
-fpeephole2
-freorder-blocks-algorithm=stc
-freorder-blocks-and-partition -freorder-functions
-frerun-cse-after-loop
-fsched-interblock -fsched-spec
-fschedule-insns -fschedule-insns2
-fstrict-aliasing -fstrict-overflow
-ftree-builtin-call-dce
-ftree-switch-conversion -ftree-tail-merge
-ftree-pre
-ftree-vrp
-fipa-ra
Please note the warning under -fgcse about invoking -O2 on programs that use computed gotos.
-O3
Optimize yet more. -O3 turns on all optimizations specified by -O2 and also turns on the -finline-functions, -funswitch-loops, -fpredictive-commoning, -fgcse-after-reload, -ftree-loop-vectorize, -ftree-loop-distribute-patterns, -fsplit-paths -ftree-slp-vectorize, -fvect-cost-model, -ftree-partial-pre and -fipa-cp-clone options. < < < Найди мне тут -march=native Чипси, о каком вообще -march=native для несуществующего проца может идти разговор??? Чипси, ты узнал,что такое RTL(register transfer logic) модель???
Я тебе дал исчерпывающие ответы на все твои идиотские вопросы.
Чипис, этим своим постом ты убедил, и не только меня, что ты просто полный идиот, отрицающий существующую реальность. Твоя тупизна непробиваема. И основывается она на твоём же постулате - "АРМ - чОткие пОчанцикЕ, а чОткие пОцанчикЕ никогда не врут, в отличии от остальных, нечётких пацанчиков, которые врут всегда". Идиотизм в кубе.
Чипи, можно ссылку на любой реальносуществующий проц основанный на ядрах Cortex A72? Не ссы, такие существуют, мне надо, что бы именно ты указал это для теста.Последний раз редактировалось kachaev; 25.05.2016 в 07:31.
-
25.05.2016, 17:52 #8
- Регистрация
- 26.09.2014
- Сообщений
- 1,135
Ты только и можешь копипастить.. У тебя проблемы с пониманием русского языка ! Для чего ты эту простынь здесь выложил ? Ты реально полный тормоз..! Где я говорил, что флаг "-march=native" присутствует в сборке -o3 ?! -march=native появился ещё в версии v4.6 и является общеупотребительный флагом пакета компилятора GCC ! Применение этого флага позволяет определить тип процессора и автоматически выставлять подходящие для него флаги. Проблема в том, что при автоматическом режиме флаг "-march=native" выдаст конечные результаты хуже, чем при ручной установке. В ARM все тесты провели верно ! Во всяком случае, никто из программистов пока не опроверг результаты их трудов, что уж говорить о таком неуче как ты... Все ТЕСТЫ были выше ! Ты пока ничего не опроверг ! Все твои обвинения и истерики от безысходности и незнания предмета ! Конечно, только непробиваемый полный идиот отрицает реальные результаты тестов от производителя, только идиот не приводит никаких доказательств, только такой идиот-неуч и может наехать на лучших в мире инженеров процессорных архитектур ! Твоё имя — голословщина-губошлёп !Тебя в гугле забанили ? Все современные процессоры используют в своей основе архитектуру ARMv8-A !
-
25.05.2016, 18:42 #9
- Регистрация
- 21.08.2013
- Сообщений
- 387
-
25.05.2016, 18:57 #10
- Регистрация
- 21.08.2013
- Сообщений
- 387
Чипсик, что еще сморозишь? Вот что значит - "уметь гуглить, но не понимать то, что нагуглил"...
-march=native. march - сообщает компилятору, что надо генерить код для архитектуры процессора, Native - означает, что надо генерить код под архитектуру конкретно проца, на котором идет сборка. Всего лишь. Может я как-то неправильно тебе пытаюсь мысль донести? Короче, флаг "-О3" -оптимизация без учета архитектуры процессора, флаг "-О3 -march=native" - отимизация с учётом архитектуры того проца, на котором идёт компил.
"может наехать на лучших в мире инженеров процессорных архитектур"(с)Чипсик -
"Куда ты плывёшь, крыша моя...?"(с)р/гр "Агата Кристи". В этой песне есть ещё подходящие для тебя сторочки - "Я ужасно тупой, очень тупой...".
Чипсик, ARMv8-A - 64-битная архитектура АРМов, включает в себя и А53, и А57 ядра , и ещё кучу ядер от производителей процессоров, включая и А72. Я ещё раз спрошу, чётко-конкретно -Чипи, укажи реальносуществующий проц основанный на ядрах Cortex A72? Не ссы, такие существуют, мне надо, что бы именно ты указал такой проц для сравнительного теста.
Моё -Чипси, ты узнал, что такое RTL(register transfer logic) модель???RTL - это конечный розничный продуктПоследний раз редактировалось kachaev; 25.05.2016 в 21:25.