Default Green Orange
НеТупи:)
Позитивные и курьезные новости
RSS
  • Home Page Главная
  • Карта сайта

Dual Xeon X5672 в приложениях из стандартной методики

Позитивные новости Добавить комментарий

Выход в свет Sandy Bridge-E осенью прошлого года вызвал неоднозначную реакцию среди компьютерной общественности. Единственные пользователи, которых вообще не было слышно — как раз та группа, для которой новая платформа и выпускалась :) Они просто покупали новые процессоры и использовали их — как обычно и бывает. А наиболее крикливой оказалась группа форумных энтузиастов-теоретиков, рождению которой так сильно поспособствовала повсеместная доступность интернета :) В чем только новую платформу не обвиняли. И, дескать, прирост производительности по сравнению с предыдущими решениями маленький, и платить нужно слишком дорого, и функциональность не выросла. Хотя, по большому счету, все эти претензии выглядели достаточно смешно.

Мало портов SATA600? Не во всяком массовом компьютере можно найти хотя бы одно устройство, которому новый интерфейс окажется полезным. Тем более, что платформы на базе Westmere-E полноценной поддержки SATA600 вообще не имели. Оказались нереализованными планы по поддержке SAS600? Ну а такой накопитель и вовсе — даже один почти невозможно встретить в 99% настольных компьютеров. Отложилось внедрение PCIe 3.0? А что с ней-то делать ближайшие год-два? :) Да и в плане цен и производительности не все так уж однозначно — в конце концов, Core i7-3930K стоит как Core i7-980, а работает быстрее, чем вдвое более дорогой Core i7-990X Extreme. Это если брать события совсем недавнего времени, а ведь можно воспомнить и то, что было еще раньше. В частности, пять лет назад Core 2 Duo E6700 (с оптовой ценой 530 долларов) по производительности вообще практически не отличался от Core 2 Duo E6600 (316 долларов), так что на этом фоне разница между Core i7-3930K и Core i7-2600K выглядит принципиальной. В общем, все как всегда и даже чуть лучше, но раньше интернет был менее доступен, так что негде было проливать крокодиловы слезы :)

Но наиболее весомыми (и вот тут уже — отчасти справедливыми) претензиями были предъявляемые к количеству ядер. К тому же новые претензии наложились на традиционное поругивание Intel за прекращение гонки количества ядер на десктопе — массовые процессоры компании вот уже много лет содержат всего четыре вычислительных ядра, и в ближайшие годы ничего нового не ожидается. Топовые настольные платформы почти три года назад стали шестиядерными, но… Если в Westmere-E столько ядер и было физически, т. е. Core i7 под LGA1366 утилизировали потенциальные возможности кристалла на 100%, то в Sandy Bridge для LGA2011 ядер восемь. Однако все восемь доступны лишь в Sandy Bridge-EP/EX, а в Sandy Bridge-Е как минимум два всегда заблокированы.

А был ли выход? Буквально на днях выходят новые Sandy Bridge-EP/EX, так что их характеристики в основном уже известны. Старший восьмиядерный EP, а именно Xeon E5-2687W, имеет базовую частоту лишь 3,1 ГГц, т. е. в малопоточном программном обеспечении (коего до сих пор на десктопе 90%) будет проигрывать не только Core i7, но и многим Core i5 под LGA1155. И это, заметим, с TDP 150 Вт, а при выпуске настольной версии LGA2011 перед инженерами стояла задача в обязательном порядке уложиться в те же 130 Вт, которые были типичными и для предшественницы в лице LGA1366. Ну что ж, если ограничиться 130 Вт, получаем Xeon E5-2680 со стартовой тактовой частотой лишь 2,7 ГГц — и в массовом ПО такой процессор будет проигрывать уже не только Core i5, но и Core i3. А временами — даже Pentium. Т. е. в настольном окружении он не нужен. Вот для специфических задач пара таких процессоров со своими 16 ядрами (и 32 потоками вычисления) подойдет превосходно, причем нуждающиеся в решении подобных задач, естественно, с легкостью заплатят 3,5-4 тысячи долларов за одни лишь процессоры — но продать такое массовому пользователю просто невозможно. Справедливости ради, и Sandy Bridge-E берут не сказать чтоб сильно массово, но эти процессоры хотя бы нигде не хуже более дешевых моделей, а вот гипотетический настольный восьмиядерник этим похвастаться не сможет.

Впрочем, почему гипотетический? Xeon E5-2650 будет стоить $1106, т. е. лишь немногим дороже, нежели Core i7-3960X Extreme. Наверняка он будет поддерживаться и многими настольными платами. Да, конечно, базовая частота лишь 2 ГГц и заблокированные множители, однако в LGA2011 компания Intel сделала подарок любителям разгона в виде повышающих коэффициентов для опорной частоты. 125 МГц вместо 100, конечно, все равно маловато, а вот если получится задействовать максимальные 166 МГц, то частота процессора волшебным образом превысит 3 ГГц — и аллах с ним с энергопотреблением! :)

Другой путь к получению большого количества ядер на высокой частоте связан как раз с использованием EP-платформ «по прямому назначению». В частности, можно купить подходящую плату и к ней парочку Xeon E5-2630 (612 долларов за штуку) — получим 12 ядер на частоте 2,3 ГГц, что для многопоточного ПО еще лучше, чем погоня за одиночным многоядерником. Правда, «подходящих» для настольного использования двухсокетных плат нужно еще дождаться — что минус. Зато плюс в том, что такой подход, строго говоря, позволяет вообще не ждать Sandy Bridge-EP. До 12 ядер в двух сокетах было доступно и при использовании Westmere-EР, а восемь — еще в рамках Nehalem-EP. Подобную конфигурацию мы тестировали более двух лет назад , и пришли тогда к выводу, что в сегменте массовых решений время двухпроцессорности кончилось. Но может быть, где-то на стыке «массовых» и «специализированных» местечко ей осталось? Попробуем сегодня проверить.

За прошедшее время успел сильно измениться рынок «сопутствующих товаров» — плат для Dual LGA1366. Особенно любопытно решение, которое и попало к нам в руки. Дело в том, что Z8NA-D6 стала первой двухпроцессорной платой в мире, рассчитанной на использование в обычных ATX-корпусах.

Понятно, что без ограничений не обошлось, что хорошо видно по фотографии платы. В условиях ограниченного размера не так-то просто разместить все элементы. Тем более, что для серверного применения нужно одно, а для десктопного — другое. И, несмотря на стандартные размеры, главным для конструкторов было все-таки первое, почему на плату пришлось поставить как минимум видеоадаптер. Да и россыпь SATA-разъемов может неподготовленого человека испугать, хотя на деле всегда работающими являются лишь шесть внизу (на приведенной фотографии) — они обслуживаются помещенным рядышком ICH10R. А вот остальные (частично или полностью) можно задействовать, лишь установив в последний нестандартный разъем расширения специальную PIKE-карту с SAS-контроллером (есть разные варианты последних), после чего можно будет задействовать четыре или восемь разъемов на плате для подключения SAS/SATA-накопителей. Ну а для тех, кому данная функциональность не нужна, компания чуть позже выпустила еще более «десктопную» Z8NA-D6C — без PIKE-слота и SAS-коннекторов.

Что же касается функциональности для настольного использования, то ее по минимуму — необходимая, но не избыточная. В частности, для видеокарт есть всего один слот PCIe x16, а еще два х8 будут, скорее всего, использоваться как х1 — адаптеров с «широким» PCIe для «домашнего» рынка почти не существует (да и если кому вдруг понадобится многопортовый RAID-контроллер, на этой плате лучше использовать фирменный).

В общем, по сути, слотов расширения всего пять, один из которых — классический PCI. USB 3.0 нет, а обычного USB на заднюю панель выведено всего два порта, eSATA там тоже нет, как и звуковых выходов, зато есть COM-порт и аналоговый видеовыход. Так что «доводить» плату до уровня бытового компьютера придется самостоятельно и творчески. Некоторые же вещи уже не исправить: в частности, на плату поместилось всего шесть слотов памяти — как и на большинство «односокетных» моделей под LGA1366. Впрочем, такое их количество на практике вполне может оказаться достаточным, а вот возможностей по питанию процессоров может не хватить. Дело в том, что для совместимости с массовыми БП АТХ инженерам пришлось ограничиться лишь одним (8-контактным) разъемом для питания процессора. А это, в свою очередь, ограничило список потенциально пригодных процессоров моделями с TDP 95 Вт. Причем в плате есть «защита от дурака» — с Xeon на 130 Вт (даже одним) система стартовать и не пытается. Впрочем, логика решения вполне понятна — плата рассчитана на более-менее массовые корпуса и БП, что слабо вяжется с ситуацией, когда одним лишь процессорам может потребоваться более четверти киловатта (а еще ведь потенциально возможна видеокарта, да и винчестеров с десяток).

Топовым Xeon с TDP 95 Вт является X5675 (шесть ядер, 3,06 ГГц), но ни его, ни X5670 (отличается тактовой частотой — 2,93 Ггц) нам добыть пока не удалось. Впрочем, главным вопросом, пожалуй, стоит считать «нужно ли вообще гнаться за восемью ядрами?», так что для ответа на него подойдет и парочка X5672 — четырехъядерные процессоры со стартовой частотой 3,2 ГГц. Ну а с кем их сравнивать — вопрос очевидный: лучшие шестиядерники для старой LGA1366 и новой LGA2011, а также недорогой Core i7-2600 для массовой LGA1155.

Несмотря на наличие на плате шести слотов для памяти, мы задействовали всего четыре — во-первых, в свое время уже успели установить , что трехканальный режим работы памяти на LGA1366 никаких преимуществ перед двухканальным не имеет, а во-вторых… Просто не нашлось под рукой еще пары модулей по 4 ГБ :) В результате в какой-то степени конфигурация уравнялась с LGA2011 и по количеству, и по качеству, что даже более интересно, чем сферические параметры в вакууме.

Традиционно, мы разбиваем все тесты на некоторое количество групп, и приводим на диаграммах средний результат по группе тестов/приложений. Детально с базовой методикой тестирования вы можете ознакомиться в отдельной статье , а для сегодняшнего тестирования мы ее модифицировали, «выбросив» все тесты, неспособные задействовать хотя бы восемь потоков вычисления. Соответственно, и баллы на диаграммах будут несовместимы с основной линейкой тестовых статей, а точкой отсчета сегодня нам послужит Core i7-2600. Тем, кто интересуется более подробной информацией, опять-таки традиционно предлагается скачать таблицу в формате Microsoft Excel , в которой все результаты приведены как в преобразованном в баллы, так и в «натуральном» виде.

Первые же результаты — и первые неожиданности. Мягко говоря. Однако если внимательно изучить подробные результаты и вспомнить предыдущий материал по двухпроцессорным системам, «неожиданностями» они быть перестают — и тогда, и сейчас результаты сильно испортила Maya. В прошлый раз мы списали их просто на недостаточную многопоточную оптимизацию, однако два года назад у нас еще не было под рукой шестиядерных процессоров. Сейчас старый вывод можно скорректировать — на самом деле Maya умеет неплохо использовать много потоков вычисления, но плохо относится к мультисокетным системам. Очень может быть, что связано это с конфигурацией системы памяти, т. е. рендер-движок не может разбить задачу на действительно независимые части. Соответственно, полностью загружается работой один процессор, а второй частично простаивает, в результате чего результат двух Xeon X5672 оказывается лишь незначительно лучшим, чем у одного Core i7-970. Но лучшим, т. е. даже распределенные по двум сокетам восемь ядер более чем сравнимы с шестью при близких частотах (у i7-970 немного менее агрессивный буст-режим, а вот стартовая частота вообще одинаковая). Чего, естественно, недостаточно уже, чтобы обогнать хотя бы более высокочастотный Core i7-990X той же архитектуры, не говоря уже о нынешнем настольном топе. А одинаковым с последним общий результат оказался за счет выигрыша в VRay и Lightwave, таких проблем не имеющих.

Т. е., как видим, даже такая вроде бы идеальная для многопроцессорных систем задача, как рендеринг, имеет свои особенности. Что, однако, не отменяет полезность рендер-серверов даже для Maya — ведь если бы у нас просчитывался не один проект, а хотя бы два независимых, положение бы изменилось радикально.

Зато здесь организация теста такова, что параллелизм почти идеальный. Обогнать i7-2600 вдвое не удалось, поскольку особенности архитектуры тоже сказываются — 3960Х заметно быстрее 990Х, но приблизились к тому мы максимально близко. Да и ничего удивительного здесь нет — кодирование каждого из файлов никак не зависит от остальных, а одновременно их обрабатывается столько, сколько аппаратных потоков вычисления поддерживается.

Еще одна идеальная для многопроцессорных систем сфера применения. Причем, как нам кажется, здесь сказалось не только количество потоков, но и кэш-память, к которой сильно неравнодушны компиляторы (пара Х5672 имеет на двоих аж 24 МиБ), да и два независимых контроллера памяти способны иногда работать лучше, чем один более быстрый.

А вот с кодированием видео не вышло ничего хорошего. По ряду причин: кроме «чистых» кодеков есть у нас тут и программы высокого уровня (где не на всех стадиях можно добиться высокого параллелизма); зависимость по данным; где-то и просто неспособность «переварить» слишком высокое количество потоков… и т. д. и т. п. А где-то — все поименованное сразу. И наиболее важным, пожалуй, тут оказывается не то, что пара X5672 по совокупности чуть-чуть уступила даже i7-990X, а то, что она во всех подтестах медленнее, чем i7-3960X. Даже в чистом кодировании силами x264, который очень уж хорошо относится к Sandy Bridge и хуже — к предыдущим архитектурам :)

Собирательная группа, созданная дабы не пропадали результаты некоторых интересных подтестов, обычно заключенных в «малопоточное окружение». Впрочем, если посмотреть подробные результаты, то интересными оказываются только упаковка в 7-Zip и распознавание тестов в FineReader (а чем, собственно, не офис), где пара Xeon оказалась безоговорочным лидером. Во всех остальных случаях проигрыш новому экстремалу (а иногда и не только ему), что и приводит к закономерному общему итогу.

Java-машина любит потоки вычисления, но не менее того она любит хорошие микроархитектуры, так что нет ничего удивительного в том, что один современный шестиядерный процессор демонстрирует производительность как у пары менее современных четырехъядерных. А вот шестиядерник из своего поколения, как и следовало ожидать, оная пара обгоняет практически пропорционально количеству ядер.

И вновь мы обращаемся к одному из «экспериментальных» тестов методики, поскольку он как нельзя лучше подходит для тестирования двухпроцессорных систем — задач много и все они друг от друга не зависят. Хотя результаты нельзя назвать слишком уж высокими: одиночный Core i7-2600, конечно, удалось обогнать в полтора раза, что не так уж и плохо, однако перевес над шестиядерными процессорами невелик. Виной тому, как нам кажется, слишком высокая удельная производительность каждого из ядер современных процессоров Intel: чем она выше, тем, очевидно, ниже степень одновременной загрузки: пока там дело дойдет до последних задач, запущенные первыми уже успеют частично закончится. В общем, как не старайся, а потребность в очень большом количестве яде…

Источник: http://www.ixbt.com


Google Bookmarks Digg Reddit del.icio.us Ma.gnolia Technorati Slashdot Yahoo My Web News2.ru БобрДобр.ru RUmarkz Ваау! Memori.ru rucity.com МоёМесто.ru Mister Wong

20 Фев 2012 г.  
Теги:

Оставить комментарий


  • Рубрики

    • Курьезные новости
    • Позитивные новости
  • Архивы

    • Май 2012
    • Апрель 2012
    • Март 2012
    • Февраль 2012
    • Январь 2012
    • Декабрь 2011
    • Ноябрь 2011
    • Октябрь 2011
    • Сентябрь 2011
    • Август 2011
    • Июль 2011
    • Июнь 2011
    • Май 2011
    • Апрель 2011
    • Март 2011
    • Февраль 2011
  • Свежие записи

    • Живой Журнал Шевцова А. Конечно, н. - Решать проблемы ЖКХ…
    • Янукович заметил позитивную динамику роста зарплат Новости мировой экономики, финансов, налицо фондовых рынков
    • MGDC.ru - Pick a Piggy – самая позитивная игра по мнению экспертов FlashGamm!
    • Акция в Николаеве: многие ВИЧ-позитивные по-прежнему сильно терпят на себе издевательства со стороны окружающих :: Новости N - просто-таки Николаевские новости
    • Маммопластика безопасная операция для вашего тела
    • Вьетнамцы пытались провезти через таможню Кольцово редких черепах
    • Словацкая сенсация, девять секунд и
    • Победа под свист
    • ФК ПИТЕР - Русь 4:0
    • Александр Цекало: “После пародии в “Большой разнице” Лобода очень обиделась”
  • Админ-панель

    • Вход
    • Публикации RSS
    • Комментарии RSS
  • Счетчики

  • Спонсоры:


Все права защищены © 2012 НеТупи:) . . . . . . .