Top-office11.ru

IT и мир ПК
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Индекс производительности видеокарты по версии Futuremark

Индекс производительности видеокарты по версии Futuremark

На смену устаревшей серии GTX10 и дефицитной RTX30 пришли наследницы серии Quadro — GPU NVIDIA RTX A4000 и А5000 на базе текущей архитектуры Ampere, которые были анонсированы в апреле 2021 года. Инженеры HOSTKEY сравнили эффективность использования новых ускорителей в GPU-серверах на различных типах нагрузок.

Ampere использует 8-нм техпроцесс от Samsung и поддерживает высокоскоростную память HBM2 и GDDR6(X). GDDR6X является шестым поколением памяти DDR SDRAM и может достигать скорости до 21 Гбит/с. В А5000 и А4000 NVIDIA использует ядра RT 2-го поколения и тензорные ядра 3-го поколения, позволяющие обеспечить двукратный прирост производительности по сравнению со старыми ядрами Turing. Новинки используют стандарт PCIe 4.0, что позволяет убрать узкие места при обмене данными с GPU.

В Ampere используется новая версия CUDA 8+. На чипе теперь есть два потоковых мультипроцессора, что обеспечивает значительный рост производительности FP32-вычислений по сравнению с картами на базе Turing. Старшие GPU A5000 и выше поддерживают NVLink 3.0 для попарного объединения карт, что это приводит к кратному увеличению производительности.

Технические характеристики видеокарт NVIDIA RTX A4000 и RTX A5000, RTX 3090, Quadro RTX 4000

На новых картах куда больше памяти, это позволяет эффективно работать с нейросетями и изображениями. Другим существенным отличием RTX A4000 и RTX A5000 является аппаратное ускорение размытия движения, позволяющее значительно сократить время и затраты на при рендеринге.

NVIDIAQuadro RTX 4000GTX 1080 TIRTX A4000RTX A5000RTX 3090
АрхитектураTuringPascalAmpereAmpereAmpere
Техпроцесс, нм1216888
Графический процессорTU104GP102GA102GA104GA102
Количество транзисторов, млрд шт.11,813,617,428,328,3
Пропускная способность памяти, Гбайт/с416484448768936,2
Разрядность шины памяти, бит256352256384384
Тип памятиGDDR6GDDR5XGDDR6GDDR6GDDR6X
Объём памяти, Гбайт811162424
ECC-памятьнетнетдаданет
Ядра CUDA, шт.230435846144819210496
Тензорные ядра, шт.288нет192256328
Ядра RT, шт.36нет486482
FP32, Тфлопс7,111,3419,227,835,6
RT, ТфлопсН/Днет37,454,269,5
Tensor, Тфлопс57нет153,4222,2285
Макс. мощность, Вт160 Вт250 Вт140 Вт230 Вт350 Вт
ИнтерфейсPCIe 3.0 x16PCIe 3.0 x16PCIe 4.0 x16PCIe 4.0 x16PCIe 4.0 x16
Форм-фактор1 слот2 слота1 слот2 слота2-3 слота
Поддержка vGPUнетнетнетполнаяограниченная
NVLinkнетнетнет2×GPU2×GPU
Версия CUDA7.56.18.68.68.6
Поддержка VULKANестьестьестьестьесть
Цена (руб.)115 00066 000125 000190 000215 000

В старших картах от RTX A5000 есть поддержка vGPU и NVIDIA RTX vWS, что позволяет обеспечить совместное использование вычислительных ресурсов и виртуальных GPU несколькими пользователями. В среднем новые видеокарты NVIDIA обгоняют по производительности старую линейку Quadro в 1,5–2 раза и потребляют меньше электричества.

Тестирование HOSTKEY

Инженеры компании HOSTKEY провели собственное тестирование профессиональных видеокарт NVIDIA RTX A5000 и A4000 и сравнили их с RTX 3090 и Quadro RTX 4000 — представителем предыдущего поколения профессиональных видеокарт компании NVIDIA. Для тестов использовалась система следующей конфигурации:

  • Процессор OctaCore Intel Xeon E-2288G, 3,5 ГГц
  • 32 Гбайт DDR4-3200 ECC DDR4 SDRAM 1600 МГц
  • Samsung SSD 980 PRO 1Tбайт (1000 GB, PCI-E 4.0 x4)
  • Серверная материнская плата ASUS P11C-I Series (1 PCI-E x16, 1 M.2, 2 DDR4 DIMM, 2x Gigabit LAN + IPMI)
  • Microsoft Windows 10 Professional 64-бит.

Tест V-Ray GPU RT

Tест V-Ray GPU RTX

Тест V-Ray GPU CUDA

Тесты V-Ray GPU CUDA и RTX позволяют измерить относительную производительность GPU при рендеринге. GPU RTX A4000 и RTX A5000 значительно превосходят по производительности Quadro RTX 4000 и GeForce GTX 1080 Ti (тест V-Ray GPU RTX на этой карте провести невозможно, т.к. она не поддерживает технологию RTX), но уступают RTX 3090, что объясняется высокой пропускной способностью памяти (936,2 Гбайт/с против 768 Гбайт/с у RTX A5000) и количеством потоковых процессоров (10496 против 8192 у RTX A5000).

«Собаки против кошек»

Для сравнения производительности GPU для нейросетей был использован набор данных «Собаки против кошек» — тест анализирует содержимое фотографии и различает изображена на фото кошка или собака. Все необходимые исходные данные находятся здесь. Также этот тест был выполнен на разных GPU в различных облачных сервисах. Получены следующие результаты:

Полный цикл обучения

Полный цикл обучения

Полный цикл обучения тесовой нейросети занял от 5 до 30 мин. Результат NVIDIA RTX A5000 и A4000 составил 07:30 и 9:10 минут соответственно. Быстрее единичных NVIDIA RTX A5000 и A4000 работал только GPU-сервер с восемью картами GeForce RTX 2080Ti и с энергопотреблением около 2 кВт·ч. Видеокарты Tesla V100 прошлого поколения доступны в сервисах Google Cloud Compute Engine, Microsoft Azure и Amazon Web Services и показали наилучший результат из протестированных там карт.

Читать еще:  Как выйти из почты Яндекс

Сколько стоит обучить нейросеть в разных местах?

На графике представлена стоимость обучения модели с использованием различных сервисов для следующих конфигураций:

  • AWS — AWS p3.2xlarge
  • Google Cloud — GCP Compute Engine
  • Microsoft Azure — Tesla V100
  • HOSTKEY — RTX А4000, RTX A5000

Заключение

Новые профессиональные видеокарты NVIDIA RTX A5000 и A4000 являются оптимальным решением для использования в GPU-серверах и позволяют выполнять сложные вычисления, производя быструю обработку больших массивов данных. Переход на новую архитектуру Ampere позволил значительно увеличить производительность новых профессиональных видеокарт NVIDIA. Улучшенные тензорные ядра и ядра RT значительно улучшают качество и возможности трассировки лучей в реальном времени.

Объем памяти в 16 Гбайт у NVIDIA RTX A4000 и 24 Гбайт у RTX A5000 позволяет обрабатывать большие массивы данных, а мост NVLink для A5000 объединяет две карты в одну, что даёт доступ уже к 48 Гбайт высокопроизводительной памяти. Что важно, лицензия на драйверы NVIDIA для профессиональных GPU (в отличие от игровых видеокарт) никак не ограничивает их использование в центрах обработки данных.

HOSTKEY рекомендует использовать современные выделенные и виртуальные GPU-серверы для рендеринга, транскодинга видео, обучения нейросетей и обработки данных уже обученными сетями. Если есть стабильный большой объем данных для обработки, аренда выделенных GPU-серверов может на порядок повысить скорость их обработки за те же деньги или позволит существенно сократить затраты на формирование собственной инфраструктуры.

Пока что HOSTKEY предоставляет GPU-серверы на базе помесячной оплаты, но в ближайшее время все эти машины будут доступны и в режиме почасовой оплаты с полной автоматизацией их предоставления клиенту при заказе через API. Кроме того, новые серверы с профессиональными картами RTX A5000 и A4000 доступны теперь не только в Нидерландах, но и в Москве.

HOSTKEY — динамично развивающийся хостинг-провайдер, который более 10 лет оказывает услуги по размещению и аренде серверов, проектированию и внедрению частных облаков, лизингу и обслуживанию оборудования. HOSTKEY предоставляет серверы в аренду в дата-центрах категории TIER III в Европе, США и России, а также оказывает услуги проектирования, запуска и поддержки приватных облаков, поддержки серверов в любых дата-центрах в Нидерландах. Компания работает как с корпоративными клиентами, так и с частными лицами.

ТОП-3 лучших бенчмарк-программы для ГП

FutureMark Suite

FutureMark Suite — бенчмарк-программа для графических ускорителей действительно «крупного калибра». Верно, она является частью дорогостоящего 3DMark, тем не менее непосредственно сам FutureMark полностью бесплатен. Разумеется, без 3DMark вы лишаетесь множества крутых функций, но для бенчмарка видеокарты хватит и того, что есть. Внимание! FutureMark Suite включает в себя бенчмарки на DirectX 12, что важно для многих современных компьютеров.

MSI Afterburner

MSI Afterburner — самым популярный выбор среди геймеров, которые хотят не только провести бенчмарк своей видеокарты, но и немного подразогнать ее. Программа далеко не новая — ее успели проверить на деле миллионы пользователей по всему миру! И не переживайте о том, что у вас видеокарта не от MSI: утилита является универсальной и подходит под ГП всех производителей.

GPU-Z — двоюродный брат CPU-Z. Удивительно, но GPU-Z был разработан совершенно иными разработчиками, несмотря на визуальное сходство. Название видеокарты, технологический процесс, количество транзисторов, разрядность шины и многое другое — вот что вам будет доступно в GPU-Z.

Ну и, понятное дело, у программы есть своя функция бенчмарка. Более того, GPU-Z способен создавать резервную копию BIOS видеокарты, что будет полезно для всех пользователей, которые любят копаться в настройках своего ГП. Как все другие утилиты в списке, GPU-Z универсален и подходит для видеокарт от NVIDIA, AMD и Intel.

№9 — AMD RX 5700XT

  • Цена: 58 000 рублей
  • Хэшрейт: 56.5 МХ в секунду

Видеокарта была выпущена в июле 2019 года и обладает очень высоким майнерским потенциалом. При среднем энергопотреблении 130 Вт она показывает высокую доходность, принося в день около 420 рублей при майнинге эфира. Срок окупаемости при таком ежедневном профите мизерный — всего лишь 139 дней.

Еще одной фишкой AMD RX 5700XT стоит считать тот факт, что она построена на абсолютно новой архитектуре, чьи возможности в майнинге пока изучены не до конца. Поэтому есть все шансы, что в будущем она сможет приносить еще больше дохода. В отзывах покупатели хвалят температуру видеокарты — греется во время добычи она куда меньше коллег по ценовому сегменту.

Производительность

На производительность видеокарты влияет множество параметров, поэтому при выборе проще ориентироваться на то, к какой серии компания-производитель относит тот или иной графический адаптер.

nVidia сейчас выпускает бюджетную серию GTX и «продвинутую» линейку RTX.

Внутри каждой из линеек можно смотреть на цифровые индексы: чем индекс больше, тем видеокарта мощнее.

Читать еще:  Где и как скачать драйвера для веб-камеры A4tech

У AMD все несколько сложнее. Она сейчас выпускает несколько серий графических процессоров, которые не выстраиваются в какую-либо четкую иерархию.

Самая последняя обновленная линейка от этого производителя — RX c «пятитысячными» индексами, например, AMD Radeon 5500 и AMD Radeon 5700

Бюджетные

Ее возможностей достаточно, чтобы воспроизводить графикку с разрешением Full HD (1920×1080 пикселей) со средними и в некоторых случаях высокими настройками.

Средние

Решения среднего класса, справляющиеся с обработкой графики с разрешением Full HD или 2K, — это, в частности.

Продвинутые

Для топового геймерского компьютера, который должен воспроизводить графику с максимальными настройками в разрешении 4K, подойдут.

Заключение о рейтинге видеокарт

Хотя есть несколько карт, которые могут работать на том же уровне, что и некоторые карты из нашего списка видеокарт, они были исключены по определенной причине. Как упоминалось ранее, были включены только два последних поколения графических процессоров AMD и Nvidia. Это означает, что вы не найдете карт старше 5-го поколения GCN и Pascal.

Эта иерархия была основана на внешних источниках для справок о производительности, таких как Tom's Hardware и графическая оценка 3DMark Time Spy.

Данный список может быть изменен, так как новейшие архитектуры графических процессоров AMD и Nvidia, RDNA 2 и Ampere, все активнее поступают в продажу.

Где показатель FPS будет выше – в Nvidia или AMD

Стоит сказать, что и без того внушительный разрыв производительности между рассматриваемыми позициями продолжает увеличиваться. И не последнюю роль в этом вопросе сыграло внедрение новых технологий разработчиками Nvidia. Среди них – DLSS, с помощью которой удалось увеличить количество FPS. Обеспечить такой результат разработчики смогли посредством применения лучевой трассировки и внедрения искусственно-интеллектуальных технологий.

И, в частности, речь шла о машинном обучении, позволяющем снижать транслируемое разрешение 4K в 2K с последующей его обратной адаптацией, хотя в скором времени разработчикам пришлось усовершенствовать инновационную технологию. В итоге новый подход дал отличный результат, позволив увеличить FPS на целых 30-40%, причем без какого-либо ущерба для качества изображения, воссоздаваемого из 2K в 4K.

В то же время, не обошлось без ложки дегтя и в этой бочке меда, ведь игр, которые могли бы поддерживать новый DLSS, не так уж много. Конечно, высока вероятность того, что стремительно растущая популярность уникальной технологии рано или поздно сделает свое дело и все большее количество разработчиков будет представлять совместимую игровую продукцию, но пока эффект трассировки лучей могут оценить единицы.

Сравнение

Возвращаясь к AMD, стоит отметить, что такие перспективы главного конкурента приобретают для компании угрожающий характер. Причиной тому являются устаревшие технологии, используемые для производства видеокарт этого производителя, который так и не начал применять трассировку лучей, продолжая временить с интеграцией ИИ. А, как известно, без последней о качественном рендеринге изображения в режиме реального времени не может быть и речи, что делает разрыв между AMD и Nvidia еще более существенным.

Возможно, все изменится в ближайшей перспективе и AMD все-таки решится на прорыв? Конечно, бывает всякое, но судя по последним тенденциям, производитель решил довольствоваться той нишей, которую ему доводится занимать в настоящее время, уступая пальму первенства королевским Nvidia.

Скачать Furmark на русском языке

ФурМарк подходит для тестирования стабильности и мощности ГП. Поставляется вместе с дополнительными инструментами, которые могут работать независимо от основного софта.

  • Измеряет температуру графического процессора вовремя бенчмарка и стресс-теста.
  • Есть возможность выгрузить результаты в текстовый документ, опубликовать на странице разработчика.
  • Поддерживает многопроходный алгоритм рендеринга.
  • Несколько пресетов проведения тестов.
  • Может быть запущена из командной строки.
  • Возможность создания пользовательского пресета.

Установка

Утилита не требует регистрации и распространяется бесплатно. Чтобы установить ПО на компьютер, сперва нужно скачать FurMark. После загрузки дистрибутива выполните следующие действия:

  1. Запустите инсталляционный пакет от имени администратора.
  2. Ознакомьтесь с лицензионным соглашением и нажмите «Next».
  3. Укажите путь к папке, в которую будет установлен софт. Пропишите его вручную или выберите через кнопку «Browse». Нажмите «Next», чтобы перейти на следующий этап.
  4. Чтобы создать ярлыки быстрого доступа, поставьте галочки напротив соответствующих пунктов и нажмите «Next».

Когда файлы будут распакованы на ПК, мастер установки предложит сразу запустить ФурМарк и перейти на официальный сайт, чтобы ознакомиться со свежими новостями об изменениях.

Доступные профили

Профили программы Furmark

Программное обеспечение позволяет узнать реальную мощность ГП через тестирование стабильности и напряжения. Всего есть два режима работы:

  1. GPU stress test. Максимальная нагрузка на графический процессор с использованием алгоритма наложения фреймов. Подходит для прогрева и анализа стабильности видеокарты.
  2. GPU benchmarks. Анализ производительности с четырьмя предустановленными пресетами, каждый из которых оптимизирован под работу с мониторами определенного разрешения (4K/UHD, QHD, FHD, 720) и профиль «Custom preset» с пользовательскими настройками.

Все тесты запускаются и останавливаются вручную. Через меню «Settings» устанавливаются дополнительные параметры (максимальная продолжительность, критическое значение температуры, параметры 3D и т.д.).

Дополнительные инструменты

По умолчанию вместе с ФМ устанавливаются бесплатные утилиты, которые отображают основную техническую информацию о компьютере. Рассмотрим их более подробно:

  • GPU-Z. Получает сведения о процессоре, материнской плате, оперативной памяти, видеокарте. Позволяет создавать и публиковать подробные отчеты на сайте разработчика.
    GPU-Z отображение технических характеристик графического процессора и его видеопамяти.
  • CPU burner. После запуска максимально нагружает CPU. Реакцию системы можно отслеживать через встроенные средства или сторонний софт.Утилита CPU burner
  • GPU Shark. Показывает скорость вращения кулеров, текущую степень перегрева, уровень загруженности видеосистемы и ряд других значений. Подходит для одновременного мониторинга нескольких комплектующих. Утилита GPU Shark
Читать еще:  Как в Одноклассниках добавить друзей?

База данных тестирования

Функция «Compare your score» позволяет ознакомиться с результатами тестирования других пользователей FurMark.

Compare your score

При переходе по данной ссылке открывается страница на официальном сайте разработчиков, на которой представлены некоторые данные о тестах видеокарт в разных пресетах бенчмарков.

Результат тестирования видеокарт

Вторая ссылка ведет непосредственно на страницу базы данных.

База данных GPU

Описанные инструменты не требуют специальной настройки и могут работать независимо от ФурМарк. После первого запуска пользователю будет предложено создать ярлыки быстрого доступа на рабочем столе и в меню «Пуск».

Как пользоваться программой

Сразу после запуска ФМ, софт автоматически определяет подключенные к ПК устройства, поэтому отдельно выбирать их не придется. Они появятся в порядке приоритета (если есть несколько комплектующих).

FurMark – как пользоваться утилитой и начать бенчмарк:

Предупреждение

  1. Убедитесь, что напротив в верхней части программы, в самом начале списка, стоит нужная модель видеокарты. Рядом должна отображаться текущая температура ГП.
  2. Измените основные параметры (оконный или полноэкранный вид, разрешение, сглаживание) и через блок «GPU benchmarks» выберите профиль. Либо используйте «GPU stress test», если хотите полностью нагрузить видеокарту.
  3. Появится предупреждение, что выполнение операции может серьезно навредить системе, а при неправильной настройке повлечь за собой полную поломку графического адаптера. Нажмите «GO!», чтобы приступить к проведению бенчмарка. Чтобы уведомление больше не появлялось, уберите галочку напротив пункта «Display this warning message».
  1. Начнется рендеринг изображения. Запускать в это время на ПК другие приложения не рекомендуется. На этом этапе главное следить за перегревом графического процессора. Если показатель начнет приближаться к критической отметке, то бенчмарк следует отменить. В противном случае карта просто сгорит.

За результатами можно следить в режиме реального времени. По желанию их можно выгрузить в документ с подробной информацией.

Окно процесса рендеринга.

  1. Скачайте последнюю версию драйвера видеокарты и других комплектующих с официального сайта производителя.
  2. В параметрах 3D установите нужный видеоадаптер в качестве карты по умолчанию (через панель управления NVIDIA, AMD или настройки графики Intel).

Перезагрузите компьютер, чтобы изменения вступили в силу. После этого карта появится в списке доступных.

  1. Откройте «Settings».
  2. Найдите строчку «Benchmark duration (ms)».
  3. Установите нужное значение в миллисекундах.
  4. Подтвердите внесение изменений и нажмите «OK».

Стресс тест видеокарты не ограничивается по времени и отключается вручную. Поэтому требует обязательного присутствия пользователя.

  • Обновите или полностью переустановите FM.
  • Проверьте наличие новых драйверов для ГП. При необходимости установите их с официальной страницы производителя.
  • Убедитесь, что видеокарта поддерживает OpenGL.
  • Запустите программное обеспечение от имени администратора.
  • Проверьте, сохраняется ли информация о температуре в log файл. Чтобы программа записывала результаты в отдельный документ, в «Settings» отметьте пункт «Log GPU data».

Если решить проблему не удается, то осуществляйте мониторинг за показателями вручную, через встроенные средства или любой аналогичный софт.

Если вы являетесь обладателем графического процессора NVIDIA, то на Википедии вы можете ознакомиться с основной информацией ГП «НВИДИА» серии GeForce и по сравнительной таблице сверить результаты Фурмарка.

Аналоги

Помимо ФурМарк существуют и другие утилиты для проведения бенчмарков. Они подходят для комплексной или выборочной диагностики. Рассмотрим самые популярные:

  • 3DMark от Futuremark. Наиболее известный софт общего тестирования производительности компьютера. Подходит для оценки игровых возможностей дискретной или интегрированной карты и бенчмарка центрального процессора.
  • PhysX FluidMark. Бенчмарк графических процессоров с поддержкой OpenGL. Как видно из названия, софт использует API ускорение физики NVIDIA PhysX. Позволяет измерить быстродействие ПК через симуляцию движения жидкости. Основная нагрузка на видеокарту и центральный процессор (при отсутствии поддержки PhysX).
  • Heaven Benchmark от компании Unigine. Одна из немногих утилит со встроенной поддержкой стереорежимов, в том числе NVIDIA 3D Vision. Бенчмарк осуществляется через тесселяцию (усложнение геометрии объектов).

Это далеко не все программы для общей оценки производительности компьютера или отдельных его комплектующих. Результаты уже готовых бенчмарков для популярных моделей ГП публикуются пользователями на официальных сайтах разработчиков.

По многочисленным отзывам опытных пользователей компьютеров, данный софт превосходит аналогичные и является лидером среди них. Так как он наиболее точно задает параметры проверки и выдаёт верные результаты тестирования, что играет не малую роль в проверке видеочипа.

FurMark — полезный инструмент оценки возможностей графического адаптера. Скачать последнюю версию Фурмарк вы можете с нашего сайта совершенно бесплатно. Этот софт позволяет проводить полноценные стресс-тесты для оборудования и осуществлять удобный мониторинг за его состоянием. Может использоваться для проверки работы видеокарты после разгона и других целей.

Ссылка на основную публикацию
Adblock
detector