Видео карты - статьи


Инновации, инновации - часть 2


Еще одна важная особенность новой архитектуры — динамическое разделение (dynamic branching). Принцип работы этого механизма состоит в оптимизации диапазона обработки модифицируемых пикселей. В те моменты, когда определенные пиксели не должны обрабатываться, они, благодаря подсчетам, проведенным программой оттенения, пропускаются. Работа над пикселями разделяется процессором UTDP на сотни потоков, состоящих из маленьких блоков размером 4х4 пикселя. Эти точки могут выполнять тот же код оттенения. В тот момент, когда чип UDTP определяет, что он не полностью загружен (закончил задачу или ожидает данные), начинается определение новых задач для выполнения. Во время ожидания новых заданий модули ALU заполняются новыми потоками для выполнения. Каждый из процессоров оттенения Radeon X1800 за один такт может выполнять до двух векторных и скалярных операций. В итоге Radeon X1800 может выполнять до шести инструкций оттенения за один такт на 16 пикселях одновременно.

Восемь модулей обработки геометрии в свою очередь могут обрабатывать одной 128-битной векторной инструкцией и одной 32-битной скалярной за каждый такт. Эти модули поддерживают также функции динамического контроля инструкций, то есть зависимостей и циклов. Оттенение пикселей и вершин производится со 128-битной точностью.

Еще одним нововведением, очень важным с точки зрения производительности карты, стал новый контроллер памяти. Он создан на базе двух окружностей, данные по которым двигаются в противоположных направлениях, что позволяет сократить время задержек к данным. В центре "округлости" находится контроллер памяти, вокруг которого помещен перекрестный коммутатор, связанный, в том числе, и с восемью клиентами. Те же, в свою очередь, могут связываться через указанный коммутатор как с 256-битной внешней шиной данных, так и главным контроллером памяти. В тот момент, когда один из восьми клиентов выдает задание контроллеру памяти, данные, "бегающие" по окружностям, перехватываются ближайшим так называемым Ring Stop (всего их четыре). Что интересно, контроллер памяти программируется, так что они могут быть усовершенствованы с выходом очередных версий драйверов.

Это тем более важно, что этот контроллер поддерживает также и механизм установки важности, которые могут вноситься в код программистами. В результате каждый программист может написать код программы таким образом, чтобы он был максимально оптимизирован под новые карты ATI. По сравнению с моделью серии Х850 контроллер памяти был основательно переработан также и по количеству каналов. У карты-предшественницы было четыре 64-битных канала памяти, связывающихся с четырьмя банками модулей памяти. В версии Х1800 — восемь 32-битных каналов и 8 восемь новых модулей памяти. Благодаря такому "упорядочению" улучшается общий доступ к памяти. Оптимизации подверглась и кэш-память — теперь она может назначаться в любом месте во внутренней памяти графического адаптера.




Начало  Назад  Вперед



Книжный магазин