A era da computação heterogênea está começando

Esta semana a AMD apresentou na Computex 2010 uma demonstração de uma APU Fusion Ontário em funcionamento. Além disso, foi mostrado o Waffer que contém esse novos processadores. AMD Fusion e Intel Sandy-Bridge marcam o início da era da Computação Heterogênea.


Com base nessa imagem, já foi possível estimar o tamanho do chip da APU Fusion Ontário, que é o AMD Fusion direcionado ao mercado de netbooks, e a estimativa é de que um chip AMD Ontário tenha uma área de aproximadamente 80 milímetros quadrados.  Em termos comparativos, uma CPU Intel Atom da série Pineview, gravado em 45nm e com dois núcleos de processamento tem uma área de chip de 86,6 milímetros quadrados.


A APU Fusion Ontário disporá de dois núcleos de processamento X86 baseado no núcleo BobCat, e também uma GPU integrada com compatibilidade à API DirectX11, sendo um processador com baixa dissipação energética.


Os prognósticos de performance apontam que a APU Fusion Ontário com núcleo Bobcat e SIMD (GPU) compatível com a API DX11 tenha uma performance superior à mostrada pelo Intel Atom, porém, consumindo menos energia, em função do tamanho reduzido da área de silício e também pelo uso de novos sistemas internos de gerenciamento de energia.


APU Fusion Llano

Já o Llano será um processador da série Fusion porém destinado aos desktops e também para o mercado de notebooks, dispondo de uma CPU de quatro núcleos e ainda uma GPU da série Evergreen. Essa GPU é indicada nos esquemas como um núcleo SIMD (SIMD Engine Array) , e tem uma área estimada de chip de 170 milímetros quadrados.



A imagem abaixo mostra uma comparação entre tamanho da APU Fusion Llano com uma CPU atual núcleo Propus, que é a usada nos processador AMD Athlon II X4 com quatro núcleos de processamento. Como fica evidenciado, a APU Llano, com quatro núcleos de processamento x86 e mais o núcleo SIMD (GPU) gravados em 32nm tem uma área menor que uma CPU Athlon II X4 gravada em 45nm.


Banda de memória 

Um dos aspectos que ainda são obscuros nessa nova arquitetura da AMD é o relacionado à banda de memória. Sabe-se que uma GPU é uma arquitetura que demanda muito mais banda de memória que uma CPU, e existem dúvidas se o sub-sistema de comunicação entre o controlador de memória integrado e os núcleos de CPU e GPU (SIMD) não será um fator limitador de performance.

A Intel e a AMD estão usando abordagens diferentes em seus chips integrados CPU + GPU. A Intel coloca no Sandy-Bridge um cache L3 de baixa latência e tamanho de 8MB compartilhado entre os núcleos de CPU e a GPU.

Já o projeto da AMD não prevê cache L3, sendo que a comunicação entre os núcleos de CPU e SIMD (GPU) será feita pelo link HT que interliga o controlador de memória e os núcleos de processamento x86 e SIMD (GPU). Além disso, o cache de nível L2, segundo algumas especulações, será compartilhado.

A computação heterogênea na visão da AMD

A AMD já vem apresentado há algum tempo a sua visão de computação heterogênea, e que emprega processamento de CPU e GPU. Na visão da AMD, as possibilidades de elevação de performance em CPU com processadores x86 de múltiplos núcleos está se esgotando, sendo necessária a adoção de uma nova abordagem (heterogênea).


O slide acima mostra o que, na visão da AMD, são as três eras na área de computação. A primeira "era" foi caracterizada pelo processamento em único núcleo. Os processadores de núcleo único foram evoluindo até que se tornaram muito complexos e também tiveram sua evolução limitada por questões relativas a dissipação energética.

Para ultrapassar esses problemas da arquitetura single-core, tanto Intel quanto AMD iniciaram a era Multi-Core, na qual os processadores recebiam mais de um núcleo de processamento. Atualmente temos o AMD Opteron Magny-Cours com 12 núcleos de processamento. 

Esse processo de adição de mais núcleos de processamento está chegando, segundo a AMD, no limite em que novos avanços não irão se traduzir em ganhos de performance, em decorrência fatores como dissipação energética, ausência de aplicações que estejam otimizadas para tirar proveito dos múltiplos núcleos dos processadores modernos.

A era da computação heterogênea está se iniciando agora, com a iminência de lançamento dos processadores AMD Fusion e Intel Sandy-Bridge. Como mostrado no slide acima, ainda há um espaço enorme de ganhos de performance nesse tipo de processador.

Entretanto, o que limitará temporariamente seu nível de performance serão problemas de comunicação entre os subsistemas (o que falamos acima sobre a limitação da banda de memória) e também modelos de programação que ainda estão vinculados ao paradigma anterior.

Esse problema de modelos de programação e de desenvolvimento para processadores híbridos CPU + SIMD (GPU) é o foco do Fundo de Investimento Fusion, que foi lançado também esta semana na Computex 2010.


Conclusão

Intel e AMD estão adotando abordagens diferentes nas arquiteturas dos próximos processadores híbridos Fusion e Sandy-Bridge. A Intel confia nas instruções AVX e em um enorme cache L3 compartilhado entre núcleos de CPU e GPU.

Já a AMD ainda não explicitou como irá resolver o problema de limitação de banda de memória nas APU Fusion. Além disso, a AMD ainda não divulgou se a APU Fusion disporá ou não de instruções AVX, as quais prometem elevar de forma significativa o processamento de gráficos e conteúdo multimídia.

Nesse contexto não se pode descartar também a nVidia. Há também nesse aspecto visões diferentes entre Intel, AMD e nVidia sobre a computação heterogênea. A visão da nVidia é de que o processamento será feito quase que totalmente pela GPU. Já a AMD tem uma visão menos radical, dando muita importância para os núcleos SIMD (GPU), porém considerando os núcleos x86 tão importantes quanto.

E, por fim, a visão da Intel, que é a mais conservadora de todas, e aponta para a supremacia do processamento em núcleos x86, com um papel secundário - porém importante - dos processadores gráficos.

Qual visão irá prevalecer na prática ainda é uma incógnita, mas, se o ditado segundo o qual a "virtude está no meio" ainda é válido, então a visão intermediária da AMD despontaria como a mais precisa.

Comentários