Nuevas arquitecturas de computador para la industria del entretenimiento

Con la introducción de las familias de estaciones de trabajo O2 y OCTANE, Silicon Graphics ha definido la arquitectura para la nueva generación de visualización de escritorio. Estos  nuevos sistemas de gran ancho de banda y baja latencia permite a los usuarios realizar tareas nunca antes posibles en computadores de escritorio. Las tendencias futuras de la industria del entrenenimiento exigirán capacidades tales como edición descomprimida no lineal y animaciones extremadamente complejas, ricas en secuencias 3D. Estas nuevas arquitecturas serán los vehículos para entregar capacidades excepcionales a profesionales creativos, permitiendo que realicen tareas complejas con facilidad. 
 

Las limitaciones de una arquitectura tradicional de computador

La tecnología de los microprocesadores ha experimentado un notable y constante aumento en  funcionamiento durante la década pasada. Aproximadamente cada cinco años hemos visto un aumento por 10 en el poder del procesador. En el mismo tiempo, las mejoras en ancho de banda convencional del sistema han aumentado mucho más lento, por 2 cada cuatro años. La brecha cada vez mayor entre el funcionamiento del microprocesador y el anchuro de banda del sistema se ilustra en el cuadro 1. El resultado de esta brecha del funcionamiento es que la velocidad y la interactividad de la aplicación del usuario final es limitada no por el procesador o la capacidad del acelerador de gráficos de procesar, sino por la capacidad del sistema de manejar cantidades grandes de movimiento de datos. Muchos de los procesadores pertenecientes a la actual generación de aceleradores gráficos tienen métricas de funcionamiento independiente impresionantes, pero el funcionamiento de estos dispositivos en un sistema de bajo ancho de banda deja a los usuarios con una sensación de bajo rendimiento. 

Figura Nº 1: La brecha cada vez mayor entre los 

      procesadores y los buses de sistema

[Relative/Performance Chart] 

Un bus compartido ha estado en el corazón de las arquitecturas de computador tradicionales desde la introducción de los primeros computadores en la universidad de Chicago en los años 50. El bus compartido tiene dos desventajas primarias. La primera es velocidad sin procesar. El acercamiento a aumentar la velocidad del bus tradicional ha sido aumentar el número de las líneas de datos a partir de 8 a 16-bits y entonces a partir de 32 a 64-bits. El paso de progresión lógico siguiente sería alcanzar 128-bits. El problema con este acercamiento es que un bus de 128-bits llega a ser innecesariamente costoso e impráctico de implementar. Además, un bus de 128-bits aumenta el performance solamente al doble, que se retrasa detrás del aumento en potencia de 10 del poder del procesador. La otra limitación del bus compartido es que todo el tráfico del sistema tiene lugar al mismo tiempo en una sola línea. Las aplicaciones de hoy en día tienen múltiples procesos ocurriendo al mismo tiempo, y a menudo dos procesos separados dentro de la máquina harán colisión, haciendo que ambos procesos ejecuten más lento y compartan la línea. 
 

Arquitectura De Uno-a-Uno

En vez de la competición por un bus compartido, un computador ideal permite que cada elemento del él se comunique directamente con cada otro elemento, usando una línea privada que se ejecuta solamente entre esos dos elementos. Esto permite que el índice de transferencia de datos sea incrementado dramáticamente. También hace la transferencia de datos extremadamente predecible, puesto que la conexión entre elementos de procesamiento no se comparte. Esta previsibilidad permite a una secuencia de datos, tales como la reproducción de un video desde un disco, evitar el riesgo de ser interrumpido por otro proceso al azar como la llegada de un E-mail. 

El desafío entonces se convierte en cómo tomar las conexiones individuales uno-a-uno entre los componentes y obtener un sistema completo. La respuesta a este problema es el CROSSBAR SWITCH. Un crossbar switch utiliza una avanzada tecnología de conmutación de paquetes para rutear mensajes directamente desde un elemento de procesamiento del computador, por ejemplo la CPU, a otro elemento tal como el sistema gráfico. Un crossbar verdaderamente no bloqueante permite que múltiples secuencias de datos fluyan desde un punto a otro en forma totalmente independiente; no se bloquearán ni interferirán con otros. La estación de trabajo OCTANE de Silicon Graphics incorpora esta clase de crossbar switch en su arquitectura del sistema. El corazón de la estación de trabajo OCTANE se construye alrededor de un crossbar no bloqueante de ocho ports. Mientras que la inteligencia de dispositivos periféricos crece, la arquitectura del crossbar permite que los dispositivos se comuniquen "peer-to-peer". Esto significa que los dispositivos tales como una tarjeta de entrada y salida de video enviará los datos directamente al disco, y no consumirá ancho de banda de la memoria. Las transferencias peer-to-peer son una característica que llegará a ser cada vez más importante -- por ejemplo la transición desde resolución de video a resolución HDTV. La estación de trabajo OCTANE tiene la capacidad de utilizar estos dispositivos peer-to-peer a medida que vayan estando disponibles. 

La estación de trabajo OCTANE utiliza elementos de hardware de procesamiento dedicado para optimizar el funcionamiento de las tareas claves tales como procesamiento de gráficos o compresión de video. Cada uno de estos los motores dedicados residen en diferentes brazos del crossbar switch, tal como se muestra en la figura Nº 2. 

Figura Nº 2: La Arquitectura De OCTANE XIO 
[Figure 2: The OCTANE XIO Architecture] 

Esto permite que el software de aplicación divida las tareas necesarias y asigne cada una al elemento de proceso apropiado (gráficos, CPU, compresión, etc.) para la ejecución paralela. OCTANE puede soportar  actualmente dos CPUs así que la tarea actual se puede dividir entre los dos procesadores y entonces ejecutar al doble de velocidad. Esto es especialmente importante para las tareas tales como rendering de múltiples cuadros de una secuencia animada. La arquitectura del crossbar permite que estos distintos elementos de proceso se comuniquen tan rápidamente como puedan procesar datos, y por lo tanto nunca tienen que esperar debido al tráfico en el bus para continuar. 
 

Memoria Unificada 

El sistema OCTANE descrito anteriormente utiliza hardware dedicado que está optimizado para ejecutar funciones específicas tales como memoria especial para texturas. Para complementar este acercamiento, la estación de trabajo O2 utiliza un hardware más flexible para traer las características de última generación a un precio bajo sin precedentes. El sistema O2 se construye alrededor de una Arquitectra de Memoria Unificada (UMA). UMA pone una memoria de gran ancho de banda en el corazón del sistema. Esta memoria substituye con eficacia al bus compartido de los sistemas tradicionales. Cinco bloques de procesamiento dedicado tienen acceso a esta memoria principal. Estos bloques de procesamiento incluyen la CPU, el motor de proyección de imágenes, el motor de los gráficos, el motor de compresión, el sistema de video, y el Input/Output de O2. Todos estos elementos de procesamiento acceden a los datos de un solo banco de memoria unificada de altísima velocidad. Esto significa que una variedad de tipos de datos puede pasar a través del sistema con facilidad. El motor de compresión se puede procesar una secuencia de video para después ser accesada fácilmente por la CPU, el motor de proyección de imágenes, o despliegue gráfico, todo a completa resolución y frame rate. Mejor que copiar los datos de un subsistema a otro, los subsistemas de O2 pueden intercambiar simplemente punteros, reduciendo así enormemente la penalización en el desempeño impuesta por la copia de datos. Esta arquitectura se ilustra en la figura Nº 3. 

Figura Nº 3: La Arquitectura de Memoria Unificada de O2 
[Figure 3: The O2 Unified Memory Architecture] 

La arquitectura UMA proporciona la conectividad uno-a-uno y un incremento mayor en ancho de banda del sistema, necesario para ejecutar las aplicaciones del emergente nuevo software de entretenimiento. Además de los beneficios en el desempeño de este sistema, la arquitectura UMA trae un nuevo nivel de flexibilidad a los computadores digitales de multimedia con su capacidad de manejar muchos tipos diversos de medios y de realizar muchas funciones diversas. Una estación de trabajo O2 puede manejar las secuencias de multimedia de virtualmente cualquier tamaño y resolución, extendiéndose desde el video basado en Web hasta el CCIR-601 a tiempo real sin comprimir para filmar imágenes de resolución. Una estación de trabajo O2 puede procesar los video JPEG y MPEG. La memoria de texturas de los gráficos es limitada solamente por la cantidad de memoria de sistema disponible, y el sistema de texturas puede aceptar un video como textura para efectos 3D verdaderos en rendering a tiempo real. 

La combinación de performance y flexibilidad es lo que hace de la estación de trabajo O2 muy poderosa. 
 

Nuevas capacidades en EDICIÓN

OCTANE es la plataforma ideal para edición no lineal, sin comprimir. Proporciona dos canales de video de 10-bit CCIR-601 IN y OUT, así como una interface de disco (por ejemplo UltraSCSI y el canal de la fibra) suficientemente rápido para grabar dos secuencias al disco en tiempo real. El sistema base viene equipado con dos buses Ultra-SCSI, y tres drive bays de 3.5 pulgadas que puedan almacenar hasta 27GB de datos. Las interfaces de canales adicionales UltraSCSI o de fibra se pueden agregar a través del PCI o a través del bus de alta velocidad XIO. Procesamiento de video se puede realizar en el subsistema gráfico del OCTANE. El motor gráfico puede tratar el videos de resolución completa como textura y asociarlo sobre un polígono para efectos 3D verdaderamente únicos. Proporciona así de efectos 3D reales, no una simulación de 3D como la que ofrecen otros sistemas. 

Alternativomente, la estación de trabajo O2 es la plataforma de la opción para edición comprimida edición off-line sin comprimir. O2 tiene la capacidad de procesar video JPEG en tiempo real. Los editores no se limitan a un número conjunto de secuencias; el sistema O2 se puede programar para procesar uno, dos, tres, incluso cuatro o más secuencias de video. Obviamente, a medida que el número de secuencias aumenta, la resolución o el funcionamiento en tiempo real comienza a disminuir. O2 puede también procesar video sin comprimir, así que los editores pueden realizar el trabajo creativo off-line y finalizar con el rendering en una plataforma on-line. 
 

Nuevas capacidades en GRÁFICOS

O2 demuestra puro performance de Silicon Graphics. Con 32-bit de color, z-buffering, y texturas aceleradas por hardware, la estación de trabajo O2 es la plataforma ideal para la creación de páginas gráficas. Los poderosísimos gráficos de O2 permiten al usuario obtener verdadera 3D en la creación gráfica, y en tiempo real. 

La estación de trabajo OCTANE es la plataforma ideal para gráficos on-air. Con 2 puertos de I/O de video de 10-bit CCIR-601, los gráficos on-air pueden ser generados en tiempo real, mezclado con video en vivo. Usando un cluster de estaciones O2 conectadas por una red de alta velocidad se puede tener múltiples estaciones para la creación de gráficos alimentando un sistema OCTANE on-air. OCTANE puede generar elementos de conjunto virtual, realzando así la programación local. 
 

Nuevas capacidades en audio

Todas las estaciones de trabajo de Silicon Graphics poseen el más avanzado sistema de I/O de audio en la industria de la computación. OCTANE tiene por base 8 pistas de audio optico digital ADAT de 24-bit, dos canales de I/O serial digital AES3-ID, y dos puertos de I/O análogos. Las capacidades de I/O digital estan también disponibles en una tarjeta PCI que puede ser agregada a las estcaiones OCTANE u O2. Agregando múltiples tarjetas permite a los usuarios poseer 32 o mas pistas de I/O de audio. Combinando esto con el poder del procesamiento DSP nativo del procesador R10000 se obtiene obtienen las estaciones de trabajo con el más avanzado audio digital en la industria.

Nuevas capacidades en la animación 3d

OCTANE es la máquina soñada para la creación de animaciones 3D, gracias a sus procesadores R10000 y a su altamente poderoso sistema gráfico OCTANE/MXI. Los procesadores duales permiten a los animadores trabajar con modelos en wireframe y obtener imagenes finales renderizadas con calidad fotográfica en preview a tiempo real. Mientras una CPU se ocupa de la animación interactiva, la otra esta libre para hacer los updates de las imagenes renderizadas fotorealistas. La segunda CPU solo necesita re-renderizar la imagen final que es cambiada por el animador y asi la ventana de preview fotorealista puede ser refrescada en tiempo real, o casi tiempo real.

La sincronización de la animación no compromete desempeño del sistema. Videos puedes ser texturizados en tiempo real y alli insertados dentro de una escena para proveer de detalles ricos sin una animación extensa.

O2 ofrece muchas de estas capacidades a un precio menor.

Con O2 y OCTANE un animador puede crear una secuencia animada, componerla dentro de un video y editar la pieza final, todo en una sola plataforma.

Nuevas capacidades en el desarrollo del juego

Los desarrolladores de juegos pueden crear secuencias animadas y modelos, los juegos pueden ser pre evaluados a través de prototipos que requieren de un esfuerzo mucho menor, y la brecha entre diseñadores y programadores se hace mucho menor con estos sistemas. Agrgando además las capacidades comentadas en puntos anteriores podemos asegurar que que esta forma se hace mucho más agil el desarrollo de juegos.