6.1 EL HARDAWARE DE CÓMPUTO Y LA INFRAESTRUCTURA DE LA TECNOLOGĺA DE LA INFORMACIÓN
El hardware de cómputo, ya definido en el capítulo 1, provee el fundamento físico básico para la infraestructura de la TI de la empresa. Otros componentes de la infraestructura — software, datos y redes — requieren hardware de cómputo para su almacenamiento u operación. EL SISTEMA DE CÓMPUTO
Una computadora es un dispositivo físico que toma datos como entrada, transforma esos datos de acuerdo con las instrucciones almacenadas y da salida a la información procesada. Un sistema de cómputo contemporáneo consiste en una unidad central de procesamiento, almacenamiento principal, almacenamiento secundario, dispositivos de entrada, dispositivos de salida y los dispositivos de comunicaciones (véase la figura 6-1). La unidad central de procesamiento maneja los datos en bruto en un
formato más útil y controla las demás partes del sistema de cómputo. El almacenamiento principal guarda temporalmente datos e instrucciones del programa durante el procesamiento, en tanto que los dispositivos de almacenamiento secundario (discos magnéticos y ópticos, cinta magnética) guardan datos y programas cuando no se van a utilizar en el procesamiento. Los dispositivos de entrada, como el teclado o el ratón, convierten los datos e instrucciones en formatos electrónicos para ingresarlos en la computadora. Los dispositivos de salida, como las impresoras y las terminales de despliegue de video, convierten a los datos electrónicos producidos por el sistema de cómputo y los despliegan en un formato inteligible para las personas. Los dispositivos de comunicación proporcionan conexiones entre la computadora y las redes de comunicación. Los buses son rutas dentro de los sistemas de circuitos por donde se transmiten datos y señales a las distintas partes del sistema de cómputo.
A fin de que la información fluya a través de un sistema de cómputo en un formato apropiado para su procesamiento, todos los símbolos, imágenes o palabras se deben reducir a una cadena de dígitos binarios. Un dígito binario se llama bit y representa al 0 o al 1. Las computadoras, la presencia de una señal electrónica o magnética significa 1 y su ausencia significa 0. Las computadoras digitales operan directamente con dígitos binarios, ya sea en forma individual o unidos entre si para formar bytes. Una cadena de 8 bits, que la computadora almacena como una unidad, se llama byte. Cada byte se puede utilizar para guardar un número decimal, un símbolo, un carácter o parte de una imagen (véase la figura 6-2).
La CPU y el almacenamiento principal
La unidad central de procesamiento (CPU, por sus siglas en inglés) es la parte del sistema de cómputo en la que se da la manipulación de símbolos, números y letras y controla las demás partes del sistema de cómputo. Ubicada cerca de la CPU está el almacenamiento principal (denominado a veces memoria primaria o memoria principal), donde se almacenan temporalmente los datos y las instrucciones del programa durante el procesamiento. Los buses dan rutas para trasmitir datos y señales entre la CPU, el almacenamiento principal y los demás dispositivos del sistema de cómputo. Las características de la CPU y del almacenamiento principal son muy importantes para determinar la velocidad y capacidad de una computadora.
La figura 6-3 también muestra que la CPU consta de una unidad lógica y aritmética y una unidad de control. La unidad logia y aritmética (ALU, por sus siglas en inglés) realiza las principales operaciones lógicas y matemáticas de la computadora. Suma, resta, multiplica y divide, determinando si un número es positivo, negativo o cero. Además de efectuar funciones aritméticas, una ALU debe ser capaz de determinar que una cantidad sea mayor o menor que otro y cuándo dos cantidades son iguales. La ALU puede realizar operaciones lógicas en letras y números.
La unidad de control coordina y controla las demás partes del sistema de cómputo. Lee un programa almacenado, una instrucción a la vez, y dirige a los demás componentes del sistema de cómputo para realizar las tareas requeridas por el programa. La serie de operaciones requeridas para procesar una sola instrucción de máquina se denomina ciclo de máquina.
El almacenamiento principal tiene tres funciones. Almacena todo o parte del programa de software bajo ejecución. También guarda los programas del sistema operativo que manejan el funcionamiento de la computadora. Finalmente, el área de almacenamiento principal mantiene los datos que el programa está utilizando. Con frecuencia, el almacenamiento principal interno se llama RAM, o memoria de acceso aleatorio. Se le llama RAM porque puede tener acceso directo a cualquier ubicación seleccionada al azar en la misma cantidad de tiempo.
La memoria principal se divide en ubicaciones de almacenamiento llamadas bytes. Cada ubicación contiene un conjunto de ocho conmutadoras binarios o dispositivos, cada uno de los cuales puede guardar un bit de información. El conjunto de ocho bits que se encuentran en cada ubicación de almacenamiento es suficiente para guardar una letra, un dígito o un símbolo especial (como el de $). Cada bit tiene una dirección única, parecida a un buzón de correo, que indica dónde se localiza en la RAM. La computadora recuerda dónde se ubican los datos entre los bytes con sólo rastrear estas direcciones. La capacidad de almacenamiento de la computadora se mi en bytes. La tabla de 3-1 enlista las principales mediciones de la capacidad de almacenamiento de la computadora y la velocidad de procesamiento.
El almacenamiento principal se compone de semiconductores, que son circuitos integrados formados por miles e incluso millones de pequeños transistores impresos en pequeños chips de silicón. Hay diversos y variados tipos de memoria semiconductora utilizados en el almacenamiento principal. La RAM se usa para almacenamiento de datos o instrucciones de programas a corto plazo. La RAM es volátil: su contenido se perderá cuando se interrumpa el abastecimiento electrónico de la computadora por una carencia de energía o cuando se apague la computadora. La ROM, o memoria de solo lectura, sólo se puede leer; no se puede escribir. Los chips de la ROM ya vienen quemados o almacenados con los programas desde el fabricante. La ROM se utiliza en computadoras de propósito general para guardar programas importantes o de uso frecuente.
PROCESAMIENTO DE CÓMPUTO
La capacidad de procesamiento de la CPU juega un rol importante para determinar la cantidad de trabajo que un sistema de cómputo puede completar.
Los microprocesadores y la potencia de procesamiento
Las CPUs contemporáneas utilizan chips semiconductores llamados microprocesadores, los cuales integran en un solo chip todos los circuitos de memoria, logia y control para toda una CPU. La velocidad y desempeño de los microprocesadores de una computadora ayudan a determinar la potencia de procesamiento de la misma y se basan en el número de bits que se pueden procesar a un tiempo (longitud de palabras), la cantidad de palabras que se pueden mover entre la CPU, el almacenamiento principal y otros dispositivos (ancho del bus de datos), y la velocidad del ciclo, medida en megaherz. (Megaherz se abrevia MHz y denota millones de ciclo por segundos).
Se puede hacer que los microprocesadores sean más rápidos utilizando en su diseño una computadora con conjunto reducido de instrucciones (RISC, por sus siglas en ingles). Los chips convencionales, basados en una computadora con conjunto de instrucciones complejas, tienen varios cientos de instrucciones integradas en sus circuitos y les toma varios ciclos ejecutar una instrucción sencilla. Si se eliminan las instrucciones que no son de uso frecuentes, las instrucciones remanentes se pueden ejecutar mucho más rápidamente. Las computadoras RISC solo tienen integradas las instrucciones de mayor frecuencia de uso. Una CPU del tipo RISC puede ejecutar la mayoría de las instrucciones en un solo ciclo de maquina y a veces múltiples instrucciones al mismo tiempo. Con frecuencia, las RISC se utilizan en cómputo científico y en estaciones de trabajo.
Procesamiento en paralelo
El procesamiento también se puede acelerar enlazando varios procesadores para que trabajen simultáneamente en la misma tarea. La figura 6-4 compara el procesamiento en paralelo con el procesamiento en serie usado en computadoras convencionales. En el procesamiento en paralelo, múltiples unidades de procesamiento (CPUs) dividen un problema en partes pequeñas y trabajan al mismo tiempo con él. Para lograr que un grupo de procesadores ataquen el mismo problema a la vez es necesario replantear los problemas y un software especial que pueda dividir estos problemas entre diferentes procesadores de la manera más eficiente posible, proporcionando los datos necesarios reensamblando posteriormente las diversas subtareas para llegar a una solución adecuada.
Las computadoras con procesamiento paralelo masivo tienen grandes redes de chips de procesamiento interconstruidos de maneras complejas y flexibles para atacar grandes problemas de cómputo. Opuesto al procesamiento en paralelo, en el que varios chips potentes, costos y especializados se encuentran entrelazados, las máquinas de procesamiento paralelo masivo enlazan cientos o incluso miles de chips económicos de uso común para dividir problemas en muchas partes pequeñas y resolverlos. (Figura 6-4)
TECNOLOGĺA DE ALMACENAMIENTO, ENTRADA Y SALIDA
Las capacidades de los sistemas de cómputo dependen no sólo de la velocidad y la capacidad de la CPU, sino también de la velocidad, capacidad y diseño de la tecnología de almacenamiento, entrada y salida. A los dispositivos de almacenamiento, entrada y salida se les llama dispositivos periféricos porque están fuera de la unidad principal del sistema de cómputo.
Tecnología de almacenamiento secundario
El comercio y los negocios en línea han hecho del almacenamiento una tecnología estratégica. Aunque el comercio electrónico y los negocios en línea están reduciendo los procesos manuales, los datos de todo tipo deben estar almacenados electrónicamente y disponibles siempre que se necesiten. La mayor parte de la información utilizada por las aplicaciones de una computadora se almacena en dispositivos de almacenamiento secundario ubicados fuera del área del almacenamiento principal. El almacenamiento secundario se utiliza para guardar datos fuera de la CPU a relativamente largo plazo. El almacenamiento secundario no es volátil y retiene los datos incluso cuando se apaga la computadora. Las tecnologías más importantes del almacenamiento secundario son los discos magnéticos, los discos ópticos y las cintas magnéticas.
Disco magnético. El medio actual de mayor uso de almacenamiento secundario es el disco magnético. Hay dos tipos de disco magnéticos: los discos flexibles (que se usan en las PCs) y los discos duros (que se usan en las unidades grandes de disco comercial y en las PCs). Los grandes sistemas de cómputo mainframe o de rango medio tienen múltiples unidades de discos duros porque requieren una inmensa capacidad de almacenamiento de disco a niveles gigabytes y terabytes. Las PCs también utilizan discos flexibles, los cuales son removibles y portátiles, con capacidades de almacenamiento y velocidades de acceso menos a las de los discos duros. Las unidades de disco removibles se están convirtiendo en alternativas de almacenamiento de respaldo muy populares para los sistemas PC. Los discos magnéticos tanto en grandes como en pequeñas computadoras permiten acceso directo a registros individuales para que se pueda tener acceso directamente a esos datos almacenados en el disco, sea cual se el orden en que se grabaron originalmente. La tecnólogas de discos es muy útil para sistemas que requieren acceso rápido y directo a los datos
El desempeño de la unidad de disco se puede mejorar aún más mediante la tecnología de discos llamada RAID (Arreglo Redundante de Discos Económicos). Los dispositivos RAID empacan más de 100 unidades de disco, un chip controlador y software especializado en una sola unidad grande. Las unidades de disco tradicionales envían datos desde la unidad de disco a lo largo de una ruta individual, pero los dispositivos RAID transmiten datos simultáneamente a través de múltiples rutas, mejorando el tiempo y la confiabilidad de acceso al disco. En la mayoría de los sistemas RAID, los datos de un disco que falle se pueden restaurar automáticamente sin que se tenga que apagar el sistema de cómputo.
Discos ópticos. Los discos ópticos, también llamados discos compactos o discos ópticos láser, utilizan tecnologías de láser para almacenar cantidades masivas de datos en un formato altamente compacto. Están disponibles tanto para PCs como para computadoras grandes. El sistema óptico de uso más común en PCs se llama CD-ROM (disco compacto de memoria de sólo lectura). Un disco compacto de 4.75 pulgadas de diámetro para PC puede almacenar hasta 660 megabytes, casi 300 veces mas que un disco duro flexible de alta densidad. Los discos ópticos son más apropiados para aplicaciones en las que se debe almacenar de manera compacta grandes cantidades de datos que no cambian y que requieren una recuperación sencilla de estos o para aplicaciones que combinan texto, sonido e imágenes.
El CD-ROM es un almacenamiento de sólo lectura. No se pueden escribir datos en él. Los sistemas de discos ópticos WORM (escríbalo una vez-léalo muchas veces) y CD-R (disco compacto grabable) permiten que los usuarios graben datos una vez en un disco óptico. Una vez escritos, los datos no se pueden borrar, pero sí se pueden leer indefinidamente. La tecnología del CD-RW (CD rescribible) se ha desarrollado par permitir que los usuarios creen discos ópticos reescribibles para aplicaciones que requieren grandes volúmenes de almacenamiento en los que la información se actualiza ocasionalmente.
Los discos digitales de video (DVDs, por sus siglas en ingles), también llamados discos digitales versátiles, son discos ópticos de la misma medida que los CD-ROM pero con mayor capacidad. Pueden contener un mínimo de 4.7 gigabytes de datos, suficientes para almacenar plenamente una película cinematográfica de alta calidad. Los DVDs se empezaron a utilizar para almacenar películas y aplicaciones multimedia empleando grandes cantidades de video y gráficos, pero es posible que reemplacen a los CD-ROMs ya que pueden almacenar grandes cantidades de texto, gráficos, audio y datos de video digitalizados. Ya están disponibles las unidades de DVD y de medios de tipo leer solo una vez, escribibles y reescribibles.
Cinta magnética. El almacenamiento en cinta magnética es una de las tecnologías de almacenamiento más antiguas, pero aún se emplea para almacenamiento secundario de grandes cantidades de datos que se requieren con rapidez, pero no de manera instantánea. La cinta magnética es muy económica relativamente estable. Sin embargo, almacena datos de manera secuencial y es relativamente lenta comparada con la velocidad de otros medios de almacenamiento secundario. Para encontrar un registro individual almacenado en una cinta magnética, como el registro de un empleado, se debe leer la cinta desde el inicio hasta llegar a la ubicación del registro deseado.
Redes de almacenamiento. Para satisfacer creciente demanda de gráficos de uso intensivo de datos, transacciones en la Web y otras aplicaciones empresariales digitales, la cantidad de datos que las compañías necesitan almacenar se duplica cada 12 o 18 meses. Las compañías están volteando hacían nuevos tipos de infraestructuras de almacenamiento para tratar con la complejidad y costo de los crecientes requerimientos de almacenamiento.
Las grandes compañías tienen recursos de almacenamiento muy diversos: unidades de disco, unidades de respaldo en cinta, el RAID y otros dispositivos que se pueden colocar en ubicaciones muy diversas. El manejo de este tipo de arreglo es cara y dificulta el acceso a los datos a través de la empresa. La tecnología de redes de almacenamiento permite que las empresas administren centralmente rodos sus recursos de almacenamiento mediante un plan global para todos los dispositivos de almacenamiento de la empresa.
Hay arreglos alternativos de redes de almacenamiento. En el almacenamiento adjunto directo, los dispositivos de almacenamiento se conectan directamente a computadoras servidores individuales y de debe tener acceso a ellos a través de cada servidor, lo que puede ocasionar cuellos de botella. El almacenamiento adjunto de red (NAS, por sus siglas en ingles) supera este problema adjuntando dispositivos de almacenamiento RAID de alta velocidad a una red de manera que los dispositivos en la red puedan acceder a este almacén a través de un servidor especializado en una red de alta velocidad separada para propósitos de almacenamiento. Las redes de área de almacenamiento (SAN, por sus siglas en ingles) van un paso adelante colocando múltiples dispositivos de almacenamiento en una red de alta velocidad separada para propósitos de almacenamiento. Las SAN crean un depósito central de almacenamiento que pueden compartir múltiples servidores de modo que los usuarios puedan compartir rápidamente los datos a trasvés de la SAN. La red de área de almacenamiento (SAN) conecta diversos tipos de dispositivos de almacenamiento, como bibliotecas de cintas y arreglos de discos. Los dispositivos de almacenamiento de la SAN se localizan en su propia red y se conectan utilizando una tecnología de alta transmisión como un canal de fibra. La red mueve datos entre grupos de servidores y dispositivos de almacenamiento, creando una infraestructura para el almacenamiento de datos que abarca toda la empresa. La figura 6-5 ilustra cómo funciona una SAN.
Las SAN pueden ser caras y difíciles de administrar, pero son muy útiles para compañías que necesitan compartir información a través de aplicaciones y plataformas de cómputo. Las SAN pueden ayudar a estas compañías a consolidar sus recursos de almacenamiento y a proporcionar acceso rápido a datos a usuarios que se encuentren en sitios dispersos.
Dispositivos de entrada y salida
Las personas interactúan con los sistemas de cómputo en gran parte de dispositivos de entrada y salida. Los dispositivos de entrada obtienen datos y los convierten en formatos electrónicos para uso de la computadora, en tanto que los dispositivos de salida despliegan los datos después de que han sido procesados. La tabla 6-2 describe los principales dispositivos de entrada y salida.
Los principales dispositivos de entrada constan teclados, dispositivos apuntadores (como el ratón de la computadora y las pantallas sensibles al tacto) y tecnologías de automatización de datos de origen (reconocimiento óptico de caracteres, reconocimiento de caracteres de tinta magnética, entrada basada en pluma, escáneres digitales, entrada de audio y sensores, los cuales capturan los datos en formatos legible para la computadora en el tiempo y lugar en que se crearon. También incluyen dispositivos de identificación por radio frecuencia (RFID, por sus siglas en ingles), los cuales utilizan pequeñas etiquetas que incorporan microchips incrustados que contienen información sobre un artículo y su ubicación para transmitir señales en una distancia corta a lectores especiales de RFID. A continuación la información se transfiere a un dispositivo de procesamiento. La RFID es especialmente útil para rastrear la ubicación de artículos en su paso por la cadena de abastecimiento. Los principales dispositivos de salida son las terminales de rayos catódicos (CRTs, por sus siglas en ingles), a veces denominadas terminales de despliegue de video (VDT, por sus siglas en ingles), impresoras y salida de audio.
Entrada y procesamiento por lotes y en línea
La figura 6-6 compara el procesamiento por lotes y el procesamiento por línea. Con frecuencia, los sistemas por lotes utilizan cintas como medio de almacenamiento, en tanto el procedimiento en línea utiliza el almacenamiento en discos, lo que permite un acceso inmediato a registros específicos. En los sistemas por lotes las transacciones se acumulan en un archivo de transacciones, el cual contiene todas las transacciones de un periodo en particular. Este archivo se utiliza periódicamente para actualizar un archivo maestro, que contiene información permanente solo en las entidades. (Un ejemplo es un archivo maestro, el cual usa nómino con los datos de ganancias y deducciones del empleado. Se actualiza con las transacciones semanales de la tarjeta de tiempo.) Al agregar los datos en la transacción al archivo maestro existente se crea un nuevo archivo maestro. En el procesamiento en línea de las transacciones se introducen inmediatamente al tema utilizando un teclado, un dispositivo apuntado o la automatización de datos de origen y el sistema suele responder de inmediato. El archivo maestro se actualiza de manera continua.
Multimedia interactiva
Las tecnologías de procesamiento, entrada, salida y almacenamiento descritas hasta aquí se pueden utilizar para crear aplicaciones multimedia que integran sonido y video de movimiento total o animación con gráficos y texto en una aplicación para computadora. La multimedia se está convirtiendo en la base de nuevos productos y servicios para el consumidor, como libros y periódicos electrónicos, tecnologías de prestaciones electrónicas en salones de clase, videoconferencia de movimiento total, manejo de imágenes, herramientas de diseño de gráficos y correo de video y voz. Las PCs actuales incorporan capacidades multimedia, incluyendo monitores a alta resolución, unidades de CD-ROM o DVD para almacenar video, audio y datos gráficos, así como altavoces estereofónicos para amplificar la salida del audio.
Las páginas Web interactivas repletas de gráficos, sonido, animaciones y video de movimiento total han hecho popular la multimedia en Internet. Por ejemplo, los visitantes al sitio Web CNN.com pueden acceder a noticias desde CNN, fotografías, transcripciones al aire, videoclips y audioclips. Estos últimos se ponen a disposición de los usuarios mediante tecnología de flujo continuo, la cual permite procesar datos de audio y video en un flujo estable y continuo conforme se bajan de la Web.
Los sitios Web con multimedia también se están utilizando para vender productos digitales, como clips de música digitalizada. Un estándar de compresión conocido como MP3, también llamado MEPG3, abreviatura de Motion Picture Express Group (Grupo de Expertos en Imágenes en Movimiento), capa de audio 3, puede comprimir archivos a un décimo o un doceavo de su tamaño original prácticamente sin pérdida de calidad. Los visitantes a sitios Web como MP3.com pueden bajar clips de música MP3 a través de Internet y reproducirlos en sus propias computadoras.