Saltar la navegación

2. Gestión de ficheros

Los ficheros son el método de almacenamiento de información más elemental. De hecho, en última instancia, todos los métodos de almacenamiento, por sofisticados que sean, almacenan los datos en ficheros.

Hasta que fueron relegados en los años ochenta por las bases de datos relacionales, los ficheros fueron el principal medio de almacenamiento de datos. El nombre fichero se utilizó por analogía con los antiguos ficheros que contenían fichas de papel, todas con la misma estructura, consistente en un conjunto fijo de campos. En el caso de los libros de una biblioteca, por ejemplo, los campos podían ser el título, nombre del autor, tema, etc. Los ficheros que contenían fichas de papel fueron reemplazados por ficheros de ordenador que contenían registros, equivalentes a las antiguas fichas de papel. Un registro contiene un conjunto de campos de longitud fija. Para acelerar las búsquedas se empezaron a utilizar ficheros auxiliares de índice que permitían acceder a los registros según un orden determinado. IBM desarrolló un avanzado sistema de gestión de ficheros llamado ISAM (indexed sequential access method).

Los inicios

En las antiguas aplicaciones informáticas, antes de que surgieran las bases de datos, la información se guardaba en ficheros.

Así, por ejemplo, una aplicación que guardaba los datos de personas, almacenaba dichos datos en un fichero convencional cuyo contenido bien podía ser este:

Juan Pérez García 30 C/ Aire nº 11 Sevilla Sevilla

Alberto Borrero Arias 46 C/ Flores nº 34 Hinojos Huelva

María Gómez López 25 C/ Andalucía nº 12 Alcalá Sevilla

 ...

Esto tenía como efecto, que el programador de las aplicaciones que usaran ese fichero, tuviera que construir el programa conociendo detalladamente las posiciones de los datos, para saber desde qué posición hasta qué otra posición, se guardaba el nombre y apellidos, etc. Una forma más efectiva era colocar cada dato en una línea pero era necesario saber el número de campos que contenía cada registro y crear líneas vacías en los campos opcionales. También se podía indicar marcas, como por ejemplo, la de fin de registro.

Otro inconveniente era tener que controlar si se guardan filas de datos duplicadas, etc...

Por eso, cuando surgieron las bases de datos, se empezó a dejar de usar los ficheros convencionales.

Pero bien es cierto, que aún en las más modernas aplicaciones, a veces necesitamos un simple archivo para guardar información, como por ejemplo un fichero de configuración, o un fichero log. Es decir, no siempre nos hace falta una base de datos para almacenar la información.

Hay que tener en cuenta, que los ficheros en sí, para grabar la información del modo que poníamos como ejemplo anteriormente, ya no se usan. En cambio, sí que se usan ficheros que guardan datos siguiendo un patrón o estructura bien definida, en otros métodos de almacenamiento, como por ejemplo en ficheros y en bases de datos XML o NoSQL.

De especial interés y uso cada vez más extendido, son los ficheros XML o JSON. Éstos son archivos de texto que por consiguiente no necesitan un software propietario para ser interpretados, como ocurre con la mayoría de los archivos binarios.

También debemos tener en cuenta, que las bases de datos relativamente modernas, como son las bases de datos XML o NoSQL, que guardan sus datos empleando ficheros xml o json.

Por eso, en muchas ocasiones se recurre a utilizar este tipo de soluciones, el uso de ficheros en vez de bases de datos, y en particular de ficheros XML cuando se necesita intercambiar información a través de varias plataformas de hardware o de software, o de varias aplicaciones. A veces se exporta de una base de datos a ficheros XML para trasladar la información a otra base de datos que leerá esos ficheros XML.

La fácil estructuración de la información en los ficheros XML y JSON ha permitido que surjan muchas librerías de conversión de la información almacenada a otros formatos como a PDF, texto, hojas de cálculo, etc. Hay muchos productos propietarios y de código abierto.