Todo es un Archivo: Una Filosofía de Diseño desde Unix hasta los Agentes de IA
Todo es un Archivo: Una Filosofía de Diseño desde Unix hasta los Agentes de IA
Original de Ethan 业成


Un Eco a Través de Medio Siglo
Ya a principios de la década de 1970 en los Laboratorios Bell (Bell Labs), los padres de Unix, Ken Thompson y Dennis Ritchie, propusieron por primera vez un principio de diseño audaz, casi obsesivo: Everything is a file – Todo es un archivo.
Más de cincuenta años después, los frameworks de Agentes de IA están en auge. Manus, Claude Code, OpenClaw... provienen de diferentes equipos, diferentes pilas de tecnología, diferentes objetivos comerciales, pero todos han hecho la misma elección: utilizar el sistema de archivos como el esqueleto cognitivo del Agente.
Manus le da a un Agente una máquina virtual, y los productos de la tarea se guardan como archivos. Claude Code lee y escribe directamente en el sistema de archivos local del usuario, utilizando un archivo CLAUDE.md para contener todas las instrucciones y el contexto. Los frameworks de código abierto como OpenClaw también organizan la descomposición de tareas y los estados intermedios utilizando una estructura de directorios.
Cuando ingenieros separados por medio siglo, enfrentando problemas técnicos completamente diferentes, convergen independientemente en la misma solución, esto no es una coincidencia, es una resonancia de la filosofía de diseño.
La Decisión de Unix
Para comprender el peso de esto, primero debemos volver a lo que hizo Unix.
El diseño del sistema de archivos de Unix es reconocido como uno de los diseños más elegantes en la historia de la informática. Resolvió un problema extremadamente complejo: cómo administrar una amplia variedad de recursos de hardware y recursos de datos con una interfaz unificada y simple.
Antes de la década de 1970, los sistemas operativos funcionaban así: si querías leer un disco, llamabas a la interfaz del disco; si querías leer una cinta, llamabas a la interfaz de la cinta; si querías acceder a una terminal, llamabas a la interfaz de la terminal. Cada dispositivo tenía su propia API, y cada API tenía su propia semántica. Si tenías N tipos de dispositivos y M tipos de operaciones, la complejidad del sistema era N × M.
Thompson y Ritchie hicieron algo que parecía simple hasta la estupidez:
Convirtieron todo en archivos. Usaron los cuatro verbos open, read, write, close para operar todo.
Su significado central es: todos los recursos en el sistema operativo (documentos, directorios, unidades de disco duro, módems, teclados, impresoras, e incluso conexiones de red e información de procesos) pueden abstraerse como un flujo de bytes (Stream of Bytes).
Esto significa que solo necesitas aprender un conjunto de API: open(), read(), write(), close() para operar todos los recursos de la computadora.
Desde entonces, la complejidad colapsó de N × M a 4 × 1. Cuatro verbos, una capa de abstracción.
El genio de esto no reside en el sustantivo "archivo", sino en una visión más profunda:
No necesitas saber qué hay detrás del descriptor de archivo. La interfaz es el contrato.
Un fd (descriptor de archivo) es un identificador opaco. Le haces read(), y sale un flujo de bytes. En cuanto a si estos bytes provienen de sectores del disco duro, búferes de la tarjeta de red o la salida estándar de otro proceso, no te importa, ni deberías importarte.
Este es el poder de una interfaz unificada: permite que la ignorancia se convierta en una ventaja.

El Mismo Problema que Enfrenta el Agente
Ahora, volvamos a la situación del Agente de IA.
Para que un Agente complete tareas complejas, se enfrenta a un dilema sorprendentemente similar al de los sistemas operativos en la década de 1970:
- Memoria persistente: La ventana de contexto de un LLM es volátil, y la cadena de pensamiento desaparece con la sesión. Es como si la memoria se reciclara después de que un proceso termina: necesitas un lugar para persistir el estado intermedio, de lo contrario, cada conversación comenzará desde cero.
- Contexto progresivo: Las tareas complejas no se pueden completar en un solo paso. El Agente necesita acumular contexto gradualmente en múltiples rondas de razonamiento, al igual que un proceso de Unix transmite el estado entre múltiples ejecuciones leyendo y escribiendo archivos. El sistema de archivos proporciona naturalmente este modo de trabajo progresivo de "escribir un poco, leer un poco y luego escribir un poco más".
- Programación unificada de herramientas y habilidades: El Agente necesita invocar herramientas heterogéneas (Tools/Skills) como búsqueda, ejecución de código, generación de imágenes, etc., al igual que Unix necesita administrar dispositivos heterogéneos como discos, redes e impresoras. Necesitas una capa de abstracción unificada, de lo contrario, tendrás que escribir un nuevo conjunto de lógica de integración cada vez que agregues una nueva herramienta.
- Límites de permisos para el uso de la computadora: Cuando un Agente tiene la capacidad de operar una computadora, "qué puede tocar y qué no puede tocar" se convierte en una cuestión de vida o muerte. El sistema de permisos de archivos de Unix (rwx) proporciona precisamente un modelo de sandbox listo para usar: el directorio es el límite y los permisos son el contrato.
Cuatro requisitos. ¿Suena familiar?
Esto es precisamente a lo que se enfrentaba el sistema operativo en la década de 1970.
Memoria persistente: el sistema de archivos lo resuelve naturalmente, la escritura es persistente. Contexto progresivo: la estructura de directorios en sí misma se construye de forma incremental, mkdir, touch, append, el contexto crece con el archivo. Programación unificada de herramientas: la esencia de las tuberías de Unix: el stdout de un proceso es el stdin de otro proceso, y el medio intermedio es el flujo de bytes. La cadena de herramientas del Agente es la misma: el archivo de salida del paso anterior es la entrada del siguiente paso. Límites de permisos: los permisos rwx del sistema de archivos, el sandbox chroot, definen naturalmente un "círculo de capacidad" para el Agente.
Entonces, cuando los diseñadores del framework del Agente se enfrentan a la pregunta de "dónde colocar el estado de trabajo del Agente", la respuesta es casi predeterminada: en el sistema de archivos. Porque no hay una solución más simple que pueda satisfacer simultáneamente estas cuatro restricciones.
Cuando el sistema necesita "administrar la interacción de una gran cantidad de recursos heterogéneos", tienes dos caminos:
Ruta A: Diseñar una interfaz dedicada para cada recurso. N recursos × M operaciones = NM interfaces. Preciso pero explosivo.
Ruta B: Encontrar una capa de abstracción lo suficientemente delgada para que todos los recursos usen la misma ropa. 4 operaciones × 1 capa de abstracción. Crudo pero combinable.
Unix eligió B. Más de cincuenta años después, el framework del Agente volvió a elegir B.

Una capa más profunda: los archivos son la externalización del pensamiento
Pero si solo nos detenemos en la "convergencia de la solución técnica", nos perderemos algo más esencial.
Recuerda cómo los humanos manejan las tareas complejas.
Cuando recibes un gran proyecto, lo primero que haces no es empezar a trabajar, sino: crear carpetas. Directorio raíz del proyecto, directorios de subtareas, directorios de materiales de referencia, directorios de salida. Utilizas la estructura de directorios para descomponer la tarea caótica en unidades manejables. Utilizas nombres de archivo para nombrar cada unidad. Utilizas el contenido del archivo para registrar el proceso de pensamiento y los productos intermedios.
El sistema de archivos no es solo una solución de almacenamiento. Es la herramienta original para externalizar el pensamiento humano.
Esta idea explica por qué el framework del Agente converge hacia el sistema de archivos: el "pensamiento" del LLM necesita ser externalizado: su ventana de contexto es limitada y el razonamiento a largo plazo debe depender de la memoria externa. Y el sistema de archivos es precisamente el formato de "memoria externa" más común que los humanos han inventado.
Desde esta perspectiva, CLAUDE.md de Claude Code no es un archivo de configuración. Es un contrato cognitivo externalizado: los humanos escriben la intención en un archivo y el Agente lee el archivo como intención. El archivo se convierte en una capa de interfaz entre la mente humana y la inteligencia artificial.
Esto es sorprendentemente consistente con la filosofía de las tuberías de Unix:
Write programs to handle text streams, because that is a universal interface.Reemplazar "programs" con "agents" y "text streams" con "files", esta frase seguirá siendo válida en 2026.
Volviendo a los primeros principios
Las grandes abstracciones no se vuelven obsoletas, simplemente encuentran nuevas instancias en nuevos dominios.
"Una interfaz unificada resuelve la complejidad" no es un invento de Unix, es una ley eterna del diseño de sistemas. Unix casualmente la implementó con el nombre de "archivo". AI Agent casualmente la ha implementado nuevamente en la forma de un "directorio de trabajo".
La próxima generación de sistemas también se enfrentará a la misma elección: ¿diseñar interfaces dedicadas para cada cosa, o encontrar una abstracción delgada, genérica y componible?
Si la historia nos enseña algo, la respuesta ya está escrita al lado de /dev/null:
Keep it simple. Make it compose. Everything is a file. (Mantenlo simple. Haz que se componga. Todo es un archivo.)





