Todo es un archivo: la filosofía de diseño desde Unix hasta el Agente de IA

2/16/2026
8 min read

Todo es un archivo: la filosofía de diseño desde Unix hasta el Agente de IA

Original de Ethan 业成

cover_imageImage 2

Un eco que atraviesa medio siglo

Ya a principios de la década de 1970 en los Laboratorios Bell (Bell Labs), los padres de Unix, Ken Thompson y Dennis Ritchie, propusieron por primera vez un principio de diseño audaz, casi obsesivo: Todo es un archivo.

Más de cincuenta años después, los frameworks de Agentes de IA están en auge. Manus, Claude Code, OpenClaw... provienen de diferentes equipos, diferentes pilas de tecnología, diferentes objetivos comerciales, pero todos han tomado la misma decisión: utilizar el sistema de archivos como el esqueleto cognitivo del Agente.

Manus le da al Agente una máquina virtual, y los productos de la tarea se guardan en el disco como archivos. Claude Code lee y escribe directamente en el sistema de archivos local del usuario, utilizando un archivo CLAUDE.md para contener todas las instrucciones y el contexto. Los frameworks de código abierto como OpenClaw también organizan la descomposición de tareas y los estados intermedios mediante una estructura de directorios.

Cuando ingenieros separados por medio siglo, enfrentando problemas técnicos completamente diferentes, convergen independientemente en la misma solución, no es una coincidencia, es una resonancia de la filosofía de diseño.

La decisión de Unix

Para comprender el peso de esto, primero debemos volver a lo que hizo Unix.

El diseño del sistema de archivos de Unix es reconocido como uno de los diseños más elegantes en la historia de la informática. Resolvió un problema extremadamente complejo: cómo administrar una amplia variedad de recursos de hardware y recursos de datos con una interfaz unificada y simple.

Antes de la década de 1970, los sistemas operativos funcionaban así: si querías leer un disco, llamabas a la interfaz del disco; si querías leer una cinta, llamabas a la interfaz de la cinta; si querías acceder a un terminal, llamabas a la interfaz del terminal. Cada dispositivo tenía su propia API, y cada API tenía su propia semántica. Si tenías N tipos de dispositivos y M tipos de operaciones, la complejidad del sistema era N × M.

Thompson y Ritchie hicieron algo que parecía simple hasta la estupidez:

Convertir todo en archivos. Usar los cuatro verbos open, read, write, close para operar con todo.

Su significado central es: todos los recursos en el sistema operativo (documentos, directorios, unidades de disco duro, módems, teclados, impresoras, e incluso conexiones de red e información de procesos) pueden abstraerse como un flujo de bytes (Stream of Bytes).

Esto significa que solo necesitas aprender un conjunto de API: open(), read(), write(), close() para operar con todos los recursos de la computadora.

A partir de entonces, la complejidad colapsó de N × M a 4 × 1. Cuatro verbos, una capa de abstracción.

El genio de esto no radica en el sustantivo "archivo", sino en una visión más profunda:

No necesitas saber qué hay detrás del descriptor de archivo. La interfaz es el contrato.

Un fd (descriptor de archivo) es un identificador opaco. Si le haces read(), sale un flujo de bytes. En cuanto a si estos bytes provienen de un sector del disco duro, un búfer de la tarjeta de red o la salida estándar de otro proceso, no te importa, ni debería importarte.

Este es el poder de una interfaz unificada: convierte la ignorancia en una ventaja.

Image 3

El mismo problema que enfrenta el Agente

Ahora, volvamos a la situación del Agente de IA.

Para que un Agente complete tareas complejas, enfrenta un dilema sorprendentemente similar al del sistema operativo de la década de 1970:

  • Memoria persistente: La ventana de contexto de un LLM es volátil, y la cadena de pensamiento desaparece con la sesión. Es como si la memoria se reciclara después de que un proceso termina: necesitas un lugar para persistir el estado intermedio, de lo contrario, cada conversación comenzará desde cero.
  • Contexto progresivo: Las tareas complejas no se pueden completar en un solo paso. El Agente necesita acumular contexto gradualmente en múltiples rondas de razonamiento, al igual que un proceso de Unix transmite el estado entre múltiples ejecuciones leyendo y escribiendo archivos. El sistema de archivos proporciona naturalmente este modo de trabajo progresivo de "escribir un poco, leer un poco y luego escribir un poco más".
  • Programación unificada de herramientas y habilidades: El Agente necesita invocar herramientas heterogéneas (Tools/Skills) como búsqueda, ejecución de código, generación de imágenes, etc., al igual que Unix necesita administrar dispositivos heterogéneos como discos, redes, impresoras, etc. Necesitas una capa de abstracción unificada, de lo contrario, tendrás que escribir un nuevo conjunto de lógica de integración cada vez que conectes una nueva herramienta.
  • Límites de permisos para el uso de la computadora: Cuando un Agente tiene la capacidad de operar una computadora, "qué puede tocar y qué no puede tocar" se convierte en un asunto de vida o muerte. El sistema de permisos de archivos de Unix (rwx) proporciona precisamente un modelo de sandbox listo para usar: el directorio es el límite, el permiso es el contrato.

Cuatro requisitos. ¿Suena familiar?

Esto es precisamente el problema que enfrentaba el sistema operativo en la década de 1970.

Memoria persistente: el sistema de archivos lo resuelve naturalmente, la escritura es persistente. Contexto progresivo: la estructura de directorios en sí misma se construye de forma incremental, mkdir, touch, append, el contexto crece con el archivo. Programación unificada de herramientas: la esencia de las tuberías de Unix: el stdout de un proceso es el stdin de otro proceso, y el medio intermedio es el flujo de bytes. La cadena de herramientas del Agente es la misma: el archivo de salida del paso anterior es la entrada del siguiente paso. Límites de permisos: los permisos rwx del sistema de archivos, el sandbox chroot, definen naturalmente un "círculo de capacidad" para el Agente.

Entonces, cuando los diseñadores del framework del Agente se enfrentan a la pregunta de "dónde colocar el estado de trabajo del Agente", la respuesta es casi predeterminada: colocarlo en el sistema de archivos. Porque no hay una solución más simple que pueda satisfacer simultáneamente estas cuatro restricciones.

Image 4Cuando el sistema necesita "administrar la interacción de una gran cantidad de recursos heterogéneos", tienes dos caminos:

Ruta A: Diseñar interfaces dedicadas para cada tipo de recurso. N tipos de recursos × M tipos de operaciones = NM tipos de interfaces. Preciso pero explosivo.

Ruta B: Encontrar una capa de abstracción lo suficientemente delgada para que todos los recursos usen la misma ropa. 4 tipos de operaciones × 1 capa de abstracción. Crudo pero combinable.

Unix eligió B. Más de cincuenta años después, el framework del Agente vuelve a elegir B.

Image 5

Una capa más profunda: el archivo es la externalización del pensamiento

Pero si solo nos detenemos en la "convergencia de la solución técnica", nos perderemos algo más esencial.

Recuerda cómo los humanos manejan las tareas complejas.

Recibes un gran proyecto, lo primero que haces no es empezar a trabajar, sino: crear carpetas. Directorio raíz del proyecto, directorio de subtareas, directorio de materiales de referencia, directorio de salida. Utilizas la estructura de directorios para descomponer la tarea caótica en unidades manejables. Utilizas nombres de archivo para nombrar cada unidad. Utilizas el contenido del archivo para registrar el proceso de pensamiento y los productos intermedios.

El sistema de archivos no es solo una solución de almacenamiento. Es la herramienta original para externalizar el pensamiento humano.

Esta idea explica por qué el framework del Agente converge hacia el sistema de archivos: el "pensamiento" del LLM necesita ser externalizado: su ventana de contexto es limitada y el razonamiento a largo plazo debe depender de la memoria externa. Y el sistema de archivos es precisamente el formato de "memoria externa" más universal que los humanos han inventado.

Desde esta perspectiva, CLAUDE.md de Claude Code no es un archivo de configuración. Es un contrato cognitivo externalizado: los humanos escriben la intención en un archivo y el Agente lee el archivo como intención. El archivo se convierte en la capa de interfaz entre la mente humana y la inteligencia artificial.

Image 6Esto es sorprendentemente consistente con la filosofía de las tuberías de Unix:

Write programs to handle text streams, because that is a universal interface. (Escribe programas para manejar flujos de texto, porque esa es una interfaz universal.)## Volviendo a los primeros principios

Las grandes abstracciones no se vuelven obsoletas, simplemente encuentran nuevas instancias en nuevos dominios.

"La interfaz unificada resuelve la complejidad" no es un invento de Unix, es una ley eterna del diseño de sistemas. Unix casualmente la implementó con el nombre de "archivo". AI Agent casualmente la ha implementado nuevamente con la forma de "directorio de trabajo".

La próxima generación de sistemas también se enfrentará a la misma elección: ¿diseñar interfaces dedicadas para cada cosa, o encontrar una capa delgada, genérica y componible de abstracción?

Si la historia nos enseña algo, la respuesta ya está escrita al lado de /dev/null:

Keep it simple. Make it compose. Everything is a file. (Mantenlo simple. Haz que se componga. Todo es un archivo.)

Published in Technology

You Might Also Like