Chat Recall: Búsqueda semántica profunda y organización inteligente para tus conversaciones. 100% local y privado.
quijote@cifrid:~$ crec --search "estrategia de datos"
Loading vector store… OK
Recupera información por concepto y significado, no solo palabras clave exactas.
Embeddings locales para una comprensión profunda del contexto de tus chats.
Segmenta y clasifica automáticamente largas conversaciones en temas digeribles.
Código abierto, sin registro, sin API keys. Clona el repo y lanza tu primera búsqueda semántica.
Tu ventaja competitiva no debería estar en la nube de otro. Chat Recall se ejecuta exclusivamente en tu infraestructura local.
Bajo el Capó
Decisiones técnicas que tomamos y por qué — para que entiendas los límites antes de escalar.
all-MiniLM-L6-v2 — 384 dimensiones, ~80MB en disco.
Trade-off: Menor precisión que modelos grandes (ada-002, e5-large), pero corre en CPU sin GPU ni API key. Para búsqueda sobre tu propio corpus, la precisión es suficiente.
ChromaDB local — persistencia en SQLite + HNSW index.
Trade-off: No escala a millones de documentos como Pinecone/Weaviate, pero zero-config, sin servidor y sin costos recurrentes. Para <10K conversaciones, el rendimiento es instantáneo.
Zero network calls — embeddings generados localmente con SentenceTransformers.
Implicancia: Tu historial de ChatGPT nunca sale de tu máquina. No hay telemetría, no hay API calls, no hay cuenta.
Indexación: ~2 min para 5K conversaciones. Búsqueda: <50ms por query.
Cuello de botella: La tokenización del modelo es el 80% del tiempo de indexación. La búsqueda HNSW es O(log n) — escala bien hasta el límite de ChromaDB.
ChatGPT .zip
Export oficial
Parser + Chunker
Python
MiniLM
Embeddings locales
ChromaDB
HNSW + SQLite
TUI / Search
Semantic query
Descarga tu .zip oficial desde ChatGPT.
Procesa localmente.
Recupera insights y redescubre tus conversaciones perdidas.
Conecta tus fuentes de datos internas con pipelines automatizados: n8n, APIs REST, webhooks y conectores a medida.
El mismo motor de indexación aplicado a respaldos de WhatsApp: clasificación, embeddings y búsqueda semántica sobre conversaciones reales.