Ahorra hasta un 40%Elige un plan anual de ASKtoAI.

Comparar Planes
Contextual Retrieval Anthropic
Inteligencia artificial

Introducción a la recuperación contextual: una revolución en el acceso a la información

La recuperación contextual antrópica revoluciona el acceso a la información, mejorando la precisión de los sistemas RAG en un 49 %. Un gran avance para la IA contextualmente consciente.

En el vasto panorama de la inteligencia artificial, Anthropic destaca una vez más con una innovación que promete transformar la forma en que interactuamos con grandes bases de conocimiento. La recuperación contextual representa un avance significativo en la tecnología de recuperación-generación aumentada (RAG), y ofrece una solución elegante a uno de los problemas más persistentes de la IA: la pérdida de contexto durante la recuperación de información.

El dilema del contexto en los sistemas RAG tradicionales

Los sistemas RAG tradicionales han revolucionado la capacidad de los modelos lingüísticos para acceder a grandes cantidades de información. Sin embargo, estos sistemas adolecen de una limitación importante: la pérdida de contexto . Cuando los documentos se dividen en fragmentos más pequeños para facilitar su recuperación, a menudo se pierde el contexto más amplio en el que está incrustada esta información. Esto puede dar lugar a respuestas inexactas o engañosas, especialmente cuando se trata de información compleja o matizada.

Imagine, por ejemplo, un sistema que necesita responder preguntas sobre informes financieros. Un fragmento puede contener la información "los ingresos crecieron un 3% en comparación con el trimestre anterior", pero sin el contexto de la empresa específica o el período del informe, esta información pierde gran parte de su valor.

Recuperación contextual: una solución innovadora

Contextual Retrieval de Anthropic aborda este problema de una manera ingeniosa. En lugar de simplemente dividir los documentos en fragmentos, el sistema agrega un breve contexto explicativo a cada fragmento antes de incorporarlo a la base de datos de conocimientos. Este contexto se genera utilizando IA, específicamente Claude, el modelo de lenguaje avanzado de Anthropic.

El proceso funciona así:

  1. El documento está dividido en fragmentos.
  2. Para cada fragmento, Claude genera un contexto breve (50-100 tokens) que explica la posición y el significado del fragmento dentro del documento más grande.
  3. Este contexto se coloca antes del fragmento original.
  4. Luego, el fragmento contextualizado se incorpora a la base de datos de conocimientos.

Este enfoque permite mantener el contexto crítico incluso cuando se recuperan fragmentos individuales de información, mejorando significativamente la precisión y relevancia de las respuestas generadas por el sistema.

Impacto y desempeño

Los resultados obtenidos con Contextual Retrieval son impresionantes. Según pruebas realizadas por Anthropic:

  • El uso de incrustaciones contextuales redujo la tasa de fracaso en la recuperación de los primeros 20 fragmentos en un 35% (del 5,7% al 3,7%).
  • Al combinar Contextual Embeddings y Contextual BM25 , la tasa de falla se redujo en un 49% (del 5,7% al 2,9%).

Estas mejoras se traducen directamente en respuestas más precisas y relevantes de los sistemas de IA, con aplicaciones potenciales en una amplia gama de industrias, desde la atención al cliente hasta el análisis legal, desde la investigación científica hasta la gestión del conocimiento empresarial.

Implementación y consideraciones prácticas

La implementación de la recuperación contextual requiere algunas consideraciones importantes:

  1. Límites de los fragmentos : la elección del tamaño de los fragmentos, sus límites y su superposición pueden influir significativamente en el rendimiento de la recuperación.
  2. Modelo de incrustación : si bien la recuperación contextual mejora el rendimiento de todos los modelos de incrustación probados, algunos modelos pueden beneficiarse más que otros. Anthropic encontró que las incorporaciones de Gemini y Voyage eran particularmente efectivas.
  3. Mensajes de contextualización personalizados : si bien el mensaje genérico proporcionado por Anthropic funciona bien, puede lograr resultados aún mejores con mensajes adaptados a dominios o casos de uso específicos.
  4. Número de fragmentos : agregar más fragmentos a la ventana contextual aumenta las posibilidades de incluir información relevante, pero también puede distraer al modelo. Anthropic ha descubierto que usar 20 fragmentos proporciona el mejor rendimiento, pero es mejor experimentar para encontrar el equilibrio óptimo para cada caso de uso específico.

Mejoras adicionales: reclasificación

Para impulsar aún más el rendimiento de la recuperación contextual, Anthropic ha estado experimentando agregando una fase de reclasificación . Este proceso implica:

  1. Realice una recuperación inicial para obtener fragmentos potencialmente relevantes (Anthropic usó los primeros 150).
  2. Pase estos fragmentos, junto con la consulta del usuario, a través de un modelo de reclasificación.
  3. Asigne a cada fragmento una puntuación según su relevancia e importancia para la consulta.
  4. Seleccione los fragmentos con la puntuación más alta (Anthropic utilizó los 20 primeros).

Los resultados fueron notables: la recuperación contextual con reclasificación redujo la tasa de fracaso en la recuperación de los primeros 20 fragmentos en un 67 % (del 5,7 % al 1,9 %).

Conclusiones y perspectivas de futuro

La recuperación contextual representa un avance significativo en la tecnología RAG y ofrece una solución elegante al problema de la pérdida de contexto. Al combinar incrustaciones contextuales, BM25 contextual y reclasificación, Anthropic ha demostrado que es posible mejorar drásticamente la precisión y relevancia de la información recuperada.

Este avance allana el camino para sistemas de IA más inteligentes y conscientes del contexto , capaces de proporcionar respuestas más precisas y útiles en una amplia gama de aplicaciones. Desde la atención al cliente hasta el análisis de documentos complejos, desde la tutoría personalizada hasta la investigación científica, las aplicaciones potenciales de la recuperación contextual son amplias y prometedoras.

A medida que la tecnología continúa evolucionando, podemos esperar más refinamientos y mejoras en este campo. El desafío para el futuro será equilibrar el aumento del rendimiento con consideraciones de costo y latencia, especialmente para aplicaciones en tiempo real.

En conclusión, Contextual Retrieval de Anthropic representa un gran paso adelante hacia sistemas de IA más inteligentes y conscientes del contexto, prometiendo transformar la forma en que interactuamos con vastas bases de conocimiento y abriendo nuevas posibilidades en numerosos campos de aplicación.

Marco esposito

Marco Esposito

25/09/2024

to top icon