Un modelo de IA con instrucciones fijas, conocimiento específico y, opcionalmente, acceso a herramientas externas (APIs, archivos, navegador). Ejecuta tareas de forma más autónoma que un chat común.
Ejemplo
Un "Gem Ventas" en Gemini con tu pitch deck, objeciones y reglas comerciales. El empleado le pregunta y obtiene respuestas consistentes sin explicar el contexto cada vez.
Application Programming Interface InfraestructuraInterfaz que permite que una aplicación (tu CRM, tu eCommerce, un script interno) consuma capacidades de un modelo de IA sin tener que usar el chat web. Es la vía para integraciones reales en producción.
Ejemplo
Claude API para clasificar tickets automáticamente al llegar a tu sistema de soporte.
Espacios de trabajo en Claude de Anthropic donde cargás documentos, establecés instrucciones fijas y tu equipo trabaja con un Claude pre-configurado con el contexto de la empresa.
Ejemplo
Un Project con los contratos modelo, políticas legales y tono de voz del estudio. Cualquier abogado consulta cláusulas sin repetir el briefing.
La cantidad máxima de texto (medida en tokens) que un modelo puede procesar en una sola conversación. Determina cuánto podés cargar sin trocear: contratos, manuales, historiales completos.
Ejemplo
Gemini 1.5 Pro: 2M tokens (~1.5M palabras). Claude Team: 200k (~150k palabras). ChatGPT Plus: 128k.
Modalidad donde un modelo (Gemini, ChatGPT) investiga de forma autónoma durante varios minutos, navega la web, consolida fuentes y entrega un reporte. Útil para due diligence, investigación de mercado o análisis competitivo.
Representación numérica de un texto que captura su significado. Es la base técnica de RAG: para buscar un documento relevante, comparás embeddings en lugar de palabras exactas.
Técnica para re-entrenar un modelo base con datos específicos de tu empresa. El resultado es un modelo que aprende tu tono, formato o vocabulario. Costoso y complejo — casi nunca lo necesitás: un buen Project/Gem con RAG suele alcanzar.
Agente personalizado dentro de Google Gemini. Configurás rol, instrucciones fijas y archivos de conocimiento. Disponible en todos los planes (incluido el gratuito) desde Gemini 2.0.
Ejemplo
Gem Marketing cargado con tu brand guide y últimos posts. Redacta contenidos en tu tono sin copy-paste manual.
Generative Pre-trained Transformer ModelosFamilia de modelos de OpenAI (GPT-3.5, GPT-4, GPT-5). También nombre que le dio OpenAI a sus agentes personalizados dentro de ChatGPT (custom GPTs).
Cuando un modelo genera información falsa con tono de certeza. Es el principal riesgo en implementaciones B2B. Se mitiga con RAG (respuestas ancladas en tus documentos) y con instrucciones explícitas de "decí 'no sé' si no tenés la información".
El proceso de generar una respuesta en tiempo real a partir de un modelo entrenado. Cada vez que le hablás a ChatGPT, Claude o Gemini, estás haciendo una inferencia. Tiene un costo (tokens procesados).
Modelo de lenguaje de gran escala. Es el tipo de IA detrás de ChatGPT, Claude y Gemini. Entrenados con trillones de tokens de texto de internet para predecir la siguiente palabra de manera coherente.
Protocolo abierto lanzado por Anthropic en 2025 que estandariza cómo los modelos de IA se conectan a fuentes externas (bases de datos, APIs, archivos). Es el "USB-C de la IA": permite que un Claude o Gemini se conecte a tu sistema sin integración custom.
Ejemplo
Con un MCP server, Claude puede consultar tu base de datos de clientes o tu CRM directamente, sin copy-paste.
Capacidad de un modelo para procesar más de un tipo de input: texto, imagen, audio, video. Clave para casos como análisis de screenshots, transcripción de reuniones o soporte técnico visual.
Ejemplo
Subir foto de un producto defectuoso a Claude y que redacte el reclamo formal al proveedor.
Herramienta de Google donde cargás documentos, PDFs o enlaces y generás investigaciones, FAQ, podcasts automáticos y mapas mentales sobre ese conocimiento. Ideal para onboarding y análisis de documentación corporativa.
Las "variables" internas que un modelo ajusta durante el entrenamiento. Más parámetros = más capacidad (y más costo). GPT-4 tiene cientos de billones, modelos locales chicos pueden tener 7B o 13B.
Conjunto de garantías que ofrecen los planes corporativos de los proveedores de IA: tus datos no entrenan modelos, cumplimiento con SOC 2, ISO 27001, HIPAA y GDPR, logs auditables. La diferencia entre usar Gemini Free (sin garantías) y Gemini for Google Workspace.
El texto que le enviás al modelo para obtener una respuesta. Un buen prompt incluye rol, contexto, instrucciones y formato esperado. En un Gem o Project, parte del prompt queda "fija" como configuración.
Disciplina de diseñar prompts que logren respuestas consistentes y útiles. Clave cuando NO tenés Gems/Projects configurados. Con agentes corporativos configurados, el prompt engineering deja de ser responsabilidad del empleado.
Retrieval-Augmented Generation TécnicasArquitectura donde el modelo, antes de responder, busca documentos relevantes en una base de conocimiento y los usa como contexto. Es la forma más robusta de garantizar respuestas ancladas en tu información, no en internet genérico.
Ejemplo
Un asistente de soporte que, antes de responder, busca en tu base de tickets cerrados + manuales de producto + políticas vigentes.
Práctica de poner a prueba un modelo o agente buscando fallos de seguridad, sesgos o respuestas peligrosas. Parte del trabajo de implementación seria: antes de exponer un agente al equipo, intentás romperlo.
Parámetro que controla cuán "creativo" o "determinista" es el modelo en sus respuestas. Temperatura baja (0.1) = respuestas consistentes, ideal para soporte o legales. Alta (0.9) = respuestas variadas, útil para brainstorming.
Unidad básica que los modelos procesan. Aprox. 1 token = 0.75 palabras en español. Se facturan por tokens de entrada + tokens de salida. Un contrato de 100 páginas son ~40k tokens.
Capacidad del modelo de invocar herramientas externas (consultar una API, ejecutar código, buscar en web, enviar un email) durante una conversación. Es lo que hace que un agente pase de "responde preguntas" a "ejecuta tareas".
Arquitectura técnica detrás de todos los LLMs modernos (GPT, Claude, Gemini). Introducida por Google en 2017. No es un detalle que un dueño de empresa tenga que conocer — pero se menciona constantemente en papers y presentaciones técnicas.
Plataforma de Google Cloud para usar Gemini y otros modelos vía API con controles enterprise: seguridad, compliance, region residency. Es el canal formal para integrar Gemini en tus productos propios.
Suite corporativa de Google (Gmail, Docs, Sheets, Meet, Drive, Calendar). Con Gemini for Google Workspace, la IA vive dentro de esas apps sin que el equipo tenga que cambiar de pestaña.
Capacidad de un modelo de resolver una tarea sin ejemplos previos. Los LLMs modernos son buenísimos en zero-shot para tareas generales. Para tareas específicas de tu empresa, los ejemplos (few-shot) o un Project/Gem mejoran los resultados.