Tecnologia de Deteccion
Nuestra metodologia de deteccion combina multiples tecnicas de procesamiento de lenguaje natural para ofrecer resultados precisos y confiables.
Analisis Estadistico de Texto
El nucleo de nuestra tecnologia es el analisis estadistico avanzado. Evaluamos la distribucion de probabilidades de las palabras en el texto, comparandola con los patrones esperados de escritura humana y de modelos de lenguaje. Los modelos de IA generan texto prediciendo la siguiente palabra mas probable, lo que crea patrones estadisticos detectables que nuestro sistema identifica con precision.
Utilizamos metricas como la entropia de Shannon, la distribucion de n-gramas, y la varianza en la longitud de oraciones para construir un perfil estadistico completo del texto analizado.
Modelos de Clasificacion
Nuestro sistema utiliza modelos de clasificacion entrenados con millones de ejemplos de texto humano y generado por IA en espanol. Estos clasificadores han aprendido a distinguir las sutiles diferencias entre la escritura humana natural y el contenido producido por diferentes modelos de lenguaje, incluyendo GPT-4, Gemini Pro, Claude y otros.
El entrenamiento continuo con nuevos modelos de IA garantiza que nuestro detector se mantenga actualizado y efectivo incluso cuando aparecen nuevos modelos de generacion de texto.
Procesamiento de Lenguaje Natural
Mas alla del analisis estadistico puro, aplicamos tecnicas avanzadas de NLP (Procesamiento de Lenguaje Natural) para evaluar la coherencia tematica, la fluidez narrativa, y los patrones pragmaticos del texto. Esto incluye el analisis de como se conectan las ideas, la presencia de opiniones personales genuinas, y el uso de recursos estilisticos tipicamente humanos.
Esta capa adicional de analisis nos permite detectar incluso textos que han sido parcialmente editados despues de la generacion por IA, identificando las secciones que mantienen patrones artificiales.
Precision y Limitaciones
Nuestro sistema alcanza una precision superior al 90% en textos de mas de 100 palabras en espanol. Sin embargo, es importante entender que ningun detector es perfecto. Las principales limitaciones incluyen: textos muy cortos (menos de 50 palabras), textos que han sido extensamente editados manualmente, y textos tecnicos o formulas que tienen una estructura inherentemente uniforme.
Recomendamos usar nuestro detector como una herramienta complementaria de evaluacion, no como criterio unico de juicio. El resultado debe interpretarse como una probabilidad, no como una certeza absoluta.
Proceso de Analisis
Recepcion del texto
El usuario pega o escribe el texto en el campo de entrada. El sistema valida que contenga al menos 50 palabras para garantizar un analisis estadisticamente significativo.
Tokenizacion y preprocesamiento
El texto se segmenta en tokens, oraciones y n-gramas. Se calculan metricas iniciales como longitud media de oracion, riqueza lexica y frecuencia de conectores.
Analisis de perplejidad y burstiness
El modelo evalua la perplejidad (que tan predecible es cada palabra) y la burstiness (variacion en la complejidad entre oraciones). Los textos de IA tienden a ser uniformes en ambas metricas.
Clasificacion y veredicto
Se combinan todas las senales en un clasificador final que asigna una probabilidad de origen IA. El resultado incluye puntuacion global, desglose por metrica y una explicacion detallada.
Preguntas Frecuentes sobre la Tecnologia
El sistema combina analisis de perplejidad, entropia de Shannon, distribucion de n-gramas y burstiness. Estas metricas se alimentan a un clasificador basado en GPT-4o que evalua la probabilidad de que el texto haya sido generado por modelos como GPT-4, Gemini, Claude u otros LLMs.
La precision supera el 91% en textos de mas de 100 palabras en espanol. La fiabilidad aumenta con la longitud del texto: fragmentos de 200+ palabras alcanzan tasas superiores al 94%. Textos muy cortos, altamente editados o de naturaleza tecnica pueden reducir la precision.
El sistema detecta patrones asociados a mas de 6 modelos de IA, incluyendo GPT-4, GPT-3.5, Gemini Pro, Claude, Llama y Mistral. Aunque no siempre puede confirmar el modelo exacto, identifica las "huellas" estadisticas caracteristicas de cada familia de modelos.
Los textos se envian cifrados con TLS al modelo de analisis y se procesan en tiempo real. No almacenamos el contenido de los textos en nuestros servidores. Solo registramos metadatos anonimos (longitud, puntuacion, latencia) para mejorar el servicio. Tu contenido permanece privado.
Las principales limitaciones incluyen: textos menores a 50 palabras producen resultados poco fiables, contenido extensamente editado tras la generacion puede pasar desapercibido, y textos tecnicos o formulaicos con estructura inherentemente uniforme pueden generar falsos positivos. Recomendamos usar el resultado como indicador, no como prueba absoluta.
Analiza tu texto ahora
Comprueba si un texto fue escrito por inteligencia artificial. Gratis, sin registro.
Probar el Detector