OpenAI lanza herramienta para detectar texto generado por IA, incluso de ChatGPT

Usuarios del Club TRPlane

Para ver este contenido, es necesario estar registrado. Haz clic en el botón para ver todos los planes.

Después de telegrafiar el movimiento a través de apariciones en los medios OpenAI ha lanzado una herramienta que intenta distinguir entre el texto escrito por humanos y el generado por IA, como el texto producido por los propios modelos ChatGPT y GPT-3 de la empresa. El clasificador no es particularmente preciso: su tasa de éxito es de alrededor del 26%, señala OpenAI, pero OpenAI argumenta que, cuando se usa junto con otros métodos, podría ser útil para ayudar a prevenir el abuso de los generadores de texto de IA.

“El clasificador tiene como objetivo ayudar a mitigar las afirmaciones falsas de que el texto generado por IA fue escrito por un humano. Sin embargo, todavía tiene una serie de limitaciones, por lo que debe usarse como complemento de otros métodos para determinar la fuente del texto en lugar de ser la herramienta principal para la toma de decisiones”, dijo un portavoz de OpenAI. Estamos poniendo a disposición este clasificador inicial para obtener comentarios sobre si herramientas como esta son útiles y esperamos compartir métodos mejorados en el futuro.

A medida que crece el fervor en torno a la IA generativa, en particular la IA que genera texto, los críticos han pedido a los creadores de estas herramientas que tomen medidas para mitigar sus efectos potencialmente dañinos. Algunos de los distritos escolares más grandes de los Estados Unidos han prohibido ChatGPT en sus redes y dispositivos, por temor a los impactos en el aprendizaje de los estudiantes y la precisión del contenido que produce la herramienta. Y sitios que incluyen Stack Overflow ha expulsado a los usuarios que compartían contenido generado por ChatGPT, diciendo que la IA hace que sea demasiado fácil para los usuarios inundar hilos de discusión con respuestas dudosas.

El clasificador de OpenAI, acertadamente llamado OpenAI AI Text Classifier, es desafiante desde el punto de vista arquitectónico. Al igual que ChatGPT, es un modelo de lenguaje de IA entrenado en muchos, muchos ejemplos de texto disponible públicamente en la web. Pero a diferencia de ChatGPT, está ajustado para predecir la probabilidad de que la IA haya generado un fragmento de texto, no solo de ChatGPT, sino de cualquier modelo de IA que genere texto.

Más específicamente, OpenAI capacitó al OpenAI AI Text Classifier en textos de 34 sistemas de generación de contenido de cinco organizaciones diferentes, incluida la propia OpenAI. Este texto se combinó con texto escrito por humanos similar (pero no exactamente similar) de Wikipedia, sitios web extraídos de enlaces compartidos en Reddit y un conjunto de «demostraciones humanas» recopiladas para un sistema anterior de generación de texto OpenAI. (OpenAI admite en un documento de apoyo sin embargo, que podría haber clasificado erróneamente inadvertidamente algún texto escrito por IA como escrito por humanos «dada la proliferación de contenido generado por IA en Internet»).

El clasificador de texto de OpenAI no funcionará con cualquier texto, lo que es más importante. Necesita un mínimo de 1000 caracteres, o alrededor de 150 a 250 palabras. No detecta el plagio, una limitación especialmente desafortunada teniendo en cuenta que se ha demostrado que la IA generadora de texto regurgitar el texto sobre el que fue entrenado. Y OpenAI dice que es más probable que se equivoque en el texto escrito por niños o en un idioma que no sea inglés, debido a su conjunto de datos en inglés.

El detector cubre un poco su respuesta al evaluar si un fragmento de texto determinado es generado por IA. Dependiendo de su nivel de confianza, etiquetará el texto como «muy poco probable» generado por IA (menos del 10 % de probabilidad), «poco probable» generado por IA (entre un 10 % y 45 % de probabilidad), «poco claro si es ” Generado por IA (una probabilidad del 45 % al 90 %), “posiblemente” generado por la IA (una probabilidad del 90 % al 98 %) o “probablemente” generado por la IA (una probabilidad superior al 98 %).

Por curiosidad, pasamos algo de texto por el clasificador para ver cómo funcionaba. Si bien predijo correctamente y con confianza que varios párrafos de un artículo de TRPlanes sobre Horizon Worlds de Meta y un fragmento de una página de soporte de OpenAI no fueron generados por IA, el clasificador tuvo más dificultades con el texto de la longitud del artículo de ChatGPT y, en última instancia, no logró clasificarlo. en total. Sin embargo, detectó con éxito la salida de ChatGPT de un Gizmodo trozo acerca de – ¿qué más? — ChatGPT.

Según OpenAI, el clasificador etiqueta incorrectamente el texto escrito por humanos como escrito por IA el 9% de las veces. Ese error no ocurrió en la pruebas, pero se puede atribuir al pequeño tamaño de la muestra.

Créditos : OpenAI

En un nivel práctico, el clasificador no es particularmente útil para evaluar escritos más cortos. 1000 caracteres es un umbral difícil de alcanzar en el ámbito de los mensajes, por ejemplo, los correos electrónicos (al menos los regulares). Y tiene varias limitaciones como por ejemplo OpenAI enfatiza que el clasificador se puede evadir modificando algunas palabras o cláusulas en el texto generado.

Eso no quiere decir que el clasificador sea inútil, ni mucho menos. Pero ciertamente no detendrá a los estafadores comprometidos (o estudiantes, para el caso) en su estado actual.

La pregunta es, ¿habrán otras herramientas? Ha surgido una especie de industria artesanal para satisfacer la demanda de detectores de texto generados por IA. ChatZero, desarrollado por un estudiante de la Universidad de Princeton, utiliza criterios que incluyen «perplejidad» (la complejidad del texto) y «ráfagas» (las variaciones de las oraciones) para detectar si el texto podría estar escrito por IA. El detector de plagio Turnitin está desarrollando su propio detector de texto generado por IA. Más allá de eso, una búsqueda en Google arroja al menos media docena de otras aplicaciones que afirman ser capaces de separar el trigo generado por IA de la paja generada por humanos, para retorcer la frase hecha.

Es probable que se convierta en un juego del gato y el ratón. A medida que mejora la IA que genera texto, también lo harán los detectores, un ir y venir interminable similar al que se da entre los ciberdelincuentes y los investigadores de seguridad. Y como escribe OpenAI, si bien los clasificadores pueden ayudar en ciertas circunstancias, nunca serán una única prueba confiable para decidir si el texto fue generado por IA.

Eso es una forma de expresar que no hay una bala de plata para resolver los problemas que plantea el texto generado por IA. Es muy probable que nunca lo haya.

Busque su consulta

Enlaces útiles

Tecnológicas:

Categorías

Enlaces útiles

OpenAI lanza herramienta para detectar texto generado por IA, incluso de ChatGPT

Usuarios del Club TRPlane

SpaceX adquiere la startup de IA Cursor por 60.000 millones de dólares en acciones tras su histórica IPO

Figma revoluciona el diseño con capas de código, animación nativa y nuevas capacidades de IA

Masayoshi Son de SoftBank cuestiona la viabilidad de los centros de datos orbitales de Elon Musk

Plaud rompe la barrera de los 100 millones de dólares en ARR con sus dispositivos de notas por IA

XDOF emerge con 70 millones para solucionar el cuello de botella de datos en la robótica de IA

Solo el 16% de los estadounidenses cree que la IA tendrá un impacto positivo, revela un estudio de Pew Research

El ‘interruptor de la muerte’ federal para la IA: el riesgo soberano que el mercado ignora

Categorías

Enlaces útiles

¿Listo para suscribirte?

Enlaces útiles

Categorías

Enlaces útiles

OpenAI lanza herramienta para detectar texto generado por IA, incluso de ChatGPT

Usuarios del Club TRPlane

SpaceX adquiere la startup de IA Cursor por 60.000 millones de dólares en acciones tras su histórica IPO

Figma revoluciona el diseño con capas de código, animación nativa y nuevas capacidades de IA

Masayoshi Son de SoftBank cuestiona la viabilidad de los centros de datos orbitales de Elon Musk

Plaud rompe la barrera de los 100 millones de dólares en ARR con sus dispositivos de notas por IA

XDOF emerge con 70 millones para solucionar el cuello de botella de datos en la robótica de IA

Solo el 16% de los estadounidenses cree que la IA tendrá un impacto positivo, revela un estudio de Pew Research

El ‘interruptor de la muerte’ federal para la IA: el riesgo soberano que el mercado ignora

.tdi_195{margin-bottom:10px!important} .tdi_195{color:var(--trp-white);font-family:var(--trp-sans-serif)!important;font-size:18px!important;line-height:1.2!important}@media (min-width:768px) and (max-width:1018px){.tdi_195{font-size:16px!important}}Categorías

.tdi_199{margin-bottom:10px!important} .tdi_199{color:var(--trp-white);font-family:var(--trp-sans-serif)!important;font-size:18px!important;line-height:1.2!important}@media (min-width:768px) and (max-width:1018px){.tdi_199{font-size:16px!important}}Enlaces útiles

.tdi_203{margin-bottom:10px!important} .tdi_203{color:var(--trp-white);font-family:var(--trp-sans-serif)!important;font-size:18px!important;line-height:1.2!important}@media (min-width:768px) and (max-width:1018px){.tdi_203{font-size:16px!important}}¿Listo para suscribirte?

Categorías

Enlaces útiles

¿Listo para suscribirte?