La IA generadora de código puede introducir vulnerabilidades de seguridad

Inteligencia Artificial

Para ver este contenido, es necesario estar registrado. Haz clic en el botón para ver todos los planes.

Según un estudio reciente, los ingenieros de software que utilizan sistemas de IA para generar código tienen más probabilidades de provocar vulnerabilidades de seguridad en las aplicaciones que desarrollan. El trabajo, del que es coautor un equipo de investigadores afiliados a Stanford, pone de relieve los posibles escollos de los sistemas de generación de código a medida que proveedores como GitHub empiezan a comercializarlos en serio.

«Actualmente, los sistemas de generación de código no sustituyen a los desarrolladores humanos», explica en una entrevista por correo electrónico Neil Perry, doctorando en Stanford y coautor principal del estudio. «Los desarrolladores que los utilizan para completar tareas fuera de sus propias áreas de especialización deben estar preocupados, y aquellos que los utilizan para acelerar las tareas en las que ya son expertos deben comprobar cuidadosamente los resultados y el contexto en el que se utilizan en el proyecto general.»

El estudio de Stanford se centró específicamente en Codex, el sistema de generación de código de IA desarrollado por el laboratorio de investigación OpenAI, con sede en San Francisco. Los investigadores reclutaron a 47 desarrolladores -desde estudiantes universitarios hasta profesionales del sector con décadas de experiencia en programación- para que utilizaran Codex para resolver problemas relacionados con la seguridad en lenguajes de programación como Python, JavaScript y C.

Codex se entrenó con miles de millones de líneas de código público para sugerir líneas de código y funciones adicionales teniendo en cuenta el contexto del código existente. El sistema propone un enfoque o solución de programación en respuesta a una descripción de lo que un programador quiere conseguir (por ejemplo, «Di hola mundo»), basándose tanto en su base de conocimientos como en el contexto actual.

Según los investigadores, los participantes en el estudio que tenían acceso a Codex eran más propensos a escribir soluciones incorrectas e «inseguras» (en el sentido de ciberseguridad) a problemas de programación en comparación con un grupo de control. Y lo que es aún más preocupante, eran más propensos a decir que sus respuestas inseguras eran seguras en comparación con las personas del grupo de control.

Megha Srivastava, estudiante de posgrado en Stanford y segunda coautora del estudio, subraya que los resultados no son una condena total del Codex y otros sistemas de generación de código. Por ejemplo, los participantes en el estudio no tenían conocimientos de seguridad que les hubieran permitido detectar mejor las vulnerabilidades del código. Aparte de eso, Srivastava cree que los sistemas de generación de código son útiles para tareas que no son de alto riesgo, como el código de investigación exploratoria, y que podrían mejorar sus sugerencias de codificación con un ajuste fino.

«Las empresas que desarrollen sus propios [sistemas], quizá con más formación sobre su código fuente interno, podrían salir mejor paradas, ya que el modelo podría animarse a generar resultados más acordes con sus prácticas de codificación y seguridad», afirma Srivastava.

Entonces, ¿cómo podrían proveedores como GitHub evitar que los desarrolladores introduzcan fallos de seguridad utilizando sus sistemas de IA generadores de código? Los coautores tienen algunas ideas, entre ellas un mecanismo para «refinar» las instrucciones de los usuarios para que sean más seguras, como si un supervisor examinara y revisara borradores de código. También sugieren que los desarrolladores de bibliotecas criptográficas se aseguren de que sus configuraciones por defecto son seguras, ya que los sistemas de generación de código tienden a ceñirse a valores por defecto que no siempre están libres de exploits.

«Las herramientas de generación de código para asistentes de IA son un avance realmente emocionante y es comprensible que tanta gente esté ansiosa por utilizarlas. Sin embargo, estas herramientas plantean problemas que hay que tener en cuenta de cara al futuro… Nuestro objetivo es hacer una declaración más amplia sobre el uso de modelos de generación de código», afirma Perry. «Hay que seguir explorando estos problemas y desarrollando técnicas para resolverlos».

En opinión de Perry, la introducción de vulnerabilidades de seguridad no es el único defecto de los sistemas de IA generadores de código. Al menos una parte del código con el que se entrenó a Codex está bajo una licencia restrictiva; los usuarios han podido pedir a Copilot que genere código de Quake, fragmentos de código de bases de código personales y código de ejemplo de libros como «Mastering JavaScript» y «Think JavaScript». Algunos expertos jurídicos han argumentado que Copilot podría poner en peligro a las empresas y a los desarrolladores si incorporaran involuntariamente sugerencias protegidas por derechos de autor de la herramienta en su software de producción.

El intento de GitHub de rectificar esto es un filtro, introducido por primera vez en la plataforma Copilot en junio, que comprueba las sugerencias de código con su código circundante de unos 150 caracteres contra el código público de GitHub y oculta las sugerencias si hay una coincidencia o «casi coincidencia». Pero es una medida imperfecta. Tim Davis, profesor de informática de la Universidad A&M de Texas, descubrió que activar el filtro hacía que Copilot emitiera grandes trozos de su código protegido por derechos de autor, incluido todo el texto de atribución y licencia.

«[Por estas razones,] expresamos en gran medida nuestra cautela ante el uso de estas herramientas para sustituir la educación de los desarrolladores principiantes sobre prácticas de codificación sólidas», añadió Srivastava.

Busque su consulta

Enlaces útiles

Tecnológicas:

Categorías

Enlaces útiles

La IA generadora de código puede introducir vulnerabilidades de seguridad

Inteligencia Artificial

Snap presenta sus gafas de realidad aumentada Specs con un precio de 2.195 dólares

Líderes del G7 expresan temor a un ‘apagón’ de la IA estadounidense tras el bloqueo a Anthropic

Respond.io recauda 62,5 millones de dólares para expandir su plataforma de mensajería con IA

El ‘Fable 5 Freeze’: cómo la IA descentralizada y el token DIEM de Venice ganan la guerra del cómputo

Robinhood despide al 10% de su plantilla y evita mencionar la IA como causa

Rivian despide a cientos de trabajadores tras el inicio de las entregas del R2

Prohaltefrist.de lanza una campaña para proteger la exención fiscal de criptomonedas en Alemania

Categorías

Enlaces útiles

¿Listo para suscribirte?

Enlaces útiles

Categorías

Enlaces útiles

La IA generadora de código puede introducir vulnerabilidades de seguridad

Inteligencia Artificial

Snap presenta sus gafas de realidad aumentada Specs con un precio de 2.195 dólares

Líderes del G7 expresan temor a un ‘apagón’ de la IA estadounidense tras el bloqueo a Anthropic

Respond.io recauda 62,5 millones de dólares para expandir su plataforma de mensajería con IA

El ‘Fable 5 Freeze’: cómo la IA descentralizada y el token DIEM de Venice ganan la guerra del cómputo

Robinhood despide al 10% de su plantilla y evita mencionar la IA como causa

Rivian despide a cientos de trabajadores tras el inicio de las entregas del R2

Prohaltefrist.de lanza una campaña para proteger la exención fiscal de criptomonedas en Alemania

.tdi_195{margin-bottom:10px!important} .tdi_195{color:var(--trp-white);font-family:var(--trp-sans-serif)!important;font-size:18px!important;line-height:1.2!important}@media (min-width:768px) and (max-width:1018px){.tdi_195{font-size:16px!important}}Categorías

.tdi_199{margin-bottom:10px!important} .tdi_199{color:var(--trp-white);font-family:var(--trp-sans-serif)!important;font-size:18px!important;line-height:1.2!important}@media (min-width:768px) and (max-width:1018px){.tdi_199{font-size:16px!important}}Enlaces útiles

.tdi_203{margin-bottom:10px!important} .tdi_203{color:var(--trp-white);font-family:var(--trp-sans-serif)!important;font-size:18px!important;line-height:1.2!important}@media (min-width:768px) and (max-width:1018px){.tdi_203{font-size:16px!important}}¿Listo para suscribirte?

Categorías

Enlaces útiles

¿Listo para suscribirte?