Spanish English French German Italian Portuguese
Marketing Social
InicioGeneralCyberseguridadLa IA generadora de código puede introducir vulnerabilidades de seguridad

La IA generadora de código puede introducir vulnerabilidades de seguridad

Según un estudio reciente, los ingenieros de software que utilizan sistemas de IA para generar código tienen más probabilidades de provocar vulnerabilidades de seguridad en las aplicaciones que desarrollan. El trabajo, del que es coautor un equipo de investigadores afiliados a Stanford, pone de relieve los posibles escollos de los sistemas de generación de código a medida que proveedores como GitHub empiezan a comercializarlos en serio.

«Actualmente, los sistemas de generación de código no sustituyen a los desarrolladores humanos», explica en una entrevista por correo electrónico Neil Perry, doctorando en Stanford y coautor principal del estudio. «Los desarrolladores que los utilizan para completar tareas fuera de sus propias áreas de especialización deben estar preocupados, y aquellos que los utilizan para acelerar las tareas en las que ya son expertos deben comprobar cuidadosamente los resultados y el contexto en el que se utilizan en el proyecto general.»

El estudio de Stanford se centró específicamente en Codex, el sistema de generación de código de IA desarrollado por el laboratorio de investigación OpenAI, con sede en San Francisco. Los investigadores reclutaron a 47 desarrolladores -desde estudiantes universitarios hasta profesionales del sector con décadas de experiencia en programación- para que utilizaran Codex para resolver problemas relacionados con la seguridad en lenguajes de programación como Python, JavaScript y C.

Codex se entrenó con miles de millones de líneas de código público para sugerir líneas de código y funciones adicionales teniendo en cuenta el contexto del código existente. El sistema propone un enfoque o solución de programación en respuesta a una descripción de lo que un programador quiere conseguir (por ejemplo, «Di hola mundo»), basándose tanto en su base de conocimientos como en el contexto actual.

Según los investigadores, los participantes en el estudio que tenían acceso a Codex eran más propensos a escribir soluciones incorrectas e «inseguras» (en el sentido de ciberseguridad) a problemas de programación en comparación con un grupo de control. Y lo que es aún más preocupante, eran más propensos a decir que sus respuestas inseguras eran seguras en comparación con las personas del grupo de control.

Megha Srivastava, estudiante de posgrado en Stanford y segunda coautora del estudio, subraya que los resultados no son una condena total del Codex y otros sistemas de generación de código. Por ejemplo, los participantes en el estudio no tenían conocimientos de seguridad que les hubieran permitido detectar mejor las vulnerabilidades del código. Aparte de eso, Srivastava cree que los sistemas de generación de código son útiles para tareas que no son de alto riesgo, como el código de investigación exploratoria, y que podrían mejorar sus sugerencias de codificación con un ajuste fino.

«Las empresas que desarrollen sus propios [sistemas], quizá con más formación sobre su código fuente interno, podrían salir mejor paradas, ya que el modelo podría animarse a generar resultados más acordes con sus prácticas de codificación y seguridad», afirma Srivastava.

Entonces, ¿cómo podrían proveedores como GitHub evitar que los desarrolladores introduzcan fallos de seguridad utilizando sus sistemas de IA generadores de código? Los coautores tienen algunas ideas, entre ellas un mecanismo para «refinar» las instrucciones de los usuarios para que sean más seguras, como si un supervisor examinara y revisara borradores de código. También sugieren que los desarrolladores de bibliotecas criptográficas se aseguren de que sus configuraciones por defecto son seguras, ya que los sistemas de generación de código tienden a ceñirse a valores por defecto que no siempre están libres de exploits.

«Las herramientas de generación de código para asistentes de IA son un avance realmente emocionante y es comprensible que tanta gente esté ansiosa por utilizarlas. Sin embargo, estas herramientas plantean problemas que hay que tener en cuenta de cara al futuro… Nuestro objetivo es hacer una declaración más amplia sobre el uso de modelos de generación de código», afirma Perry. «Hay que seguir explorando estos problemas y desarrollando técnicas para resolverlos».

En opinión de Perry, la introducción de vulnerabilidades de seguridad no es el único defecto de los sistemas de IA generadores de código. Al menos una parte del código con el que se entrenó a Codex está bajo una licencia restrictiva; los usuarios han podido pedir a Copilot que genere código de Quake, fragmentos de código de bases de código personales y código de ejemplo de libros como «Mastering JavaScript» y «Think JavaScript». Algunos expertos jurídicos han argumentado que Copilot podría poner en peligro a las empresas y a los desarrolladores si incorporaran involuntariamente sugerencias protegidas por derechos de autor de la herramienta en su software de producción.

El intento de GitHub de rectificar esto es un filtro, introducido por primera vez en la plataforma Copilot en junio, que comprueba las sugerencias de código con su código circundante de unos 150 caracteres contra el código público de GitHub y oculta las sugerencias si hay una coincidencia o «casi coincidencia». Pero es una medida imperfecta. Tim Davis, profesor de informática de la Universidad A&M de Texas, descubrió que activar el filtro hacía que Copilot emitiera grandes trozos de su código protegido por derechos de autor, incluido todo el texto de atribución y licencia.

«[Por estas razones,] expresamos en gran medida nuestra cautela ante el uso de estas herramientas para sustituir la educación de los desarrolladores principiantes sobre prácticas de codificación sólidas», añadió Srivastava.

RELACIONADOS

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

La moderación de comentarios está activada. Su comentario podría tardar cierto tiempo en aparecer.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

SUSCRÍBETE A TRPLANE.COM

Publica en TRPlane.com

Si tienes alguna historia interesante sobre transformación, IT, digital, etc con cabida en TRPlane.com por favor envíanosla y la compartiremos con toda la Comunidad

MÁS PUBLICACIONES

Activar Notificaciones OK No gracias