Le spin-off d'IA de l'ETH DeepCode racheté par Cybersecurity-Unicorn
Le spin-off de l'ETH DeepCode a construit la première plateforme d'intelligence artificielle pour les codes. Elle est maintenant rachetée par Snyk, une entreprise leader mondial dans l'analyse de la sécurité des codes pour les développeurs.
L'avantage décisif qui distingue le spin-off de l'ETH DeepCode est qu'il a développé le premier système d'IA capable d'apprendre rapidement à partir de milliards de codes de programmes, ce qui permet une détection basée sur l'IA des problèmes de sécurité et de fiabilité des codes. DeepCode est un excellent exemple de système d'IA moderne capable d'apprendre à partir de données, ou dans ce cas, de codes de programme, tout en restant transparent et interprétable pour l'homme.
La fusion avec Snyk, une société d'outils de sécurité qui permet aux développeurs de trouver rapidement les vulnérabilités du code et dont la valeur est d'environ 2,34 milliards de francs suisses, donne à DeepCode la possibilité d'intégrer ses compétences basées sur l'IA dans les produits Snyk existants. Le spin-off se rapproche ainsi de son objectif initial, à savoir atteindre des millions d'utilisateurs dans le monde entier. Les conditions financières de l'accord n'ont pas été divulguées.
Apprendre à partir des données fait la différence
DeepCode a été fondée à l'origine dans le but de créer la première plate-forme d'analyse de code basée sur l'IA. La motivation principale était que les développeurs avaient produit des milliards de lignes de code au cours des dernières années, qui, avec les rapports d'erreurs correspondants, les corrections de bugs et d'autres informations liées au code, étaient librement disponibles dans un certain nombre de dép?ts publics (archives numériques). L'idée clé était de construire un système d'IA capable d'apprendre à partir de ce nouveau type de données (appelé "big code"), de résoudre divers problèmes urgents de qualité du code et de détecter des failles de sécurité inconnues dans les programmes.
Une différence essentielle est que, contrairement aux outils d'analyse de code précédents qui nécessitaient des règles manuelles, erronées et écrites à la main, DeepCode est basé sur l'apprentissage automatique à partir de données : Il traite automatiquement toutes les informations liées au code et crée des modèles prédictifs qui peuvent détecter beaucoup plus d'erreurs avec une précision que les autres systèmes commerciaux ne peuvent pas atteindre.
En outre, les modèles de DeepCode sont interprétables. Cela signifie qu'un être humain peut examiner le modèle et introduire des modifications si nécessaire, une capacité qui va au-delà de tous les modèles modernes d'apprentissage profond existants. Cela fait de DeepCode un cas d'étude pour un système d'IA de troisième génération : il peut apprendre à partir de données (en l'occurrence du code), tout en étant interprétable par des humains. De plus, DeepCode a fait des progrès au niveau des algorithmes, ce qui rend cette IA non seulement plus puissante que les outils traditionnels, mais aussi plus rapide de plusieurs ordres de grandeur.
De la recherche fondamentale au marché
Alors que DeepCode a été fondé en 2016, le domaine de recherche lui-même a vu le jour à l'ETH Zurich à partir de 2013, dans le cadre d'un travail de pionnier, lorsque le doctorant de l'époque, Veselin Raychev, et Martin Vechev, professeur à l'université de Zurich, ont commencé à travailler ensemble. Laboratoire des systèmes sécurisés, fiables et intelligents du Département d'informatique de l'ETH, ont posé la première pierre avec des collaborateurs. Ils ont construit les premiers prototypes de systèmes basés sur l'IA capables d'apprendre à partir de codes, en montrant comment combiner des méthodes d'apprentissage automatique pilotées par les données avec des méthodes d'analyse de code sémantique et statique basées sur un raisonnement logique.
Il est intéressant de noter qu'à l'époque, ces deux types de méthodes étaient considérés comme distincts l'un de l'autre, sans qu'il existe un moyen clair de les relier. L'observation faite à cette occasion était qu'en trouvant des moyens de relier des domaines apparemment séparés, il était possible de construire de nouveaux types de systèmes d'IA capables de traiter efficacement des codes - ce qui pose des défis très différents de ceux rencontrés avec d'autres types de données largement diffusées, comme les images, les vidéos, le langage naturel, etc.
Durant cette période - et avec le soutien d'un ERC Starting Grant de Vechev - le groupe de recherche de l'ETH a publié plusieurs Travaux de pionniers et des systèmes de programmation publics basés sur l'IA pour différentes t?ches logicielles, que des milliers d'utilisateurs utilisent encore aujourd'hui de manière intensive (p. ex. site externeDéobfuscation, ce qui signifie qu'un code de programme est "dévoilé" pour le rendre compréhensible).
Un système d'analyse de code pour chaque développeuse
Pour ses travaux novateurs sur l'apprentissage du big code, Veselin Raychev a re?u la médaille de l'ETH pour une thèse de doctorat exceptionnelle ainsi que le prestigieux prix de l'innovation. site externePrix de thèse de doctorat ACM, Mention honorable (Top 3 des thèses de doctorat en informatique, au niveau mondial), ce qui fait de lui seulement le troisième doctorant européen en 40 ans d'existence de ce prix et le premier doctorant de l'ETH Zurich à recevoir une telle distinction.
Après avoir fait ?uvre de pionnier dans le domaine de la recherche sur l'apprentissage automatique du grand code, la mise en place d'un système d'analyse de code basé sur l'IA, qui fonctionne en production et à grande échelle, était une étape suivante naturelle. L'objectif était que chaque développeur et chaque entreprise qui crée des logiciels puisse utiliser le système d'analyse de code. C'est ainsi qu'est né site externeDeepCode,DeepCode est une société de développement de logiciels, fondée conjointement par le CTO Veselin Raychev, le CEO Boris Paskalev et le professeur de l'ETH Martin Vechev, qui protège actuellement plus de 4 millions de développeurs contributeurs et plus de 100 000 référentiels abonnés au service de DeepCode.