Компания IBM рассчитывает создать для интеллектуальных средств разработки своего рода аналог ImageNet, фактически ставшего стандартным набора изображений для тренировки ИИ-моделей. На конференции THINK компания сообщила, что для этого она собрала огромный массив исходных кодов.
Набор, получивший название Project CodeNet, содержит 14 млн образцов суммарным объёмом в 500 млн строк кода на более чем 55 языках программирования: от Java, C и Go до COBOL, Pascal и FORTRAN. Впрочем, более трёх четвертей всего кода приходится на С++ и Python.