Import2vec: Learning Embeddings for Software Libraries

При разработке программного обеспечения огромную роль играют библиотеки. В наше время одним из важнейших навыков программирования является не только способность разрабатывать сложные алгоритмы, но и знание того, где эти алгоритмы реализованы. Но вместе с ростом количества библиотек знать их становится всё тяжелее, а собранные пользователями списки быстро устаревают. Из-за этого важной задачей является эффективная автоматическая работа с библиотеками, их сравнение и предложение наиболее оптимальных вариантов под конкретную задачу. В данной работе эта задача исследуется с точки зрения возможности создания эмбеддингов библиотек для их дальнейшего анализа. Такие эмбеддинги позволяют нам находить близкие библиотеки так же, как эмбеддинги слов помогают нам находить похожие слова. Авторы обучают эмбеддинги для трёх языковых экосистем — Java, Python, и JavaScript — и проводят качественный и количественный анализ полученных векторов. Кроме описательной статистики библиотек в экосистемах, авторы измеряют предсказатель
Back to Top