Frontera распределенный робот для обхода веба в больших объемах / Александр Сибиряков (Scrapinghub)
Приглашаем на конференцию HighLoad 2024, которая пройдет 2 и 3 декабря в Москве!
Программа, подробности и билеты по ссылке:
--------
HighLoad 2015
Презентация и тезисы:
В этом докладе я собираюсь поделиться нашим опытом обхода испанского интернета. Мы поставили перед собой задачу обойти около 600 тысяч веб-сайтов в зоне .es с целью сбора статистики об узлах и их размерах. Я расскажу об архитектуре робота, хранилища, проблемах, с которыми мы столкнулись при обходе, и их решении.
...
1 view
82
20
4 weeks ago 00:47:05 1
Frontera распределенный робот для обхода веба в больших объемах / Александр Сибиряков (Scrapinghub)
1 year ago 00:03:31 1
В Мексике ураган “Отис“ последствия 100 погибших в Акапулько 900 тысяч людей нуждается в пище и воде
9 years ago 00:32:11 2
Александр Сибиряков - Frontera: распределенный робот для обхода интернета в больших объемах