DataFuSion 10 в шаге от Успеха Армянское Радио Уберите Fu ion город из Матрицы Шок ИИ не поможет при отсутвии естественного
Зион (англ. Zion) - имитация единственного и последнего города на планете Земля. Город является отправной точкой для сопротивления против машин. В Зионе жили более 250 000 людей. Он находился глубоко под землёй, недалеко от ядра, обеспечивая жителям тепло, пригодное для жизни.
DataFuSion - в шаге от Успеха Армянское Радио Уберите Fu ᛋion город из Матрицы Шок: Искуственный интеллект не поможет при отсутвии естественного
Ежегодная конференция ВТБ по Data Fusion, оправдывая своё название, собрала самых разных людей с очень интересными идеями. Общепринятое значение термина Data Fusion – объединение нескольких источников данных и их обработка, в результате которой получается нечто более полезное, чем могли бы дать эти источники по отдельности. В этой статье – о том, что запомнилось больше всего и привлекло наибольшее внимание с точки зрения Data Science.
В вводной части Светлана Сикуляр, Gartner VP Analyst, рассказала о трендах в отрасли:
data-сайентистов дополняют инженеры, внедряя готовые модели и тестируя MVP (стала актуальной даже сама роль Model Validator из банковского бизнеса);
федеративное обучение оказалось широко востребовано, в частности, в фарме (например, при создании вакцины от людей Moderna).
Этой идеей пронизана вся концепция Data Fusion, что отлично видно на примерах, затронутых на круглом столе Data Fusion и работа с клиентами. От «скрещивания» данных мобильных операторов с гео-данными, как рассказали руководитель продуктов больших данных в госсекторе Константин Загуменов и TechLead проектов по исследованию больших данных Вадим Уваров из Tele2, до техник противодействия мошенникам у Почты России, которыми поделился Алексей Деревянкин.
Теперь к отдельным докладам, на которые хочется обратить особое внимание.
Ансамбли нейросетей
Нейросети тренируются так, чтобы показывать идеальный результат на обучающей выборке. Вследствие этого они и потом демонстрируют некоторую «самоуверенность». Другими словами, нейросети выдают чёткий результат даже тогда, когда ответ не так уж однозначен.
Чтобы решить эту проблему, применяется метод ансамблирования нейросетей: вместо результата одной единственной сетки берётся среднее по ансамблю (например, математическое ожидание по ансамблю независимо обученных сетей).
Графовая аналитика
Андрей Райгородский (МФТИ) рассказал про современные применения теории графов к анализу данных. «Чистые» математики давно знают и любят теорию графов (максимально упрощая – теорию о том, как точки можно соединять линиями. Никогда не говорите при них такое!). А в последние годы, к радости теоретиков, она получила самое непосредственное применение.
В докладе речь шла про Интернет как граф: сайты – это точки (вершины), а ссылки с одного сайта на другой – это линии (рёбра графа).
Изучая граф, можно сделать множество наблюдений. Например, что общая структура Интернета устойчива к случайному воздействию на разнообразные сайты, но уязвима при атаках на «хабы» – крупные сайты, связанные с множеством других.
Самое доступное из возможных объяснение графа Бакли-Остгуса.
Ещё один интереснейший факт: независимо от того, как разрастается Интернет – а делает он это с приличной скоростью – доля «хабов», имеющих d ссылок, обратно пропорциональна этому числу d в небольшой положительной степени.
Очень доступно Андрей Райгородский рассказал о модели Buckley-Osthus, которую можно использовать для исследования таких графов. Её суть сводится к тому, что некоторый новый сайт будет, скорее всего, связан с одним из наиболее популярных имеющихся сайтов. Слова «скорее всего» означают в данном случае, что вероятность будет пропорциональна количеству входящих ссылок.
ML и временные ряды
Евгений Бурнаев рассказал про перенос классических методов ML на прогнозирование временных рядов. Такая задача возникает, например, при анализе действий пользователей.
Fake News и постправда
В 2015 году термину «fake news» было посвящено около 100 научных публикаций. В 2020 году – более 24000. Причина здесь, конечно, не только в злободневности этой темы, но и в тех возможностях, которые в связи с этим открывают методы обработки естественного языка (NLP).
Итоги
Хотелось рассказать обо всём сразу, но (естественно) не получилось. Был целый блок, связанный с этическими и юридическими тонкостями и с тем, как с ними обходиться (с помощью препроцессинга и других методов).
Data Science уже вышла на тот уровень, когда обычными конференциями «обо всём сразу» ограничиваться нельзя: есть очевидный спрос на более нишевые, «отраслевые» мероприятия. И это как раз тот случай. Все заинтересованные могут посмотреть все выступления и доклады мероприятия собственными глазами:
На прошедшем мероприятии мы воочию засвидетельствовали, что шаги, которые наука раньше проходила за десятилетия, сегодня занимают годы, а то и месяцы. Что ж, это как минимум радует. В комментария
1 view
3433
1288
6 months ago 00:09:06 1
Play to Earn Games | Crypto Game | Play to Earn Money
6 months ago 01:24:11 17
Павел Лукша: Краткий гид по третьему десятилетию 21 века
6 months ago 01:07:36 4
Алексей Перевозчиков: IBM BOA - моделирование и симуляции в десятки раз быстрее
6 months ago 01:54:53 5
Мастер-класс Филипа Милевчича «Как определить компанию, которая выживет в изменяющемся мире?»
6 months ago 02:33:10 6
Learn RAG From Scratch – Python AI Tutorial from a LangChain Engineer
6 months ago 00:14:49 31
DataFuSion 10 в шаге от Успеха Армянское Радио Уберите Fu ᛋion город из Матрицы Шок ИИ не поможет при отсутвии естественного
7 months ago 00:29:06 1
Ultimate FPS Controller Design & Build
7 months ago 08:12:07 25.8K
Прямой эфир конференции Data Fusion 2024, сессии зала “Атом“ 18 апреля 2024
7 months ago 06:42:51 115.7K
Прямой эфир конференции Data Fusion 2024, сессии зала “Молекула“ 17 апреля 2024
7 months ago 05:33:43 30.5K
Прямой эфир конференции Data Fusion 2024, сессии “Online Only“
7 months ago 00:07:17 1
The problems with Helion Energy - a response to Real Engineering
7 months ago 00:17:31 1
「ロックマンX DiVE」Rockman X DiVE — 偽りの英雄X (Zero-zeries x X DiVE Event) [JP STORY]
7 months ago 01:00:01 1
Chase & Status BBC Radio One DnB60 - 13/06/2022
7 months ago 05:09:03 1
Drum & Bass Lost Tapes - Classic Mix
8 months ago 01:59:47 2
Bes - Oldschool Techneurostepfunk Mix
8 months ago 01:11:46 1
Fusion 360 3D Marquee for 3D Printing
8 months ago 00:32:37 5
Depeche Mode - Deep House - Señor B Session #deephouse
8 months ago 01:51:45 1
Drum&Bass шоу НЕЙРОГОН. Межсезонье. Тяжёлый.
8 months ago 00:09:40 1
Как сделать бота в телеграмме | Telegram Bot
8 months ago 01:30:35 1
Магистерский курс C++ (МФТИ, 2022-2023). Лекция 7. Классическое метапрограммирование.
8 months ago 00:09:06 1
Futuristic Armored Vehicle Capable of 200 Km/Hour - Cockerill i-X
8 months ago 00:56:56 1
Blades of Vengeance (1993) (Sega MD)➤4 часть➤Лес-чудес и Змей-Горыныч, ну и финальный аккорд
8 months ago 00:25:15 1
Hell Let Loose Gameplay (PC UHD) [4K60FPS]
8 months ago 00:54:49 1
Blades of Vengeance (1993) (Sega MD)➤3 часть➤И вновь босс-голова, рыцари и Ястреб