Александр Федотов. Трансформер. Когда первая ассоциация это не Оптимус Прайм

Большие языковые модели. Кто-то считает их чем-то нереальным и слишком сложным, кто-то уже знает про нейроны и веса и представляет себе просто набор слоев. Мы же с вами углубимся в сердце GPT и разберемся, как оно реально устроено. Поймем, почему существуют ограничения при работе с LLM и как гиперпараметры влияют на саму модель.
Back to Top