Paper:
For more on my research:
Follow me at:
Authors: Ankit Shah, Shen Li, Julie Shah
Massachusetts Institute of Technology
Reward engineering is crucial to high performance in reinforcement learning systems. Prior research into reward design has largely focused on Markovian functions representing the reward. While there has been research into expressing non-Markov rewards as linear temporal logic (LTL) formulas, this has focused on task specifications directly defined by the user. However, in many real-world applications, task specifications are ambiguous, and can only be expressed as a belief over LTL formulas. In this paper, we introduce planning with uncertain specifications (PUnS), a novel formulation that addresses the challenge posed by non-Markovian specifications expressed as beliefs over LTL formulas. We present four criteria that capture the semantics of satisfying a belief over specifications for d
4 views
2557
696
4 months ago 01:21:56 1
УЧАТ В ШКОЛЕ: Петерсон против «Школы России». Секретные имена учителей. Оценки и «домашка» – зло?
4 months ago 01:02:48 1
Главная проблема ИИ, которую никто не может решить
4 months ago 00:55:51 1
Мелоди де Ягер: Гравитация, мозг, обучение
4 months ago 00:12:55 1
5 уровней ИИ от Сэма Альтмана | Boston Dynamics создает супер робота | Новости Илона Маска
4 months ago 00:06:10 1
Уроки Unity с нуля.Урок 3: Работа с инструментами unity
4 months ago 00:40:49 10
Кто оплатит колонизацию Луны: экономика хайпа
4 months ago 00:01:30 1
Достаточно ли воды? Лиза Гудкин . Директор по обучению.Русский перевод робота
4 months ago 00:06:53 1
NASA запустило к Европе станцию Europa Clipper. Amazon строит атомные станции для своих дата-центров
4 months ago 00:13:00 2
Уроки Unity с нуля. Урок 2 Знакомство с интерфейсом
4 months ago 00:00:59 1
Чему учить детей сегодня? Продолжение на канале @ #Асмолов #shorts
4 months ago 02:33:20 1
ИИ Спасение Или Трагедия Для Человека? Ольга Ускова.
4 months ago 01:29:15 1
SMILES-2024: Иван Сосин о технологиях навигации мобильных роботов
4 months ago 00:20:34 5
Антология технологий Яндекс Такси. По ту сторону поддержки
4 months ago 00:15:39 1
Большой бесплатный курс Unity с нуля. Установка UnityHub и Unity
4 months ago 00:13:43 1
Игра для обучения программирования Java 2024 (Robocode)
4 months ago 00:20:11 1
48 НОВЫХ ТОВАРОВ с Алиэкспресс, Новые Вещи От Которых Точно ОФИГЕЕШЬ + КОНКУРС
4 months ago 00:10:40 1
23 НОВЫХ ТОВАРОВ с Алиэкспресс, Новые Вещи От Которых Точно ОФИГЕЕШЬ + КОНКУРС
4 months ago 00:20:27 1
47 НОВЫХ ТОВАРОВ с Алиэкспресс, Новые Вещи От Которых Точно ОФИГЕЕШЬ + КОНКУРС
4 months ago 00:04:16 64
Nigel Stanford - Robots Vs. Music
4 months ago 00:02:28 1
Сила намерения. Сила мысли. Удивительный эксперимент. Рене Пиош. Цыпленок и робот.
5 months ago 00:02:31 1
Dresden Symphony Orchestra experiments with a robot conductor