Ballistica / Обучение

Whitepapers Tactica Сеть Обучение Тренировка

Классы обучения нейросети

Как работает: выбрать класс и урок → параметры подгружаются из tactica.html. Симуляция запускается с заданными весами наград. Нейросеть учится минимизировать ошибку попадания с учётом рельефа. 2 боеприпаса: 152 мм ОФ и 120 мм мина.

Таблица весов наград

Обозначения весов: прогресс — сокращение 3D-дистанции до цели, точка — бонус за вход в радиус цели, точность — штраф за отклонение, высота — штраф за отклонение от высоты цели, время — штраф за длительность полёта, авария — штраф за падение/промах, Vстаб — стабильность вертикальной скорости, Курс — выдерживание курса, Тангаж — стабильность тангажа, Vгор — стабильность горизонтальной скорости.