Ballistica / Нейросеть

Применение RL-сети на цифровом полигоне

Whitepapers Tactica Сеть Обучение Тренировка

Почему нейросеть на полигоне?

Высота цели зависит от рельефа

Цель на горе (+600 м) или в долине — уравнение попадания разное. Без карты высот сеть считает z=0 и ошибается по вертикали на сотни метров.

Многотраекторность

Одна дальность — две траектории. Настильная быстрее, но может встретить склон. Навесная перелетит хребет. Сеть выбирает безопасный вариант под рельеф.

Движущаяся цель

Цель едет по рельефу — её высота меняется с координатами. Упреждение надо пересчитывать с учётом h(x+dx, z+dz). Сеть делает это мгновенно.

Экономия выстрелов

Вместо пристрелки 3–5 снарядов — попадание с первого. RL-политика обучена на миллионах симулированных выстрелов с учётом рельефа и ветра.

Архитектура нейросети

V₀
скорость
Угол
возвышения
Азимут
направление
Ветер
X Y Z
Масса
снаряда
Цель
x, z, v
Рельеф
h(x,z)
Нейросеть (MLP / RL-политика)
8 входов → 128 → 64 → 4 выхода
Дальность
м
Время
с
Угол падения
°
Энергия
МДж

Режимы работы

РежимОписаниеПрименение
Прямая задача Дано: V₀, угол, азимут, ветер → сеть предсказывает точку падения Огонь по координатам
Обратная задача Дано: координаты цели, ветер → сеть выдаёт угол и азимут Поражение с 1-го выстрела
Статическая цель Цель неподвижна — расчёт по карте высот h(x,z) в точке цели Укрепления, позиции
Движущаяся цель Цель меняет позицию — непрерывный пересчёт упреждения Колонны, бронетехника
RL-коррекция После выстрела сеть сравнивает прогноз с телеметрией и корректирует модель Адаптация к износу ствола

Обучение на полигоне

Фаза 1 — Генерация данных

Симулятор прогоняет миллионы выстрелов с разными параметрами на реальном рельефе. Каждый запуск записывается: входные параметры → результат. Это эталонная таблица для обучения.

Фаза 2 — Обучение сети

Нейросеть тренируется на сгенерированных данных методом обратного распространения. Учится предсказывать точку падения без RK4 — за микросекунды вместо миллисекунд.

Фаза 3 — Валидация

Реальные стрельбы → телеметрия снаряда. Сеть сравнивает прогноз с фактом, вычисляет поправку. При расхождении (износ ствола, аномальный ветер) — дообучается.

Фаза 4 — Боевое применение

Натренированная сеть работает в реальном времени: цель движется → упреждение пересчитывается → команда наведения → выстрел. Весь цикл — доли секунды.

Преимущество нейросети над таблицами

ПараметрТаблицы стрельбыНейросеть + полигон
Скорость расчётаПоиск в таблице ~1 мсПрямой проход ~10 мкс
ТочностьДискретная (шаг таблицы)Непрерывная интерполяция
Учёт рельефаНет (только превышение)Полная 3D карта высот
Движущаяся цельРучной пересчётАвтоматически, непрерывно
АдаптацияНет (фиксированные)Дообучение по телеметрии
РазмерМегабайты таблицКилобайты весов сети