Продукт

OMNI

ИИ видит экран и взаимодействует с интерфейсом

Агент на основе зрения: понимает интерфейс по скриншоту и выполняет действия — на десктопе и на телефонах, без доступа к коду приложения.

О технологии

Классические автоматизации опираются на DOM, доступ к API или координаты. Подход на чистом зрении (vision-based) другой: модель получает скриншот экрана и сама находит интерактивные области и их смысл.

OMNI — наша разработка: парсинг интерфейса в структурированные элементы, детекция кликабельных областей и их семантика. Технология улучшена и оптимизирована под бизнес-задачи: агенты работают по скриншотам точно и предсказуемо — на десктопе и на мобильных устройствах.