\chapter{Интерфейсы взаимодействия человек-машина на основе слежения глаз} Интерфейсы «мозг-машина» на основе слежения за глазами (айтрекинга) представляют собой высокоскоростной канал передачи информации, который переводит визуальное внимание и когнитивное состояние человека в команды управления в режиме реального времени. \begin{figure}[h!] \centering \includegraphics[width=0.8\linewidth]{eye-tracking} \caption{Области применения технологии слежения за глазом \cite{Chhimpa2025}} \label{fig:eyeappl} \end{figure} \section{Ключевые области применения} Технология вышла за рамки лабораторий и активно внедряется в критически важные сектора (рис \ref{fig:eyeappl}): \begin{enumerate} \item \textbf{Автомобильная безопасность}: Согласно протоколам Euro NCAP \cite{DriverMo12} 2026 (см таблицу \ref{tab:euroncap-2026}), системы мониторинга водителя (DMS) становятся обязательными для получения пятизвездочного рейтинга безопасности. Прямое отслеживание глаз позволяет выявлять не только сонливость, но и алкогольное или наркотическое опьянение по специфическим микродвижениям век и зрачка. \item \textbf{Ассистивные технологии}: Для пациентов с синдромом «запертого человека» \cite{Gomathy2024} интерфейсы на основе взгляда являются единственным способом коммуникации. Современные системы включают предиктивный ввод текста и коррекцию ошибок, значительно ускоряя процесс общения. \item \textbf{Робототехника}: Интеграция айтрекинга с робо-руками позволяет выполнять динамическое планирование пути за 2,97 миллисекунды, \cite{Xie2025} обеспечивая интуитивный захват предметов силой взгляда. \item \textbf{Клиническая диагностика}: Характеристики саккад\footnote{быстрые, строго согласованные движения глаз, происходящие одновременно и в одном направлении} и стабильность фиксации используются как биомаркеры для мониторинга прогрессирования болезни Паркинсона с чувствительностью до 80,4\%. \item \textbf{XR и пространственные вычисления}: Динамический фовеальный рендеринг снижает вычислительную нагрузку на графический процессор, отрисовывая в высоком разрешении только ту зону, куда направлен взгляд. \cite{Eyetrack44} \end{enumerate} \begin{table}[h!] \centering \caption{Метрики Euro NCAP 2026 по мониторингу состояния водителя} \label{tab:euroncap-2026} \begin{tabular}{|l|p{4cm}|p{5cm}|} \hline \textbf{Метрика Euro NCAP 2026} & \textbf{Детали требований} & \textbf{Стратегия реализации} \\ \hline Продолжительность взгляда\footnotemark & Отслеживание взглядов $<2с$ и $>2с$ & Датчики прямого отслеживания взгляда и головы \\ \hline Размещение телефона & Обнаружение на коленях или в поле зрения\footnotemark & Широкоугольные камеры мониторинга салона \\ \hline Окно оценки состояния & Анализ в течение первых 10 минут & Непрерывный анализ биометрических данных \\ \hline Доступность системы & Включена по умолчанию при каждой поездке & Интегрированная логика запуска системы автомобиля \\ \hline \end{tabular} \end{table} \footnotetext{Согласно новым протоколам, критическим считается отвлечение более чем на 2 секунды (Long Glance).} \footnotetext{Включает детекцию рук водителя и визуальное распознавание корпуса смартфона.} \section{Технологические прорывы в области} Развитие глубокого обучения позволило переводить физиологические движения в осознанные намерения с высокой точностью: \begin{enumerate} \item \textbf{Классификация движений (GMM-HMM)}\cite{Xie2025}: Использование гауссовых смесей и скрытых марковских моделей позволяет разделять типы движений на фиксации, саккады и плавное преследование с точностью 94,39\%. \item \textbf{Оптимизированное детектирование (YOLOv11)}: Улучшенные модели на базе YOLOv11 повысили точность распознавания радужной оболочки на 9,9\%, что критично для определения направления взгляда в сложных условиях. \item \textbf{Обучение без учителя (Representational Learning)}: Фреймворки вроде DMAGaze обучаются отделять признаки взгляда от индивидуальных особенностей лица или освещения, что повышает надежность систем в неконтролируемой среде. \end{enumerate} \section{Основные технологии слежения глаза} \begin{table}[h!] \centering \caption{Сравнение модальностей систем отслеживания взгляда} \label{tab:eye-tracking-modalities} \begin{tabular}{|p{2cm}|p{3cm}|l|p{2cm}|p{3.5cm}|} \hline \textbf{Тип модальности\footnotemark} & \textbf{Механизм считывания} & \textbf{Частота} & \textbf{Энергия} & \textbf{Ключевое преимущество} \\ \hline VOG & NIR-камера / блики (glint) & 90--120 Гц & Высокое & Высокая пространственная точность при стабильном свете \\ \hline EOG & Электрический потенциал & Непрерывно & Низкое & Независимость от освещения; высокая амплитуда \\ \hline Событий-ные & Асинхронный DVS-сенсор & $\approx$1 кГц & Ультраниз-кое & Без размытия движения; фиксация микросаккад \\ \hline Радар & Волны 60--120 ГГц & 300 Гц & Среднее & Работает без прямой видимости глаза \\ \hline \end{tabular} \end{table} \footnotetext{В контексте человеко-компьютерных интерфейсов (HCI) и нейротехнологий термин «модальность» означает конкретный канал связи или тип физического сигнала, который используется для передачи информации от человека к машине.} Эффективность систем слежения за глазом зависит от точности сбора данных, который реализуется через три основные технологические семьи \begin{enumerate} \item \textbf{Видеоокулография (VOG)}: Современный коммерческий стандарт, используемый в гарнитурах Apple Vision Pro и VIVE Focus Vision. Система использует инфракрасные светодиоды для создания бликов на поверхности глаза, которые фиксируются камерами для вычисления вектора взгляда. Для качественной работы (например, для фовеального рендеринга) требуются частоты дискретизации выше 100 Гц. \item \textbf{Электроокулография (EOG)}: Измеряет электрический потенциал между роговицей и сетчаткой. Преимущество EOG заключается в том, что амплитуда сигнала (более 1 мВ) значительно выше типичных сигналов ЭЭГ, что упрощает обработку. Метод независим от освещения, косметики или наличия контактных линз, что делает его идеальным для клинического мониторинга пациентов с тяжелыми нарушениями моторики. \item \textbf{Нейроморфные событийные сенсоры (DVS)}: Самое революционное направление, где сенсоры фиксируют не целые изображения, а изменения интенсивности света в каждом пикселе асинхронно. Это позволяет достичь временного разрешения на уровне микросекунд, необходимого для фиксации микросаккад и ускорений глаза до 24 000°/с². Система E-Gaze на базе DVS достигает точности 0,46° при частоте обновления 950 Гц. \cite{egaze} \end{enumerate} \section{Состояние сектора в России} О многих игроках мы уже говорили в секции \ref{sec:rus-bmi}. Здесь немного продублируем эту информацию, может раскроется с чутка другой стороны. \subsection{Коммерческие компании и продукты} \begin{enumerate} \item \textbf{ГК Нейроботикс}\cite{neurobotics} \\ Ведущий разработчик нейротехнологического оборудования. \begin{itemize} \item \textbf{Продукт:} Линейка стационарных и мобильных айтрекеров \textbf{Eye-track}. \item \textbf{Применение:} Создание ассистивных интерфейсов для управления инвалидными колясками и программными комплексами «виртуальной печатной машинки» через фиксацию взгляда. \end{itemize} \item \textbf{Нейрочат (NeuroChat)}\cite{neurochat} \\ Социально значимый проект, специализирующийся на сетевой коммуникации. \begin{itemize} \item \textbf{Продукт:} Мультимодально-интерфейсная система связи. \item \textbf{Применение:} Реабилитация пациентов с тяжелыми нарушениями речи и моторики. Система интегрирует технологию отслеживания глаз для быстрого выбора объектов на экране в дополнение к ЭЭГ-каналам. \end{itemize} \item \textbf{ГК «Исток-Аудио»} \cite{istok}\\ Разработчик комплексных ИТ-решений для инклюзивного образования. Помимо этого, основной вид деятельность - перепродажа существующих инклюзивных решений в России. \begin{itemize} \item \textbf{Продукт:} Специализированное ПО \textbf{EyeTracking.care}. \item \textbf{Применение:} Адаптация компьютерных рабочих мест для людей с ОВЗ, использование взгляда как основного манипулятора в образовательном процессе. \end{itemize} \end{enumerate} \subsection{Научно-исследовательские группы} \begin{enumerate} \item \textbf{Лаборатория нейрофизиологии и нейрокомпьютерных интерфейсов (МГУ им. М.В. Ломоносова)} \\ Под руководством проф. А.Я. Каплана. \begin{itemize} \item \textbf{Направление:} Исследование гибридных ИМК (интерфейсов мозг-компьютер), где айтрекинг используется для определения пространственного внимания, а ЭЭГ — для подтверждения намерения совершить действие. \end{itemize} \item \textbf{Центр когнитивных нейронаук (НИУ ВШЭ)} \\ Академическая группа, сфокусированная на когнитивной психологии и HCI. \begin{itemize} \item \textbf{Направление:} Изучение паттернов движения глаз для оценки когнитивной нагрузки и проектирования интуитивно понятных интерфейсов «человек-машина». \end{itemize} \item \textbf{Институт системного программирования (ИСП РАН)} \\ Группы, занимающиеся машинным зрением. \begin{itemize} \item \textbf{Направление:} Разработка алгоритмов компьютерного зрения для бесконтактного окулографического анализа (Gaze Estimation) без использования дорогостоящих ИК-датчиков. \end{itemize} \end{enumerate} \section{Выводы о применимости в рамках лаборатории} Основная проблема в технологиях отслеживания взгляда - взгляд Мидаса\cite{Liao2022}. То есть ложные срабатывания из-за непроизвольных или непреднамеренных (без желания совершить действие) движениях глаза. Решение этой проблемы является важным направлением работы, существует три основных метода для решения данной проблемы: повышение задержки, жесты глазами и совмещение с данными ЭЭГ. Если говорить о применимости в рамках лаборатории и потенциальных направлениях работы, то можно выделить следующее: \begin{enumerate} \item Создание устройств для мониторинга состояния водителя по стандарту Euro NCAP 2026 \item Управление взглядом телевизором или устройствами LG. Заход сюда может идти через решение существующих проблем. \end{enumerate}