Доступность потерпела неудачу. Попробуйте генеративный UI = индивидуальный UX

Доступность потерпела неудачу. Попробуйте генеративный UI = индивидуальный UX

Перевод статьи Якоба Нильсена. Перевела Анжелика Герман, продуктовый дизайнер.

Краткое резюме: Традиционные методы обеспечения доступности существуют уже 30 лет и не привели к существенному удобству компьютеров для пользователей с ограниченными возможностями. Пришло время перемен, и скоро нам поможет искусственный интеллект, способный сгенерировать для каждого пользователя свой пользовательский интерфейс, оптимизированный под его уникальные потребности.


Доступность потерпела неудачу как способ сделать компьютеры удобными для пользователей с ограниченными возможностями. Мои критерии удобного дизайна одинаковы вне зависимости от того, является ли пользователь инвалидом или нет: легко ли освоить систему, высока ли производительность при выполнении задач, и приятен ли дизайн в использовании.

Если оценивать ситуацию таким образом, то движение за доступность потерпело жалкое фиаско. Компьютеры по-прежнему сложны, медленны и малоприятны для пользователей с ограниченными возможностями, несмотря на 30 лет попыток (я начал пропагандировать доступность в 1996 году, когда работал в Sun Microsystems, но ни в коем случае не утверждаю, что был первопроходцем в доступности).

Я всегда отличался от движения за доступность тем, что считаю пользователей с ограниченными возможностями просто пользователями. Это означает, что целью является удобство использования и выполнение задач. Это не цель придерживаться определенных стандартов дизайна, провозглашенных группой специальных интересов, которая провалила свою миссию.

Есть две причины, по которым доступность потерпела неудачу:

Доступность слишком дорога для большинства компаний, чтобы они могли позволить себе все необходимое при нынешней неуклюжей реализации. Существует слишком много различных видов инвалидности, которые необходимо учитывать, чтобы большинство компаний могли проводить юзабилити-тестирование с репрезентативными клиентами. Большинство компаний либо полностью игнорируют доступность, потому что знают, что не смогут создать достаточно хороший UX , чтобы привлечь нужное количество клиентов с ограниченными возможностями, либо тратят минимум средств, необходимых для галочки, но никогда не проводят юзабилити-исследования с пользователями с ограниченными возможностями, чтобы подтвердить или опровергнуть удобство дизайна.

Доступность обречена на создание некачественного пользовательского опыта, независимо от того, сколько компания вкладывает средств, особенно для незрячих пользователей, которые получают линейный (одномерный) слуховой пользовательский интерфейс для представления двухмерного графического интерфейса (GUI), предназначенного для большинства пользователей.

Пожилые и малограмотные пользователи — исключение

Прежде чем перейти к моим рекомендациям по оказанию помощи пользователям с ограниченными возможностями в целом, позвольте мне упомянуть, что две огромные группы пользователей действительно могут получить помощь с помощью существующих подходов: пожилые и малограмотные пользователи.

Под «пожилыми» пользователями подразумеваю людей старше 75 лет, у которых начинают проявляться основные симптомы старения, такие как ослабление памяти. Таким пользователям нужна упрощенная навигация, упрощенные функции сравнения, не требующие удержания информации в кратковременной памяти, и упрощенные объяснения. Такое упрощение является сложной задачей, и самый простой UX требует серьезных усилий при проектировании и проведения итеративного пользовательского тестирования, в ходе которого дорабатываются последующие версии дизайна. Make It Easy всегда был одним из моих главных UX-лозунгов, но достижение этой цели — тяжелая работа.

Плакат "Make It Easy": изначально сделан с помощью Ideogram, затем увеличен с помощью Leonardo.
Плакат "Make It Easy": изначально сделан с помощью Ideogram, затем увеличен с помощью Leonardo.

В качестве примера вышеприведенного изображения можно привести разницу между юзабилити-подходом и подходом к поддержке пользователей с ограниченными возможностями. Многие сторонники доступности настояли бы на том, чтобы к изображению был приложен ALT-текст, гласящий что-то вроде: "Стилизованная графика с медведем в центре в шляпе рейнджера. Над медведем крупным шрифтом выведена фраза "MAKE IT EASY". На заднем плане изображен лес с несколькими соснами и текстурированное, старинное небо. Рисунок выполнен в стиле ретро, напоминающем плакаты национальных парков середины века, и использует ограниченную цветовую палитру, состоящую из оттенков зеленого, коричневого, оранжевого и белого". (Именно такой текст я получил от ChatGPT, когда попросил его написать ALT-текст для этого изображения).

С другой стороны, я не хочу тормозить незрячего пользователя со скринридером, проговаривая словесный салат. Да, я могу - и должен - отредактировать ALT-текст ChatGPT, чтобы он стал короче, но даже после редактирования описание внешнего вида иллюстрации не будет полезным для выполнения задачи. Я предпочитаю придерживаться подписи, которая гласит, что я сделал плакат с UX-слоганом "Keep It Simple".

Возвращаясь к пожилым пользователям, отметим, что в Соединенных Штатах в настоящее время насчитывается около 23 миллионов человек в возрасте 75 лет и старше. Совокупный чистый капитал этих пользователей составляет около 23 триллионов долларов. Инвестиции в улучшение юзабилити стоят того, чтобы получить свою долю этих денег (это еще более верно, если учесть, что если сделать веб-сайт более удобным для пожилых людей, то он также станет более удобным для молодых пользователей. Хотя они, возможно, не так сильно нуждаются в этом, они все равно оценят возросшее удобство использования).

Мы также должны помнить, что определение "пожилые пользователи" начинается примерно в 45 лет, что связано с ухудшением зрения. Опять же, если рассматривать только Соединенные Штаты, то 140 миллионов пользователей выиграют, если мы откажемся от мелкого шрифта.

Вторая огромная группа потребителей с ограниченными возможностями состоит из малограмотных пользователей. Это люди, которые умеют читать, но не очень хорошо. Признаюсь, что в своих работах я не ориентируюсь на эту группу (например, уровень чтения этой статьи - 13-й класс, то есть читатель должен быть как минимум на втором курсе института, чтобы понять ее). Но если вы обслуживаете широкую аудиторию, вы должны поддерживать малограмотных пользователей. Обычно я рекомендую писать для этой аудитории на уровне 8-го класса.

По оценкам международных исследований в области чтения, около 40% взрослого населения США можно отнести к категории малограмотных. (Это около 100 миллионов человек. Думайте о знаках доллара, когда читаете эту статистику). В таких странах, как Япония, Сингапур, Южная Корея и Китай, уровень грамотности выше, но все равно около 30% взрослого населения малограмотны (Япония - единственная страна, в которой уровень грамотности составляет около 25%). Если рассматривать такие страны, как Чили, Мексика и Турция, то уровень неграмотности в них превышает 80% взрослого населения (поскольку исследование проводилось в богатых странах и странах со средним уровнем дохода, у нас нет данных по обнищавшим развивающимся странам с ужасной школьной системой, но их показатели, скорее всего, еще хуже).

Нелегко написать текст на уровне 8-го класса, и генеративный ИИ часто не попадает в цель, если вы поручаете ему создать текст на заданном уровне чтения. Поэтому перед публикацией всегда проверяйте текст с помощью инструмента для чтения. Тем не менее, это четкое руководство к действию, и ИИ определенно может помочь в упрощении сложных тем.

Таким образом, поддержка малограмотных читателей вполне целесообразна для компаний, клиентами которых является широкая аудитория.

Поддержка пользователей с ограниченными возможностями требует генеративного пользовательского интерфейса

Теоретически вы можете вручную разработать пользовательский интерфейс для каждой основной категории пользователей с ограниченными возможностями. Вы можете провести пользовательское тестирование с участием представителей каждой из этих групп и итерационно дорабатывать свой дизайн до тех пор, пока он не будет соответствовать заданным критериям юзабилити.

Это никогда не произойдет, поэтому давайте забудем о недостижимом идеале.

Нам нужен подход, который масштабируется и может поддерживать пользователей с самыми разными заболеваниями. К счастью, такой подход сейчас появляется в виде генеративного пользовательского интерфейса.

Генеративный UI - это применение искусственного интеллекта для автоматической генерации дизайна пользовательского интерфейса с использованием алгоритмов, которые могут создавать различные варианты дизайна на основе заданных параметров или вводимых данных. В настоящее время это обычно делается на ранних стадиях процесса UX-дизайна, и дизайнер дорабатывает сгенерированный искусственным интеллектом проект пользовательского интерфейса, прежде чем он будет воплощен в традиционном приложении. При таком подходе все пользователи видят один и тот же пользовательский интерфейс, и он остается неизменным при каждом обращении к приложению. Пользовательский опыт может быть индивидуализирован в небольшой степени, но текущий рабочий процесс предполагает, что пользовательский интерфейс в основном застыл в тот момент, когда дизайнер подписывает его. Я предлагаю термин "генеративный пользовательский интерфейс первого поколения" для "замороженных" дизайнов, когда ИИ изменяет пользовательский интерфейс только перед отправкой продукта.

Я предвижу появление гораздо более радикального подхода к генеративному UI в ближайшее время - возможно, через 5 лет или около того. В этом генеративном UI второго поколения пользовательский интерфейс создается заново каждый раз, когда пользователь обращается к приложению. Самое важное, что это означает, что разные пользователи получат кардинально разный дизайн. Так мы искренне помогаем пользователям с ограниченными возможностями. Но свежая генерация пользовательского интерфейса также означает, что он будет подстраиваться под пользователя по мере того, как он узнает больше о системе. Например, новичкам можно показать более упрощенный интерфейс, а опытным пользователям - расширенные возможности.

Переход к генеративному пользовательскому интерфейсу второго поколения произведет революцию в работе UX-специалистов. Мы больше не будем разрабатывать точный пользовательский интерфейс, который увидят наши пользователи, поскольку для каждого пользователя он будет свой и генерироваться во время выполнения. Вместо этого UX-дизайнеры будут задавать правила и эвристики, которые ИИ использует для создания пользовательского интерфейса.

Не паникуйте.

Несмотря на постоянное увеличение, потеря точного контроля над дизайнером, присущая генеративному UI, очень похожа на изменения, произошедшие с адаптивным веб-дизайном. До появления адаптивного дизайна многие веб-дизайнеры стремились к пиксельно идеальному контролю над своими творениями. Но с появлением адаптивного дизайна это стало невозможным, поскольку элементы дизайна перемещались по экрану (а иногда появлялись или исчезали) в зависимости от размера области просмотра каждого пользователя.

Не паникуйте, даже если генеративный UI второго поколения будет означать серьезные изменения в вашем подходе к проектированию, в том числе потерю тонкого контроля (Midjourney).
Не паникуйте, даже если генеративный UI второго поколения будет означать серьезные изменения в вашем подходе к проектированию, в том числе потерю тонкого контроля (Midjourney).

В следующей инфографике сравниваются традиционный подход к обеспечению доступности и новый генеративный подход к пользовательскому интерфейсу. Традиционно создавался единый UI. Зрячий пользователь просто использует этот графический интерфейс напрямую. Незрячий пользователь сначала использует программу чтения с экрана, преобразовывая UI в слова. Затем этот поток слов будет произнесен вслух для прослушивания пользователем. Такая непрямолинейность приводит к ужасным последствиям для пользователя: при использовании 2D зрячий пользователь может визуально просмотреть весь экран и выделить интересующие его элементы. Незрячий же пользователь вынужден слушать все подряд, если только он не воспользуется функцией, позволяющей пропускать (и, таким образом, полностью пропускать) некоторые части.

Доступность потерпела неудачу. Попробуйте генеративный UI = индивидуальный UX

В генеративном UI искусственный интеллект получает доступ к базовым данным и функциям и преобразует их в пользовательский интерфейс, оптимизированный для конкретного пользователя. Для зрячего пользователя это, скорее всего, будет графический интерфейс, а для незрячего - звуковой. Зрячие пользователи могут получить пользовательский интерфейс, похожий на тот, что был у них раньше, но генерируемый пользовательский интерфейс будет оптимизирован для этого пользователя с учетом уровня чтения и других потребностей. Для незрячего пользователя генеративный пользовательский интерфейс позволяет обойтись без представления данных и функций в двухмерной схеме, которая никогда не будет оптимальной при линейном представлении.

Помимо создания оптимизированных 1D представлений для незрячих пользователей, генеративный пользовательский интерфейс может оптимизировать работу пользователя и другими способами. Поскольку прослушивание текста происходит медленнее, чем его визуальное сканирование, версия для незрячих пользователей может быть сгенерирована таким образом, чтобы быть более краткой. Кроме того, текст может быть адаптирован к уровню чтения каждого пользователя, обеспечивая легкое восприятие для всех.

Комментарии от экспертов по доступности и искусственному интеллекту в России:

Я восхищаюсь стандартом по цифровой доступности WCAG именно потому, что в нем описаны принципы, но нет указаний на технологии. Нигде в WCAG не написано, что разработчик должен писать alt-текст. В стандарте звучит, что у любого нетекстового контента должна быть текстовая альтернатива. Какая технология будет использована – уже выбор разработчика продукта: это может быть alt-text в HTML, GPT, человек на телефоне или что-то еще. И использовать для этого современные технологии – конечно, логично.

Конечно же нельзя забывать про экономику. Сложилось ощущение, что Нильсон не очень хорошо представляет, сколько стоит разработка генеративных решений. Для создания моделей, так же, как и для создания интерфейсов – необходимы ресурсы разработки. В дополнение к ресурсам разработки – иногда еще нужно собирать массив данных, на которых модель будет обучаться – это тоже ресурсы. И в дополнение к стоимости разработки и данным – еще добавляется стоимость железа, которое задействуется каждый раз, когда генерируется решение. Железо – один из ключевых факторов для более эффективного развития GPT, и оно стоит дорого, это важно понимать.

Если, как пишет Нильсон, не все компании сегодня готовы вкладывать ресурсы на создание доступной цифровой среды, не очень понятно, почему они решат инвестировать ресурсы на создание моделей для создания доступной цифровой среды. Поэтому мне кажется, что цель автора не в том, чтобы показать, что технологии устарели, ведь никто не мешает использовать новые, а цель – в продвижении идеи – «Будет здорово, если интерфейс будет подстраиваться под пользователя по мере того, как он узнает больше о системе. Например, новичкам можно показать более упрощенныи интерфеис, а опытным пользователям –расширенные возможности». На мой взгляд эта мысль не очень новая – дизайнеры давно мечтают о такой кастомизации и, конечно, когда это произойдет – выиграют все – и люди с инвалидностью, и без нее.

Продвигать идею Нильсон пробует на примере объективно уязвимой аудитории. Я думаю, в данном контексте не очень корректно предлагать убить один вариант, когда альтернативного рабочего варианта еще не существует. Представьте, врачи перестанут лечить людей от рака, говоря, что в будущем появятся более эффективные лекарства. Но вопрос – что делать тем, кто болен сегодня? Люди с таким весом в индустрии должны четко понимать, насколько высоко их влияние и ответственность. Поэтому продвижение любой идеи или гипотезы от такого человека – должно быть максимально обдумано и осознанно, чтобы не оказать негативного влияния на жизнь и без того, уязвимой аудиторий.

Валерия Курмак, руководитель Инклюзии в Яндексе

В статье есть странные ошибки про проблему восприятия графического 2д интерфеса через звуковой 1д интерфес, но про это уже написали много раз. Хочется про другое: культуру и инструменты.

Сама идея, чтобы доступностью занимался AI — хорошая. Чтобы интерфейс в итоге подстраивался под каждого пользователя индивидуально — блестящая. Но в реальности мы получим АБ-тесты лендингов сгенерированных через AI.

Рельная проблема кроется в том, что проще всего максимизировать видимую часть работы. Дизайнер нарисовал макет для трех экранов, а разработчик их запрограммировал, менеджер принял проект, все отлично, результат видно. Но при этом намного сложнее замерять скорость загрузки и работы программы, анимации не видно на статичном макете, автотесты не написаны, потому что это вообще не задача текущего проекта и, конечно, это слабо адаптированно для скринридера и других технологий. В итоге, видимый результат максимизируется, а нефункциональные свойства проекта теряются. Сложно, тут нужен накопленный коллективный опыт, т.е. развитая культура внутри компании, до этого добираются немногие.

Другая проблема, что все еще критически мало инструменты, которые помогают делать доступно. Сколько плагинов в фигме, которые позволяют разметить макет для скринридера? А сколько из них умеют адаптировать мобилку? Как проектировать голосовое управление? А как сверстать макеты под вариативный размер шрифта? Эти вопросы с трудом решаются даже у тех, кто очень хочет заниматься доступностью. Проблема не только в проектировании, но и в тестировании. Например, почти невозможно написать автотесты, которые бы проверяли, что мы ничего не сломали в доступности в новой версии приложения.

Доступность находится на стыке компетенций, поэтому получает все минусы:

⁃ сложно дизайнить и прототипировать (нет инструментов)

⁃ сложно разрабатывать (потому что нет знаний и насмотренности)

⁃ сложно тестировать (потому что нет библиотек)

Поможет ли в этом AI? Конечно, но для этого кто-то должен пойти и сделать эти инструменты, а с этим проблема как была, так и останется.

Михаил Рубанов, iOS Mobile Head в Dodo. Автор rubanov.dev/a11y-book и t.me/DodoM

Начну с AI, поскольку именно он является краеугольным камнем в статье Якоба. Даже такие инструменты как ChatGPT или MidJourney не позволяют в полной мере получить желаемый результат. Да, компании вкладывают в них миллиарды и если сравнить разницу между первой и шестой версией генерации изображений – продвижения явно есть и это хорошо. К тому же, совсем скоро появится Sora – создание генеративного видео по текстовому запросу. Но пока еще очень рано говорить о том, что AI сможет создать революцию. Точнее, революция точно будет, то не через 5 лет. Под революцией я понимаю создание контента, доработка которого будет занимать очень мало времени (либо вовсе не требовать ее). Сейчас невозможно будет создать новый интерфейс, просто выгрузив базу данных с существующим интерфейсом и попросить “create new interface for blind people”. Если говорить кратко: нейросеть “учится” тому, что, по факту, создал человек. Если человек создал скринридер, то нейронка будет о нем знать, но создать нечто революционное с полного нуля – очень маловероятно, но возможно, почему нет.

Так я хочу плавно перейти к главной проблеме статьи – провал доступности. С одной стороны доступность требует огромных денег, времени. А с другой – бизнес в первую очередь нацелен на получение прибыли. В статье, кстати, есть пояснения про платежеспособность людей с ограниченными возможностями. Но эти данные рассчитаны были для США – гиганта экономики. В любой другой, даже европейской стране, я уверен, цифры будут гораздо меньше. Поэтому, здесь нужно подходить не с финансовой точки зрения, а с технической. Работа над ИИ, который, как заявлено в статье, в теории сможет генерировать уникальный интерфейс под каждого человека – задача куда сложнее, чем продолжать нынешнюю работу над доступностью. ИИ не должен “решить” проблему с нуля, он должен ее “облегчить”.

Пока все это звучит как абсурд, но возможно это пророческое предсказание Якоба, который действительно будет прав.

У меня остается один мучительный вопрос: как находить общий язык между людьми, если каждый будет интерпретировать интерфейс по-своему? Кто будет прав – малограмотный человек или профессор наук? Я думаю, что Якобу стоит присмотреться к Илону Маску, а именно к чипу нейролинк, который может дать зрение (пускай не идеальное) незрячему человеку. Доступность не про деление людей, а их объединение.

Максим Марсов, продуктовый дизайнер в сфере финтех организаций, AI nerd

Мне кажется, что генеративный интерфейс второго поколения будет серьезной помощью для пожилых людей, особенно для тех, у кого есть когнитивные нарушения. Мне регулярно приходилось наблюдать эту группу и я видел, какие у них возникают трудности и проблемы при взаимодействии с современным интерфейсом.

Что касается незрячих пользователей, то большая часть этой группы - консерваторы. Любое изменение интерфейса вызывает у них дополнительные проблемы и трудности, так как для изучения этого самого интерфейса и последующего эффективного использования приложений или сервисов, им необходимо гораздо больше времени и внимания по сравнению со зрячими пользователями. Поэтому нетрудно предположить, что будут испытывать эти люди, когда генеративный UI нового поколения, с целью подстройки под пользователя, будет изменять местоположение и количество элементов управления, а также содержание самого контента. Или может быть предполагается какая-либо другая механика?

Дмитрий Бороухин, исследователь доступности

Концепция индивидуально адаптируемых пользовательских интерфейсов не нова, и Google, например, использует алгоритмы машинного обучения для анализа потребностей пользователей и изменения интерфейса. Однако важно отметить различия между машинным обучением и искусственным интеллектом. Ключевой вопрос заключается в том, может ли генеративный ИИ кардинально изменить разработку интерфейсов, делая их индивидуально адаптированными? Я полагаю, что да. Ведь это позволит создавать по-настоящему удобные и персонализированные интерфейсы. Однако встаёт вопрос: кто и как будет определять, что является удобным для пользователя? Ведь предпочтения разных людей сильно различаются. Даже если говорить только о людях с нарушениями зрения, одному нужен доступный и контрастный ползунок. Другому хочется раскрывающийся список с цифрами. Одномерное представление для слепых, о котором идет речь в статье. А может, я хочу, наоборот, трехмерное, чтобы быстрее перемещаться между элементами, условно говоря, между уровнями. Это концепция, сложная для новичка, но понятная для тех, кто имеет опыт.

Кроме того, следует упомянуть о текущей популярности и чатов на основе ИИ, которые всегда под рукой. На основе этой концепции даже представлены прототипы некоторых операционных систем. Google и тут стал впереди планеты, интегрировав в новую версию Chrome OS свою лингвистическую модель Gemini, которая в перспективе сможет решать большое количество пользовательских задач. Да я и сам использую ChatGPT на Windows.

И если объединить две этих концепции в одну, то мы получим возможность попросить искусственный интеллект сгенерировать интерфейс под наши потребности, а это уже совершенно новый пользовательский опыт и революция в мире разработки ПО.

Кирилл Шмелев, системный аналитик

По поводу статьи хочу сказать, что Джейкоб нарисовал крутую, красивую картинку будущего, которая, к сожалению, недостижима (во всяком случае в том виде, в котором он её привёл)

У генеративных ИИ в их текущем виде есть много проблем, типа галлюцинаций и тухлых данных, на которых интеллект обучался, которые ещё предстоит решить. И даже если предположить, что эти проблемы будут исправлены в течении пяти лет, которые автор упоминает в статье, то это не упростит ситуацию. То, что предлагает Джейкоб — практически невозможно реализовать, во всяком случае не в ближайшие пять лет точно.

Почему так? Автор предлагает переизобрести подход, с помощью которого мы создаём интерфейсы. В самом рвении нет ничего плохого, но это потребует безграничного количества ресурсов и времени, чтобы это сначала создать, а потом внедрить и довести до ума.

Сама идея использования ИИ для упрощения и улучшения доступности мне безумно импонирует и уверен, что в ближайшем будущем будет появляться всё больше и больше решений на основе ИИ, которые призваны помочь людям с ОВЗ. Такие решения уже сейчас есть у Apple, а также в приложении BeMyEyes (последнее основано на GPT). Очень интересно узнать, как именно мы будем использовать ИИ в сфере доступности через 10 лет, и в заявлениях Джейкоба нет ничего плохого — это как раз фантазия на тему того, как может быть.

Евгений Пятков, старший разработчик в Dodo

Подписывайтесь на наш Telegram-канал, там мы публикуем полезное про дизайн и доступность

33
Начать дискуссию