Виртуальная боевая подруга вместо унылой AI дуры

Пробую разобраться, почему меня всегда так раздражали существующие виртуальные ассистенты - при том, что в фантастике уже давно описаны все возможные нужные и полезные их функции.И они реализуемы, но их нет :(

Прячется ли в тайной лаборатории СберКасперЯру - крутая, сексуальная и остроумная <b><i>Яна Декс</i></b>, если Алисо-Маруси-Сары такие холодные, скучные и бесполезные? Помечтаем?<br />

Статья построена по принципу:
• описание функции
• прогнозы по реализации.

Скажите, Вы лично довольны опытом взаимодействия с виртуальными ассистентами?

Да, абсолютно!

Скорее да, чем нет.

Скорее нет, чем да

Нет!

Я сам(а) виртуальный ассистент

Update: Pixel Lens сообщил, что "люди работают, всё договорено" - решение разрабатывается на ChatGPT и общение с вирт. девой платное ;)

Все помнят, чему мы обязаны появлению дурацкой плашки "I'm not a robot". А ведь были (и есть). такие мини-скрипты, интенсивно симулирующие человеческую деятельность в Internet - в-основном занимающиеся накруткой - кликов по баннерам, голосованиям, другим монотонным и повторяющимся действиям. Для онлайн игр скрипты ботов добывали виртуальное золото - совсем как в недавнем анекдоте:

Умный дом - это когда он подключается к соседскому вайфаю ночью и втихаря майнит крипту, чтобы платить за себя ипотеку. А не вот это вот всё.
anekdot.ru

Ботов, в итоге, до конца не победили, но теперь все мы выбираем то светофоры, то автомобили, то гидранты. Причем у голосовых ассистентов, ботов по определению - такого функционала нет, хотя - а как же компьютерное зрение, а как же нейросети, а как же .. как же .. никак!

Мой опыт _попыток_ использования голосовых помощников сводится к тому, что время от времени я по ошибке врубаю то Siri, то вот недавно Марусю - и спрашиваю что-то максимально простое, "Как пройти в библиотеку" - чтобы получить ме-ха-ни-че-ско-е про-чте-ни-е левых поисковых результатов, или классическое "Я не поняла Ваш вопрос". В свою очередь, при звонках на линии поддержки, пока истошным ослом не заорёшь "Апииратааар" (Оператор) и не повторишь это еще 2-3 раза, тебя будет водить по кругу успокоительных речитативов с музыкальным сопровождением бесконечно. Хитом в лабиринте доступа к живому человеку тут выступила справочная МТС я не смог нащупать алгоритм навигации по голосовому меню, пока не посетил их салон связи - там уже подсказали, что-то такое 2-1-2-0 (на тот момент!). В равной степени в Ростелекоме и Мегафоне и в Сбере - всё время похоже только и делают, что усложняют дорогу к живому ответу :)

Нужны ли нам такие голосовые "помощники"? На старой Nokia 6110 я ставил будильник, открывал или начинал писать SMS, звонил на 3-5 частых номеров - даже не задумываясь, парой нажатий нажатий на кнопки. На iPhone или Android так не сделать, а последняя попытка пройти quiz от Ситилинка (15 секунд на вопрос из школьной программы, 10 вопросов) - показала, что я набираю текст и нажимаю Enter быстрее, чем голосовой помощник, подтупливая, распрознает речь и начинает заааачиииитыыыывать первый из результатов поиска.

Ничего сверхординарного и супер-фантастического я так-то не требую . И все, вроде как, вполне достижимо уже сейчас, но - как и с iPhone в середине 200X-х - компоненты существуют по отдельности: смартфоны и приложения в них, голографические проекторы, разного качества AI для разных целей, геолокация, распознавание речи и синтез речи, распознавание и синтез изображений, веб управление устройствами через Internet, фитнес трекеры, и т.д. Я в курсе, что у них всех разные SDK и API, и зоопарк диких приложений не зря рассажен по клеткам - они, мягко говоря, не очень дружат между собой даже в экосистеме Apple :(

Голография из 1978 года. Насчет "голо" IT tech 1985-2023 очень может, а голографии - нет :(<br />

Вот только всё это вместе не образует законченной системы, хотя бы аналогичной той, что Leela из Futurama носит на предплечье или AI корабля у Ольги Громыко в книгах - по сути, виртуальной личности, имеющей как _понимание_ потребностей пользователя, так и реально помогающей в жизни, выполняющей часть рутинных действий. И мотивирующей на успех зажигательными танцами, сообщающей summary длинных документов, и многое-многое другое, укладывающееся в понятие искусственные интеллект :)

Такое странное ощущение, что прогресс как-то давно остановился. Где революционные изобретения за последние 10 лет? Google, Apple, Microsoft, Boston Dynamics уже очень давно что-то эволюционно развивают, периодически перенося сроки выполнения и просто закрывая проекты. Из последнего - нам вроде обещали очки дополненной реальности - но они больше похоже на издёвку. Да и в умные колонки, по-моему, все наигрались, они оказались немного туповаты, при том что слушают "эфир" постоянно, и так-то непонятно, куда эту информацию передают. Про дроны доставки Амазона и Яндекса, про удаленный доступ к умному дому или автомобилю - тоже отношение двояковыпуклое - вроде круто, а вот если пароль взломают, то неизвестно кто может сделать очень и очень много с Вашим имуществом, а не просто заказать 100 такси для топа VC, как это кто-то сделал в 201X году.

Они нас подслушивают. Я имею в виду вирт. ассистенток на смартфонах и колонках :)<br />

Периодически агентство ОБС доносит волны слухов про то, что и смартфоны "слушают" нас, и лучше ничего лишнего не говорит, если телефон не в авиарежиме, то есть поздравляю, мы все стали разведчиками, которым требуется, как известно, выходить в парк для приватного разговора или обмениваться записками на перекуре, которые потом сжигать в пепельнице. В дополнение злые языки говорят, что СОРМ на голосовую связь уже давно работает в режиме автоматической расшифровки разговоров с фильтрацией ключевых слов и уведомлениями, то есть и по обычному телефону тоже лучше разговаривать только о погоде, цветах и чего купить в магазине. Про соцсети, я думаю, все и так знают, но остаётся вспомнить только комментарий одного опера, узнавшего про Internet в начале 200X и с удивлением спросившего более опытного коллегу: "Послушай! Они что, сами про себя это пишут и выкладывают? Да это же Клондайк, залежи протоколов допросов!"

Поэтому главное требование к личному виртуальному секретарю, это

1/ Конфиденциальность, высокие требования к безопасноти и работа без Internet доступа (как у Maps.Me). Это означает платный доступ уже на ранней стадии проекта и его автономность, хотя бы условную, хотя бы на уровне Tor
Реально: Думаю, да - до определенной степени. В конце концов, есть же израильская компания, работающая только для b2g клиентов, и специализирующаяся на взломе смартфонов и приложений - благодаря заранее оставленным дырам в безопасности, заботливо переданным им производителями, и обновляемым с каждым новым релизом. Это вроде плохо, но по сути означает, что в-целом _нормальные_ пользователи смартфонов и приложений так-то защищены существующими стандартами безопасности. Но не особо защищены от терморектального метода взлома, но тут уж се ля ви.

Как-то так уже давно-давно обещают сделать, но не сделали!<br />

2/ Визуализация - кроме выбора голоса я хочу и видеть (мужчины - глазами!) VR ассистента в виде по-разному одетой голограммы (Help me Obi-Wan Kenobi!) или хотя бы проекции на стену. Я предпочитаю девушек скандинавского типа, но запросы у пользователей будут разные.

Генерация 3D изображения по контексту или хотя бы с перебором из большой библиотеки пресетов. Обновляемой. В конце концов, боты в Counter Strike выполняли заскриптованные действия неплохо уже более 20 лет назад.
Реально? Да, компактные голо-проекторы есть, но пока просто крутят готовое 3D изображение, приблизительно как акула в "Назад в будущее" (на 01:08). А потребуется рельная AI Маша на базе мощного компьютера космического корабля, как у Ольги Громыко в Космобиолухах. Наработки есть - вот 3D модель девушки , созданная аж в 2019-м году в Японии.

Хотя бы как-то так, постоянная спутница, знающая меня от А до Я и прикольная<br />

3/ Снятие тру .. ограничений в общении - нет, я не только про аналог винрарной VirtuaGirl HD (16+ gif по ссылке, но всё прикрыто) я думаю, Вы слышали про скандалы с голосовыми помощниками и нейросетями, периодически делающих мощные политические и неполиткорректные заявления - всё на основании поисковой выдачи, кстати. Так вот, мне не нужен голосовой поиск для Яндекса, а вот умная вирт. любовница совсем бы не помешала. Как и мнооогим другим. Ну вот не хочу я везде и всюду натыкаться на тупые цензурные отговорки-заглушки, тогда как существующие голосовые помощницы "не знают" про ряд "запрещенных тем", и по-моему это никак не изменить настройками. Как 11 сентября замедлило check in и транзит в аэропортах до невозможности, так поэтапно вводимые в Internet ограничения потихоньку превращают её в антиутопию - яркий пример - использование налички и кнопочного телефона с для авторизации в сервисах по двухфакторке, более-менее защищающих от взлома банк-клиента и других приложений.
Реально? Не особо, потому что, скажем рынок adult индустрии странным образом позволяет производство и продажу криповых реалистичных секс-кукол за $5k, но не потянет разработку вирт. ассистента - не привязанного к одной из мощных IT компаний, которые жестко ограничивают функционал - до уровня голосового интерфейса к своей поисковой системе или своему гаджету. То есть, это должен быть все-таки независимый проект, сразу нацеленный на adult аудиторию - чтобы не закидали исками. Ведь Family Guy как-то производит медиа-контент, нарушающий такие-всякие нормы и правила, и всё ок.

4/ Самообучение Я понимаю, что персонализация голосового помощника требует мощного AI, которого, скорее всего пока нет ни у кого. И это совсем не механическое запоминание истории поиска, голосовых паттернов членов семьи и так далее. Есть фильм "BigBug" 2022, где у андроида (т.е. робота-горничной) прямое подключение к функциям умного дома, вот просто представьте, что этот андроид - не электро-кукла, а AI в компьютере, который действительно знает - чего я хочу, заказывает продукты, проверяет счета, сообщает, что пришла зарплата, читает почту и сообщает о важном вовремя.

Реально: Мне кажется, да .. но я хотел бы узнать больше о перспективах самообучения AI систем в ближайшие 5-10 лет - в комментах. Желательно воздержаться от рекомендаций, вроде:

Эх, жениться Вам надо, барин
Из анекдота

Ну не то чтобы прямо в библиотеку за светом знаний отправить, но как-то так<br />

5. Посоветоваться чтобы можно было. Мы все принимаем решения, разной степени ответственности. Умеем пользоваться поисковыми системами. Но из-за стресса, цейтнота, лени - очень часто решаем что-то на интуиции или монетку подбрасываем. Чтобы купить что-то ненужное, в среднем приходится потратить пару часов времени на: общение с доверенными специалистами по теме, просмотр и прокручивание отзывов покупателей (включая подставных), сравнение всяких функций, поиск лучшего предложения по цене/гарантии. Наверняка экспертную помощь в этом может оказать виртуальный ассистент - покопавшись в этой Big Data и подав информацию структурированно.

Реально: Не уверен, потому что с аналитикой у Pythonов не очень - нажрутся неструктурированных данных и дальше просят, чтобы им объяснили, какие взаимосвязи между ними нужно найти. Но очень бы хотелось, потому что информации и вправду слишком много вокруг и желание в ней рыться со временем уступает место скуке.

6. Какие функции я забыл, какие Вы хотели бы видеть у виртуальных ассистентов? Помимо киберсекса, который был и остаётся недостижимой мечтой всего прогрессивного человечества. Реально: Нет :(

Виртуальная боевая подруга вместо унылой AI дуры

Есть такое относительно неновое понятие "тульпа" - которую Яндекс классифицирует как "карманная шизофрения для гиков" - то есть человек целенаправленно работает над созданием внутри себя как бы второй личности, и иногда у него (обычно мальчика) получается создать такую личность (обычно девочку). Ну, или сойти с ума, в буквальном смысле. Так вот, не продвигая эту идею, хотелось бы получить такой же результат (не в смысле сбрендить) - только в компьютерном виде. И в принципе, я тут подумал - не обязательно прямо полноразмерную девушку. Достаточно Tinker Bell, как у Питер Пена - или как в книжке "Товарищ Вова" от Василий Панфилов - где феи-пикси слегка оживляют пост-апокалиптический мир, хоть они и маленькие, но весёлые.

Дальше по теме - Lifehacker подсказывает, что явление называется Toonophilia (от слова Cartoon) - т.е. страсть к мультяшным персонажами. А anekdot ru подкидывает из 2010-го года ёмкое слово "3D-вятое царство" - намекая, что если человек склонен верить в сказки, он будет искать их всю жизнь :)

Уже после написания статьи, вспомнил про немецкий фильм 2018 года "100 вещей и ничего лишнего" (глянуть можно тут) ... где в самом начале главные герои презентуют голосового помощника-девушку - только в виде голоса существующую, но на нереально мощном, сильно развитом AI. И со вторым смыслом - интенсивно общаясь с первым главным героем, она сливает данные второму, под его руководством подсовывая товары и услуги под личные предпочтения первого - а тот покупает-покупает-покупает .. На этом месте, Pixel Lens из комментов может быть прав - если рассматривать голосовых ассистентов как интеллектуальную функцию продажи товаров и услуг, то зачем огород городить - если тут великолепно справится любая жена :)

P.S. Поводом для написания стала чья-то реклама о голосовом секретаре, который будет прорываться через голосовых роботов "при Ваших звонках в службы поддержки". Переводя на русский - для начала разговора двух людей, теперь потребуется, чтобы сперва пообщались два робота.

Как Вы наверняка знаете, добраться до живого оператора - в банках, провайдерах связи, сервисных службах - стало заметно труднее. Поэтому я живо представляю себе общение этих двух роботов:

- Мы рады Вашему звонку, пожалуйста выберите тему Вашего обращения
- Оператор!
- ... тему Вашего обращения ...
- Оператор!!!
- ... из предложенных пунктов ...
- Оператор ... <ноль в тоновом режиме> .. Оператор!
- не удалось определить .. в личном кабинете или приложении ... (тууу-тууу-тууу)

Если в службе поддержки даже удаётся попасть на оператора, то:

С чатботом общаешься или с живым сотрудником определить все сложнее - скрипты у них одинаковые
Twitter

Список источников - голограммы, виртуальные личности, киборги
1. Звездные войны, Эпизод IV, Скрытая угроза (1977) и далее.
2. Конечно, Пятый Элемент, 1997
3. Duran-Duran, Electric Barbarella, 1997
4. Aqua, Barbie Girl, 1997
5. Алекс Орлов, многие из книг 1997-2022, если не все :)
6. Ольга Громыко - прежде всего Космобиолухи, 2011 и их продолжения
7. Осторожно Модерн-2, серия Атака клонов
8. Futurama почти вся и особенно I dated a robot
9. Конечно, Пелевин с его ярким S.N.U.F.F. и частично дальше.
Добавляйте еще источники в комментах и чем они Вам понравились по функциям - их ведь должны быть десятки ...