▲

▼

Цифровые помощники и проблема доверия

---, 27-02-2024 ,

2219

Наши «цифровые помощники» — Siri, Алиса, «Окей Гугл», Alexa и прочая Маруся прямо сейчас топчутся на важном рубеже, перейти который уже некоторое время не очень получается — и не только по технологическим соображениям.

Рубеж этот заключается в принципиальной разнице между «окей, Гугл, покажи мне авиарейсы в Питер на пятое число» и «Сири, купи мне билет в Питер на пятое». Одно дело — когда помощник просто собирает для тебя информацию, совсем другое — когда помощник сам принимает решение. Делегировать принятие решения непросто, даже если речь о помощнике из мяса и костей: нужна уверенность, что помощник не просто способен сделать лучший выбор, но и сделает его в твоих интересах.

Помощнику-человеку нужно создать мотивацию действовать именно в твоих интересах. Как именно — об этом написаны тысячи книг; тут и финансы, и личная преданность, и религиозные мотивы, и мораль, и чего только нет. Цифрового помощника достаточно запрограммировать на нужное «поведение» (ну, то есть на оптимизацию по параметрам, нужным именно тебе). Одна проблема: помощника, как правило, программируешь не ты.

Хорошо, если принятое решение легко проверить. Если камера в телефоне «промахнулась» в балансе белого, это сразу видно. Впрочем, такие решения уже давно делегированы, с ними проблем нет. Ещё хорошо, когда интересы автора системы-помощника совпадают с интересами пользователя: программисты спам-фильтров, как правило, в самом деле хотят, чтобы в твоей почте было меньше спама. Правда, тут уже возможен конфликт интересов: Mail.ru может быть не очень мотивирована отфильтровывать спам от VK, а почта Yahoo — спам от Verizon, например…

К сожалению, по состоянию на сегодня средства и компетенции для разработки худо-бедно универсальных «цифровых помощников» есть только у крупных компаний, и конфликт интересов практически неизбежен. Выбирая между тобой и ООО «Яндекс», кому во благо примет решение Алиса в твоём телефоне? Каковы шансы, что Маруся при выборе, где купить товар, предпочтёт Ozon, а не Мегамаркет — даже если на первом дешевле и быстрее? Люди, конечно, бывают всякие, но я сильно сомневаюсь, что в таких условиях кто-то готов доверить помощнику принятие решений, даже если этот кто-то погружен в соответствующую бизнес-экосистему «с потрохами».

Логика подсказывает, что для устранения этого конфликта интересов надо, чтобы разработчик «цифрового помощника» не занимался ничем другим и не был аффилирован с другими компаниями. Понятно, что это будет сервис с подпиской, на первых порах — недешёвой, но, насколько я понимаю, прямо сейчас никакая разумная стоимость подписки не окупит разработку такой системы. Остаётся надеяться на технический прогресс, который такую разработку удешевит. Впрочем, конечно, эта модель не решит вопросы с товарищем майором и проблемы приватности; по-настоящему доверять «цифровому помощнику» можно будет лишь тогда, когда это будет открытый код, работающий полностью на устройстве пользователя, а до этого ещё очень далеко.

Так или иначе, по логике получается, что у нынешних участников этого соревнования шансов нет в принципе — ни у Amazon, ни у Google, ни у Яндекса со Сбером; разве что Apple с Сири может на что-то рассчитывать. Впрочем, от людей чего угодно можно ждать: на сегодня в России 70% рынка занимают два браузера, разрабатываемые компаниями, основной бизнес которых — реклама в интернете… ;)

▲ 3 ▼ zhiliyo 28-02-2024

Можно сделать как убер: финальное одобрение от пользователя все-аки потребуется, а для генерации кандидатов и цен методом АБ тестов и машинного обучения большая компания филигранно подберёт коэффициент при котором пользователь будет немного терять в деньгах, но не так сильно, чтобы уйти на другое решение. Поиск баланса между сиюминутным заработком и долгосрочным удержанием пользователя - важная часть работы большой компании над продуктом.

ответить

▲ 2 ▼ anonymous 28-02-2024

Fun Fact: для обучения нейросетки-споттера(той, которая понимает что было сказано "Алиса!") нужны данные. То есть куски звука в которых есть и в которых нет слова-активатора. Внимание вопрос, откуда они берутся? https://www.mk.ru/social/2023/01/31/v-yandeks-priznali-chto-kolonka-alisa-mozhet-podslushivat-polzovateley.html

Готов поспорить что у гугла, эппла, и кто там еще помощников делает - была ровно та же проблема, и соблазн решить ее вот таким неэтичным способом вполне мог победить

ответить

▲ 0 ▼ anonymous 28-02-2024

Типичная газетная сенсация. Если почитать даже текст заметки там же, а не только заголовок, то рандомный сбор был только для сотрудников, которым колонки раздали на бета-тест, в 201лысом году.

Как добучать споттер. Откуда взять куски звука, в которых нет слова-активатора, сервису, с которым пользователи активно разговаривают 100500 раз в час? Хмммммм, дайте-ка подумать, даже и не приходит в голову, наверное, надо подслушивать в моменты, когда они с ним не разговаривают.

(я уж не говорю о том, что false positive-ы просто из потока активаций можно забирать)

ответить

▲ 2 ▼ anonymous 28-02-2024

Типичная газетная сенсация. Если почитать даже текст заметки там же, а не только заголовок, то рандомный сбор был только для сотрудников, которым колонки раздали на бета-тест, в 201лысом году.

Ну как бы активации в рандомное время даже на сотрудников звучат ну очень некрасиво.

Как добучать споттер. Откуда взять куски звука, в которых нет слова-активатора, сервису, с которым пользователи активно разговаривают 100500 раз в час? Хмммммм, дайте-ка подумать, даже и не приходит в голову, наверное, надо подслушивать в моменты, когда они с ним не разговаривают.

Интересно, а почему Яндекс решил сделать иначе? Да потому, что обучающая выборка должна быть разнообразной. Только голос обращенный к алисе в качестве негатив-примеров не пойдет.

(я уж не говорю о том, что false positive-ы просто из потока активаций можно забирать)

Всего-то надо размечать на фолс-позитивы, правда, в чем же сложность?

ответить

▲ 1 ▼ anonymous 28-02-2024

активации в рандомное время даже на сотрудников звучат ну очень некрасиво

Факт.

Только голос обращенный к алисе в качестве негатив-примеров не пойдет

Совершенно нормально подходит. Много оценок нужно в серой зоне, а это как раз она. Рандомные разговоры и прочие не обращенные к ней звуки добираются синтетикой и аугментациями.

а почему Яндекс решил сделать иначе?

Не думаю, что это осознанно решил Яндекс или даже "команда Алисы". Максимум какой-то конкретный мудак к ревью.

Всего-то надо размечать на фолс-позитивы, правда, в чем же сложность?

Нет сложности. Ровно так и делается. Толокеры очень дешево с этим справляются.

ответить

▲ 2 ▼ anonymous 29-02-2024

Максимум какой-то конкретный мудак к ревью.
Не знаю. Это или очень плохие процессы(один мудак смог такое катнуть и его не остановили) или мудаков несколько включая кого-то довольно высокого. Хз что из этого правда, но факт остается фактом - некрасиво получилось

ответить

▲ 2 ▼ anonymous 28-02-2024

Насколько я понял, не совсем. Всем сотрудникам включался бета-тест на колонках, привязанных к аккаунту, привязанных к стаффу, при этом, естественно, на то, что это за колонка, не смотрели, и если был, скажем, семейный аккаунт, то эти колонки тоже попадали. Сотрудников об этом предупредить, как всегда, забыли. Естественно, то, что это было раскачено только на сотрудников, мы узнали от тех же людей, которые встроили это в код, никого не предупредив. Не может ли тут быть некоторого, как это называется, конфликта интересов? В общем, мой любимый комикс и на это имеет стрип

ответить

▲ 2 ▼ finder 27-02-2024

Интересно. Может, как с людьми, появится разделение исполнительных и контролирующих функций? Накупил себе помощников от разных производителей, один за вторым присматривает и одергивает, если что, а третий в случае их конфликта суммаризирует его максимально объективно и выдает хозяину на суд

ответить

▲ 3 ▼ evasa1nt 27-02-2024

С людьми/компаниями как будто не очень работает. Контролирующая часть компаний (акционеры) принимают решения в интересах акционеров. Исполнительная часть - в интересах менеджмента. В интересах пользователей никто не действует, если только они не совпадают с интересами одной из групп.

ответить

▲ 1 ▼ terminutz 28-02-2024

В интересах пользователей никто не действует

В интересах пользователей действует конкуренция.

Но для этого нужно несколько игроков на рынке с одинаковым уровнем решения базовой потребности "болталки". А дальше уводить клиентов у конкурента как раз за счет более хорошего решения продвинутых сценариев.

Но похоже, что нам еще далеко до такой ситуации на рынке. И непонятно придем ли мы вообще туда

ответить

▲ 2 ▼ evasa1nt 01-03-2024

И да и нет. Конкуренция, в моём представлении, действует против интересов акционеров, и с ней работают в терминах "удержать долю / вырастить долю". Принимать решения в интересах пользователей это не обязывает, хотя и не исключает - но также можно вкладываться в рекламу, демпинговать, очернять конкурентов, понемногу ухудшать качество для снижения затрат, и так далее.

ответить

▲ 1 ▼ anonymous 01-03-2024

Алиса, Салют, Сири, Гугловый ассистент примерно одинаково неплохи, так что можно сказать что мы уже в этой ситуации

ответить

▲ 2 ▼ lepeace 28-02-2024

Мне не видится тут проблемы (для меня)

Мой сценарий покупок: я ищу на Маркете, иногда потом ищу или проверяю на Озоне, иногда потом иду ещё дальше

Алиса, посмотри купи плиз кетчуп и бумажные салфетки на маркете
Положила в корзину такой-то кетчуп за ч рублей и такие-то салфетки за н рублей, оформляю?
А можешь предложить какой-нибудь другой вариант кетчупа?
Да, ...
Что-то мне не нравится, а на озоне если посмотреть?
Без проблем, ...
Что за ерунда, а вообще по рынку это нормальная цена сейчас на кетчуп?
Ну и т.д.

ответить

▲ 1 ▼ --- 28-02-2024

Ну да, это как раз вот сценарий «покажи мне авиарейсы на такое-то число в Питер с 10 до 12 утра… а вот этот сколько стоит?… а вечером дешевле?.. а поезд почём?..» Вы не делегируете помощнику принятие решения, только используете его для сбора информации, а решение принимаете самостоятельно. У Вас это не помощник, а просто голосовой интерфейс, фактически.

ответить

▲ 2 ▼ lepeace 28-02-2024

это не помощник, а просто голосовой интерфейс, фактически.

Ну, я бы не сказал.
Голосовой интерфейс это было бы так
- Покажи кетчупы, отсортируй так-то
- Добавь в корзину такой-то

А тут:

Я прошу выбрать
Он говорит - я выбрал и положил в корзину
Я могу сказать Ок и обычно так и буду говорить.
А могу переспросить.

В случае выбора между разными платформами можно кстати писать логи выбора, типа "я посмотрел в озоне и на маркете, на маркете на 1 процент дороже, у вас установлено. что если на маркете не дороже чем на 2 процента, покупать там, я купил"

И потом эти логи можно в теории перечитывать выборочно, как я сейчас могу перечитывать "логи" благотворительных фондов, которым я доначу.

ответить

▲ 1 ▼ wd28 28-02-2024

Алиса, купи, пожалуйста, кетчуп и бумажные салфетки.
Положила в корзину кетчуп "Лавка" шашлычный и бумажные салфетки "Лавка" 10 шт, 85 рублей вместе с доставкой. Оформляем?
А можешь предложить какой-нибудь другой вариант кетчупа?
Конечно. Ещё есть кетчуп "Лавка" универсальный, кетчуп "Рога-и-Копыта", кетчуп "Heinz" с кинзой, укропом и арахисом.
А в Самокате можешь посмотреть?

Дальше мне лень придумывать диалог, но основная идея в том, что он может длиться довольно долго, а в приложении ты можешь сразу увидеть много вариантов, и из них уже нормально выбрать, гораздо быстрее, чем тебе их ассистент будет зачитывать.

Тут можно сказать, что если ассистент будет гиперперсонализован, и сразу будет знать, что, например, ты не ешь СТМ, кинзу и копыта, то в 99% он будет сразу выбирать нормальный вариант. Но это получаются какие-то космические корабли, которые уже на горизонте (воображаемой линии, которая отдаляется по мере того, как ты к ней приближаешься). Вангую, что исключительно голосовой ассистент ещё долго не полетит.

ответить

▲ 2 ▼ anonymous 28-02-2024

Алиса, покажи мне видео распутных дам
Каких желаете?
А можно всех посмотреть?

Как мы помним, internet is for porn

ответить

▲ 1 ▼ lepeace 28-02-2024

ещё долго не полетит

Мне тоже так кажется
Вот хочу купить себе ЯндексТВПро и попробовать лавку позаказывать там.

ответить