Адрес для входа в РФ: exler.wiki
Фейсбук слушает наши разговоры, чтобы подбирать рекламу?
В Facebook периодически появляются посты из серии "Мы сегодня с друганом обсуждали виски "Манки шоудер", потом я прихожу домой, открываю Facebook - а он мне рекламу этого виски показывает. Совпадение? Не думаю!" и так далее.
Николай Давыдов в Facebook сделал большой пост на эту тему, чтобы пояснить - слушает все-таки или нет. Ну и там вообще интересно о рекламных технологиях как таковых. Цитирую часть поста.
Опять кто-то написал, что Фейсбук слушает их разговоры, чтобы рекламу подбирать. Я сначала очень много времени занимался рекламными технологиями, потом машин лернингом, да и фейсбук я знаю не понаслышке. Поэтому, давайте по порядку (в конце будет анекдот!).
Технологии: нормально выцеплять с телефона, в кармане штанов, в оффлайне, ключевые слова - практически невозможно. Те кто верят, что Фейсбук такую "слушалку" запилил, явно не пытались договориться с Siri, Алексой или Алисой. Кстати и они работают только в онлайне. Если "слушать" вас в реалтайме и обрабатывать вашу речь в облаке, Фейсбук разориться как минимум на траффике, я уж не говорю про все железо, которое нужно, чтобы это процессить, и электричество, на которое в прошлом году выгоднее было эфир майнить.
Экономика: рекламные технологии по низкочастотным запросам работают, только если они предельно дешевые. Рекламодатель не будет платить больше условных 5-10 баксов за тысячу показов рекламы. Фейсбук со всей своей эффективностью, скорее всего, держит стоимость показа на уровне не выше двух-двух с половиной центов, предельно оптимизируя, и продавая эту рекламу с оплатой "за действие". "Прослушивание" вашей жизни будет стоить явно дороже тех 10 центов в день, которые вы максимально сможете сгенерить для фейсбука, листая ленту. И то, 10 центов, это если вы входите в аудиторию жителей США с высоким уровнем дохода.
Ограничения: Давайте визуализируем. Корпорация Facebook, в которой работает более 30,000 человек (это полностью забитый Олимпийский), используя телефоны Apple (130,000 сотрудников) и Google (85,000 сотрудников), которые вообще делают еще 150 разных корпораций, секретно слушает разговоры Васи и Маши в баре на патриарших. Дополним визуализацию, действие происходит в Кремниевой Долине, штат Калифорния, где ежедневно всплывают любые вещи, которые кто-то где-то пытался умолчать. И никто, никто не шепнул это журналюгам WSJ, которые ночами не спят, ищут как еще бы прищемить нос Цукербергу.
Целесообразность: ваш цифровой след и без "прослушки" феноменален. Вы листаете ленты фейсбука и инстаграма, лайкаете, шарите, пересылаете сообщения, на каких-то постах задерживаетесь дольше, в какие-то уведомления кликаете сразу. Вы гуглите информацию, вы читаете новости и пишете имейлы, вы ходите на сайты, вы совершаете покупки в онлайне и оффлайне (да, виза и мастеркард тоже от всей души торгуют вашими данными, вместе с владельцами программ карт-лояльности).
Дальше несколько умных датасатанистов сели, и налепили предикторов, которые понимают, когда кому какую рекламу стоит показать, чтобы максимизировать шанс продажи этого товара. Вот вам пример: Петя, высокооплачиваемый менеджер, покупал машину три с половиной года назад. Недавно, Петя оплатил несколько счетов в автосервисе, но не продлил страховку. Два Петиных друга, находившихся с ним в одной геолокации, в этот момент загуглили "BMW X5" и "Audi Q7". Петя приходит домой и видит рекламу "Mercedes GLS", о котором он говорил с друзьями в баре. ОБОЖЕМОЙ Фейсбук его подслушивал!
Делают они так или нет хз но тот же гугл все время слушает микрофон и частенько к месту и не очень вылезает со своим ассистентом.
Недавно ради эксперимента (написалось "экслеримента!") попытался анонимно зарегистрировать аккаунт в Твиттере через Тор, через гмейл емайл, которому было 1 минут отроду. Это заняло -- не шучу -- около часа. Я не сдавался, интересно даже стало. Короче: Гугл требовал "настоящий" емайл, либо телефон для СМС. Нашел сервис, где дают телефоны для таких СМСок. Нехер, Гугл на него не стал посылать СМСку, сказал, "слишком много уже таких, как ты" Ну ОК, дал телефон гуглу хер бы с ним, получил код, получил гмейл. Твиттер заставил разгдать штук 40 заковыристых кепчей, прежде чем создал злоебучий аккаунт (xерня, когда надо клинуть по картинке, на которой хер знает что, и картинки вылезают и вылезают, не переставая). После создания, аддз соотвествовали последнему узлу Торра и менялись в зависимости от узла (нидерланды, америка и т д).
Вопрос: Если кто-то стартовал/раскручивал бизнесс, расскажите: неужели самых работающий способ теперь разрекламировать -- через адз фейсбука, гугла и пр? Какой еще способ рекламы, чтобы не требовал слежения за кликами? Eсли ФБ и Гугл рулят всем во всем, при этом ничего не производя, кроме характеристик на людей, то, спросом их услуги пользуются.
Скажем, интересен был бы опыт: "на сайте был один посетитель в день, потом купил ключевое слово (или как там это называется) за $ХХХ, и на следующий день тысяча в день, вау!"
Hа баннер не кликал ни разу в жизни за последние 10 лет. Ну ок, пару раз у Экслера.
www.google.com
Facebook, Inc.
9 April 2012
А рекламы в газетах, журналах? Только старперы рекламируют/читают?
Все смартфоны/планшеты/ноутубки/компы -- объединены в сеть и представляют собой по сути гигантский суперкомпъютер. Точнее несколько -- от Гугля, Эппла и Майкрософт. И ничто не мешает этим господам торговать вычислительными мощностями направо и налево.
А то и совсем тупо без всяких теорий заговоров -- если мобильный фейсбук способен не только радовать юзера ржачными картинками, но и принимать задачи к вычислению и выдавать куда надо результаты.
И когда эксперт Николай мирно храпит в подушку -- он даже не подозревает чем занимается его любимый смартфон тихо греясь на зарядке. Не исключено что как раз распознают Васины с Петей голоса. И самое смешное -- именно за деньги эксперта Николая.
И с инженерной точки зрения схема проста как мычание -- на вход такому боту подается порция записанных разговоров, на выходе -- массив интересных ключевых слов.
Это обертка над браузерной версией фб, где права доступа как у обычного браузера, мессенджер в том же окне и есть принудительная сортировка постов по времени.
Аргументы не меняются:
1. - Я говорил-говорил и мне ничего не показало. Значит этого нет.
Это ложное утверждение. Таргетирование рекламы, слова-маркеры и время работы (если прослушивание есть) - закрытые алгоритмы. На основании чего она должна сработать - знает только тот, кто её настраивает. Как и любая реклама. Вы можете получить разную рекламу в поисковиках при одном и том же запросе, а можете и не получить вообще. Значит ли это, что контекстной рекламы не существует?
2. Не хватит никаких ресурсов.
Это ложное утверждение. Если допустить, что это есть, то для того, чтобы захват сработал, можно обрабатывать голос по разным алгоритмам и далеко не всегда это нужно делать в реальном времени. Гугл и Эппл смеются в лицо таким аргументам.
Сколько нужно свободного места? Не беспокойтесь, у таких гигантов для речи места хватит.
Гугл раскидывается гигабайтами для пользователей.
Социальная сеть Facebook на 225 страницах раскрыла перечень данных и способы, с помощью которых собирает информацию о пользователях.
Официальный документ о сборе данных
В список отслеживаемых Facebook данных входят контакты, история СМС-сообщений, журнал звонков (у Android), использование камеры, имена и типы файлов на диске, плагины в браузере, установленные приложения, покупки на сайтах, движение мыши, уровень заряда батареи, свободное место на диске.
время, частоту и длительность действий в окне с вкладкой соцсети (в том числе, открыто ли оно или находится в фоновом режиме);
покупки на сторонних сайтах;
установленные в браузере пользователя плагины;
движения мыши на устройстве пользователя;
использование камеры, встроенной в приложение Facebook;
метаданные фотографий (в том числе, время и место съёмки);
установленные на устройстве пользователя приложения;
имена и типы файлов на устройстве пользователя;
идентификаторы из игр, приложений и других учетных записей;
доступное место на диске устройства пользователя;
контакты из адресной книги пользователя;
в случае с Android-устройствами — журнал звонков и историю SMS;
ближайшие к пользователю точки доступа Wi-Fi и сотовой связи;
информацию мобильных и стационарных провайдерах через компьютеры, телефоны, сопряжённые телевизоры и другие устройства в сети;
об уровне заряда устройства пользователя;
о настройках и разрешениях на устройстве пользователя;
информацию и фотографии других пользователей, а также частоту взаимодействия и общения с ними.
Никогда такого не было, чтобы ФБ шпионил, как мы можем ему не доверять.
И тут же заодно подменяете понятия. Ибо никто не писал, что фейсбук или гугл не собирают информацию вообще.
Приехал на выходные в загородний дом родителей, сломал бензопилу отца, звонишь товарищу который недавно выбирал и покупал чтобы посоветоваться. А вечером в городефейсбук рекламирует тебе макиту. Это реальный случай моего коллеги по работе.
А мне в друзья фейсбук предлагал человека, с которым я общался только по телефона в рабочее время. И общих друзей у нас нет.
Это ложное утверждение.
"нормально выцеплять с телефона, в кармане штанов, в оффлайне, ключевые слова - практически невозможно"
Не надо выцеплять ключевые слова - можно писать абсолютно все, что похоже на связную речь. Необязательно даже быть все время онлайн - можно складировать то что записано и высылать на сервер, когда для этого есть подходящие условия. Единственный разумный довод здесь - это то, что невозможно слушать всегда в силу того, что телефон может находится в сумке/кармане/пальто etc.
"Фейсбук разорится как минимум на траффике, я уж не говорю про все железо, которое нужно, чтобы это процессить, и электричество, на которое в прошлом году выгоднее было эфир майнить."
Это немного дилетантские рассуждения. Во-первых трафик гораздо меньше чем кажется - пережатая до необходимого для распознавания качества речь весит очень немного. Ну а пассаж про электричество и железо применимо к компании у которой N своих датацентров (плюс арендуемые)...
"рекламные технологии по низкочастотным запросам работают, только если они предельно дешевые. Рекламодатель не будет платить больше условных 5-10 баксов за тысячу показов рекламы"
Я не очень в курсе рекламной модели фейсбука, но вообще сейчас обычно плятят за клики. И насколько я помню, фейсбук умеет таргетировать рекламу - то есть там все немного сложнее чем "низкочастотные запросы".
"Прослушивание" вашей жизни будет стоить явно дороже тех 10 центов в день, которые вы максимально сможете сгенерить для фейсбука, листая ленту."
Странно, что автор думает, что прослушивание может быть организовано только с целью продажи рекламы. Если уйти от теории заговоров "Все все сливают в АНБ", ФБ может (и скорее все использует) эти данные для обучения нейросети по распознаванию голоса. По этой же причине, например, гугл сделал хранилище Google Photos бесплатным и неограниченым.
"Ограничения: Давайте визуализируем."
Как уже правильно отметили в комментах - это не первый и не последний раз, когда крупные компании собирали данные, которые собирать были не должны. То что до сих пор это не просочилось не означает, что этого не происходит. Я уже не говорю о всевозможных NDA. Но ok - это второй разумный довод за всю статью
"Целесообразность: ваш цифровой след и без "прослушки" феноменален"
Это слабый довод. Если можно собрать больше - почему бы и не собрать 😄 Фейсбук например собирает данные со страниц которые вы посещали (и не только сам факт что вы их посещали) просто если на этой странице если фейсбуковская кнопка "лайк". Просто потому что они это могут. Если они технически могут собирать вашу речь - почему бы этого не делать.
"Да, виза и мастеркард тоже от всей души торгуют вашими данными, вместе с владельцами программ карт-лояльности"
Я думаю автор не очень понимает что такое "торгуют вашими данными". Да, почти все компании собирающие данные их продают. Но не так как мы думаем - они продают их обезличенно (во всяком случае официально). То есть вы можете купить у визы и мастеркарда данные, например, о том, сколько трятят на косметику женщины в возрасте от 30 до 35 лет (с разбивкой по дням, месяцам и т.д.). Но там не будут фигурировать имена или любые PII данные клиентов. Сопоставить эти данные с вашим фейсбук аккаунтом можно, но только с определенной долей вероятности.
Вообщем, я не знаю автора, но мне кажется он немного далек от темы, на которую пытается порассуждать.
"трафик гораздо меньше чем кажется", "речь весит очень немного" - немного это сколько?
Допустим, прослушка есть. Сколько клиентов нам надо охватить (чтобы был хоть какой-то прок), сколько будет весить трафик и какая от этого будет выгода? Скажите мне какую-нибудь цифру, и я признаю что вы в теме.
Час разговора в достаточном для распознавания качестве будет весить не более 50Mb. И это в mp3. Есть специализированные speech codecs (с ними работают например операторы IP телефонии) с более качественным сжатием речи, но я с ними никогда не работал. Но даже 50Mb за час - это немного. Я например так много за день не говорю.
Опять же - необязательно записывать и хранить/передавать абсолютно все, что вы говорите. Это можно делать в зависимости от ваших паттернов использования телефона (как много свободного места у вас обычно в телефоне, как часто вы находитесь в зоне высокоскоростного вайфая и т.д.)
Вы пытаетесь посчитать выгоду в деньгах здесь и сейчас - но это не совсем корректно. Фейсбук (как и гугл, как и эппл) неплохо зарабатывают и могут себе позволить работать на перспективу. Я уже написал выше, что записи голоса можно использовать для обучения нейросетей по распознаванию речи. И если фотки (которым обучают нейросети по разпознаванию образов) люди очень активно заливаютсами, то вот голосовые записи не так охотно. А сейчас идет активная гонка всевозможных голосовых помощников (которые из телефонов перемещаются в умные колонки), поэтому качество распознования речи очень важно.
"Странный аргумент. Официально и гугл с фб ничего не прослушивают.".
Да, все это лишь вопрос рисков. Если виза/мастеркард посчитают риски от продажи необезличенных данных приемлимыми - они их продадут. Но, все же, они ближе к банковским структурам (чем тот же гугл или фейсбук) где обязательства по сохранности персональных данных регулируются другими стандартами и законами.
Для ясности, своим "опусом" я не пытаюсь убедить, что прослушка есть. Я этого не знаю. Я лишь пытался показать, что аргументы автора поста слабоваты и не стоит им слепо доверять.
В 2002 году у меня был эрикссон т68, он позволял делать часовую диктофонную запись в свои 1.5 мегабайта памяти.
А сейчас думаю и более эффективные кодеки есть.
ЗЫ - можно что-то одинаково редкое, только заранее напишите что чтобы читерства не было
Года 2 назад я читал статью, как одна молодая пара в разговорах специально стала употреблять сочетание "корм для хомячков" (не уверен что прямо именно это сочетание - но суть в том, что это были слова не имеющие отношение к их жизни и которые они раньше никогда не употребляли). Примерно через неделю им начали показывать рекламу с кормом для хомячков. И именно на таких случаях строятся все подозрения о прослушивании.
Ничего не помогло.
Опять же "если у вас диагносцировали параноидальную шизофрению, то это не значит, что за вами не следят на самом деле"...
Кошачью же еду покупал и покупаю только в магазине - рекламы не было и нет. Жрут они много, поэтому тема покупки еды постоянно всплывает в телефонных разговорах.
"выцеплять с телефона, в кармане штанов, в оффлайне, ключевые слова - практически невозможно" Эээ. Сейчас телефоны такие, что в кармане штанов плохо помещаются. Садясь на стул, мы тут же достаем телефон и кладем перед собой. И вот тут он уже прекрасно все слышит.
"Если "слушать" вас в реалтайме и обрабатывать вашу речь в облаке" Да вроде ничего не мешать распознавать речь на клиенте, благо этот клиент может быть почти любого размера, а сколько там телефон за день успевает разрядить заряда батареи, никто особо не считает. Так что вся эта телега про процессоры и эфир к лешему идет. По сути, пересылать достаточно выцепленные ключевые слова в форме текста, объем данным копеечный даже в масштабах миллиарда человек. Например, произнесенные в одной фразе с другими словами маяками типа "надо новый" или "куплю".
"Целесообразность: ваш цифровой след и без "прослушки" феноменален" Ну про гениальность этой логики тут уже выше написали.
Берите, используйте, можно не благодарить.
Будет ли работать, когда телефон в штанах? Не могу сказать. Я себе такой задачи не ставил.
Я уже не говорю, про то, что вместо куплю может быть всякая экзотика вроде - урвать, хапнуть, затарить и т.д. Фильтровать все это пытаясь угадать пожелания кого-то, при наличие более точных и эффективных способов? Но зачем? 😄
from androidhelper import Android
droid = Android()
perem = droid.recognizeSpeech().result
print (perem)
Работает при отключенном и wi-fi и мобильном инете. При долгом разговоре без пауз (больше минуты-двух) чаще говорит, что не может распознать и предлагает подключиться к сети и повторить. При меньших сроках болтовни между паузами для телефона просто лежащего рядом на столе либо распознаёт с довольно хорошим процентом качества, либо даёт ошибку.
Можем вместе нафантазировать возможное коммерческое использование этого с минимальным и даже нулевым трафиком в продаже рекламы:
1. К рабочим файлам распространяемого нами совместно приложения каких-нибудь домашних финансов добавляется какая-нибудь sqlitе-база интересных для наших рекламщиков ключевых фраз, дополняемая при очередном обновлении. Безостановочный трёп прерывается таймером на куски по 20-30 секунд и распознаётся. Если результат распознавания положительный и есть совпадения с записью в нашей базе - добавляем ID этих записей к будущей отправке. Когда же клиент поключится к сети - зашифруем и передадим набор найденных ID наших рекламных записей + данные об устройстве или же куки нужного нам рекламного сервиса. Соответственно будет отсеяно всё неинтересное для рекламщиков, типа "реверберирующих осцилляторов" и минимизирован трафик.
2. Можно даже и не передавать ничего, а писать найденные словосочетания куда-нибудь в архив запросов браузера, для запуска стандартного механизма рекламы.
Понятно, что это просто набросок навскидку. Если задаться целью встроить этот механизм в свой бизнес на рекламе, и поразбираться - наверняка можно сделать красиво и не затратно по ресурсам. Библиотека эта развивается уже более десяти лет и допускаю, что кто-то уже всё это придумал до нас.
The implementation of this API is likely to stream audio to remote servers to perform speech recognition. As such this API is not intended to be used for continuous recognition, which would consume a significant amount of battery and bandwidth.
Кстати, ваш пример пишут, что не работает в эмуляторе. Понятно почему.
Мне как раз непонятно, почему в эмуляторе пример не заработал.
Я пока учусь, в основном в метро по дороге, так что qpython3 у меня стоит непосредственно на простеньком xiaomi, чтобы набивать то, что прочту в самоучителе. Но вчера я как раз развлекал вечером коллег в подвале, куда не добивает телефонная связь и нет wifi, добавив в пример ещё строчку
droid.ttsSpeak(perem)
чтобы то, что распозналось, ещё и произносилось тут же женским голосом. При этом мало того, что отключил wifi и мобильный инет, так периодически ещё включал режим полёта, чтоб добавить уверенности в том, что библиотека не пытается сама подключаться к серверам google. Понятно, что многоэтажные и закрученные матерные выражения она распознаёт совершенно не так, как было сказано, но распространённые марки автомобилей чаще всего повторяет правильно и в сортах пива разбирается возможно даже лучше меня. И многие сугубо русские междометия при этом вполне распознаются.
Например : The speech input will be streamed to a remote server, which converts speech to text and result will be sent back to requested app.
"Технологии: нормально выцеплять с телефона, в кармане штанов, в оффлайне, ключевые слова - практически невозможно."
Почему именно в оффлайне ? У Николая экранированый спецкарман и в нем телефон уходит в оффлайн ? А если не в кармане а на столе ?
"Те кто верят, что Фейсбук такую "слушалку" запилил"
Вопросами веры занимается Церковь, а тут речь о технических возможностях (новые ядра, гигабайты и мегагерцы нужно исключительно злых птичек по экрану гонять -- у нас никаких сомнений) и экономическом интересе (о да!).
"явно не пытались договориться с Siri, Алексой или Алисой"
С авторами подобных систем невозможно договориться о примитивных вещах и десятилетиями не исправляемых багах, но аргумент железный, да!
"Если "слушать" вас в реалтайме и обрабатывать вашу речь в облаке, Фейсбук разориться"
Походу Николай эксперт не только в вопросах прослушки, но и в аудите фейсбучной бухгалтерии.
"как минимум на траффике, я уж не говорю про все железо, которое нужно, чтобы это процессить, и электричество, на которое в прошлом году выгоднее было эфир майнить"
Не так давно эксперты с такой-же убежденностью доказывали смехотворность идеи полета аппаратов тяжелее воздуха.
С авторами подобных систем невозможно договориться о примитивных вещах и десятилетиями не исправляемых багах, но аргумент железный
Но теории заговора так заманчивы, да.
Какой смысл обсуждать эксперимент? Ну да, гугл легко может взять 10 тыр человек и незаметно пытаться включить голосовой сервис. Пусть даже релевантность этого эксперимента очень низка. Только зачем? Эти 10 тыс и час допустим, времени прослушки не масштабируются на 10 млн и 8 часов ежедневно. А без этого вся затея теряет смысл.
Разве чтобы вас удивить.
aws.amazon.com
Ваше сравнение ровно из той-же оперы. Сири с Алексой -- ни разу не аналоги системе у которой задача -- выцепить слово и контеста и связать с рекламируемыми товарами.
Умножаем допустим, на 4 часов в день, = 5,76.
Умножаем на количество клиентов, которых собираемся обрабатывать. Ну, допустим 100 тыс., =576 тыс USD. Поскольку у гугла предполагается все свое, урежем до полумиллиона. Но нам еще же надо аудиопоток доставлять, это тоже деньги.
То есть за один день (!) для 100 тыс клиентов нам надо потратить почти 500-600 тыс долларов. Это дешево?
И заниматься всей этой фигней ради 10 тыс человек не имеет смысла - ну будете вы их слушать месяц, и усердно подсовывать нужную рекламу. И в конце получите полтора клика. С заходов в браузере можно в десять раз больше полезного вытащить.
Значит, бесплатно и без ограничений распознавать голос миллиарда людей по желанию людей - это нормально, а когда то же самое, но по желанию Гугла или Фейсбука - то внезапно стало не хватать мощностей?
Траффик -- никто не считает.
Которые (внезапно) -- системе отлично известны.
Поясню еще раз на другом примере. Есть Сири которая должна быть способна в реальном времени распознать вопрос и суметь найти ответ. И есть распознаватель которому нужно выудить из разговора интересующие систему ключевые слова.
Это как задачи построить потребительский автомобиль с ресурсом проехать без поломок минимум гарантийный срок в 100 тыщ за 3 года и раллийный внедорожник с задачей проехать Париж-Дакар. У первого подвеска развалится после нескольких прыжков по барханам, у второго движок отправится на капремонт через 10 тыщ км. То что один не способен решить задачу второго -- не доказывает ничего.
4pda.ru
У меня другие факты : искал на АлиЭкспресс кроссовки, нашёл, добавил в корзину и вышел.
Через пару часов зашёл в приложение "Мои заметки", и вижу там рекламу АлиЭкспресс с этими же кроссовками ! И это не впервые раз, сегодня показывает рекламу китайской электронной книги, которую я вчера рассматривал ))
две неприятные вещи: а) «Фейсбук» собирает тонну личных данных, б) продаёт их сторонним компаниям.
Упс, слова "слушает" там нет.
А то, что крупнейшие сети обмениваются между собой информацией для рекламы давно не новость.
Вот думайте, что хотите, но они может быть и не слушают наши разговоры, но мысли читают 😄
И я не шучу - ну просто таких совпадений быть не может.
И о каких объемах в гигабайтах может идти речь при таком уровне распознавания голоса? Да за весь день объем будет измеряться десятками килобайт, не больше.
Это я не к тому, что нас всегда слушают - тут сказать ничего не могу, не обладаю достаточными данными. А к тому, что аргумент 'это же объемы!' не может быть использован для защиты точки зрения 'нас не слушают'.
При этом я "верю" в совпадения (как некоторые люди не хотят в них верить). Точнее, я постоянно их замечаю. Когда читаешь газету или разговариваешь и тут же это же слово/похожая фраза звучит в телевизоре у мамы, например. Вот только позавчера читал комменты к посту про языки тут и как-то мне было неспокойно. И думаю во время чтения "читать дальше или посмотреть сериал?". И как только заканчивается мысль, глаза читают слово "spellbinding". А я как раз сейчас пересматриваю австралийский "Spellbinder", который смотрел еще в детстве на русском по телеку и потом слил на английском и пересматривал много раз. Хоть поржал, настроение слегка улучшилось.
Чем человек параноидальнее, тем внимательнее он к совпадениям и они начинают вызывать ужас. Это не значит, что нас таки не слушают (доказательств конкретных случаев было достаточно), но в данном случае мне ближе более простые объяснения, коих тут было много. После Сноудена и некоторых явно "не-совпадений" замеченных самолично ранее очень долго параноил, пока не понял - да кому я нах нужен? Я обычный "продукт", нет, есть, конечно, за мной "грешки", но они есть у любого человека, так что лучше просто думать, что/как пишешь публично и спать спокойнее. Перестал особо заморачиваться. Я не Осама и не Эскобар, все-таки. Психическое здоровье надо беречь.
Однако возникают вопросы -
1) ни у визы, ни у МС нет информации о совершенных покупках. Максимум - торговая точка, примерный адрес (к примеру MOSCOW), код мерчендайзера и сумма чека. Для таргетированной рекламы... наверно, можно почерпнуть и из этого что-то, но только если связать с другой инфой.
2) "Два Петиных друга в одной геолокации" - для этого фейсбуку надо сначала выбрать какой-то релевантный набор друзей. Либо шерстить интересы и покупки каждого из сотен-тысяч (в среднем), связанных в фейсбучеке. В общем, это по-любому гигантский обьем данных для перелопачивания.
Только таких Петь у Фейсбука - миллионы. Эти миллионы порождают десятки-сотни миллионов связей, и по каждому нужно вести эти самые рекламные счетчики, причем в каком-то разрезе интересов (у Пети в друзьях может быть 67-летняя Сюзен из Австралии, но вряд ли Пете интересна новая поилка кенгуру). Это мега-CRM, и обьемы там должны быть гигантские.
Предистория 1. Муж искал возможности для покупки недвижимости в районе Измира. Нашел очень выгодный вариант, но потом оказалось, что там потенциальные проблемы с правом собственности. Могут объявиться потомки владельцев, уехавшие в Грецию в результате обмена населением столетней давности. Мне стало интересно, я почитала на втором компе про обмен населением (на русском). При этом несмотря на то, что муж активно искал недвижимость в Турции (со своего лаптопа), никая реклама на втором компе не появлялась.
Предистория 2. Зашел наш лэндлорд. Он грек-киприот из тех, кто был аналогично обменян после рзделения Кипра. Рассказывал нам, как он ездил на Север и осматривал свой дом (дом его отца, где сейчас живут турки). Сам он живет в бывшем доме турков на южной части острова. Мне снова стало интересно, я почитала на втором компе про разделение Кипра и обмен населением на (на русском).
Предистория 3. Через пару дней после этого зашла соседка, она турчанка-киприотка, с Северного Кипра. За чаем снова стала рассказывать про переворот и приход турков, мой муж перевел разговор на недвижимость и проблемы бывших собсвенников. Типа есть ли риски, если купить недвижимость, которая раньше принадлежала грекам, и как этого избежать. Обсудили. Соседка родом из Магусы..
История... после ухода соседки открываю комп, а там реклама на русском "недвижимость в Фамагусте (это греческое название Магусы)"... я ничего не искала про Магусу
Компы, кстати, оба маки и гугла там нет.
Советский союз. Мужик в командировке с друзьями сидит в гостинице. Выходит в коридор, видит горничную и просит "принесите пожалуйста через 10 минут 3 чашки кофе". Заходит обратно, друзья травят политические анекдоты. Он им - "товарищи, вы бы лучше не шутили на эти темы, мало ли нас слушает". Друзья, конечно, над ним смеются, он встает, подходит к розетке, выдергивает из нее телевизор, наклоняется к ней и говорит "товарищ майор, раз уж все равно с утра на лубянку, можно хотя бы нам три чашечки кофе сейчас". Все ржут. Тут открывается дверь, горничная вносит три чашки кофе. Друзья в шоке, молча ложаться спать. С утра мужик просыпается в номере от шума, встает и видит как чекисты выводят его друзей. К нему подходит лейтенант и говорит "Спасибо за бдительность, товарищ Петров, товарищ майор просил передать, что ему очень ваша шутка про кофе понравилась".
Из реального - "OK Googe, текущие цены на автомобиль ауди"
Через 15 минут звонок - "Это автосалон ауди, когда вам удобно подъехать?"
На следующий день без всякого спроса Фейсбук начал выдавать мне его персональную страничку в качестве рекламы.
Запросов никаких не делал.
Тут даже простого таргетинга достаточно. Что раввин в настоящее время читает лекции в вашем городе, мы уже знаем. Почему бы ему не дать рекламу?
А может вы с женщиной одной возрастной категории? А может друзья в соцсетях? А может к одному вайфаю в ресторане приконнектились?
А может вам эту рекламу уже полгода крутят, но обратили внимание только теперь? Баадера-Майнхоф никто не отменял.
Зашел в большой гипермаркет, погулял по нему с полчаса. За всё время пребывания в нем телефон из сумки даже не доставал. GPS постоянно включенным не держу.
В охотничье-рыболовном отделе внимательно прошелся вдоль витрин с пневматическими пистолетами, поразглядывал. Среди них кстати было больше всего моделей макарова. Подумал не распросить ли продавца о современных правилах их транспортировки в кармане или машине (но не распросил). И вот приехав уже на работу еще через полчаса, открываю в телефоне браузер и на первой же странице реклама - фотка макарова и подпись что-то типа "пневматика легально". Вот как это понять? Прежде уже 100 лет на эту тему не думал и ни с кем не говорил.
Я прошу отметить, что я НЕ искал в интернетах рыбу, НЕ писал жене в вацап - просто перекинулись парой фраз на кухне. Товарищ может и верно все объяснил про бессмысленность, но практически работает вот так.
Вот если бы сказали: "а не купить ли мне пневматический отбойный молоток" и вам бы рекламу погнало, тогда было бы удивительно.
А делать реакцию на каждое слово - наверное неправильно.
Но камеру на ноуте на всякий случай заклеил.
...
Целесообразность: ваш цифровой след и без "прослушки" феноменален. Вы листаете ленты фейсбука и инстаграма, лайкаете, шарите, пересылаете сообщения, на каких-то постах задерживаетесь дольше, в какие-то уведомления кликаете сразу. Вы гуглите информацию, вы читаете новости и пишете имейлы, вы ходите на сайты, вы совершаете покупки в онлайне и оффлайне (да, виза и мастеркард тоже от всей души торгуют вашими данными, вместе с владельцами программ карт-лояльности).
Дальше несколько умных датасатанистов сели, и налепили предикторов, которые понимают, когда кому какую рекламу стоит показать, чтобы максимизировать шанс продажи этого товара
......
1. Зачем каждый раз нужно было увеличивать количество способов отслеживания? Ведь есть же железный аргумент "Вы уже оставили уникальный след, который отследить [х-1] способов.
2. Эти все средства отслеживания появились не единоразово.
И каждый раз, когда они обновлялись, был повод назвать человека параноиком.
"Ха-ха, ты серьезно веришь, что гугл следит за тобой?"
Он исходит из того, что все смартфоны всегда должны слушать каждое слово каждого пользователя, и онлайн и офлайн.
Это уже ложное допущение, особенно для нового сервиса.
Можно тестировать сильно ограничив выборку.
Надо определиться с 3 пунктами.
1. Есть ли техническая возможность это сделать.
2. Есть ли экономический мотив это сделать.
3. Были ли случаи, когда крупные сервисы попадались за сбором информации, которую не должны были собирать.
Если на три пункта ответ "да", то есть вероятность, что это реализовано.
А ответ "да".
Это не обязательно работает постоянно, алгоритмы сейчас настраиваются очень хорошо.
Не на все маркеры могут быть рекламодатели.
Возможно, сервис пока тестируется.
Есть ли мотивы , почему это не стали бы делать? Чтобы был аргумент прям железный?
Как и слежка, которую легко отозвать паранойей - в какой торговый центр вы ходили, какое заведение посещали, на какие номера звонили. Все это уже легко и доступно для нацеливания рекламы.
P.S. Окей гугл - как пример реакции на ключевое слово. Смартфон же не всегда слушает, да? 😄
И ответ на все три ваши вопроса - "нет". Нет технической возможности анализировать столько звука (ни локально ни удалённо), нет экономического мотива (и так дофига информации собирается гораздо более простыми и дешёвыми способами), нет примеров, чтобы подобное дерьмо довольно быстро не всплывало бы наружу (это вам не секрет кока-колы, который знают три человека в мире).
1. Слушать сутками напролет фразу "ОК, гугл" есть а слово "мерседес" - уже нет
2. Никто и не требует идеального качества.
3. Место для хранения нескольких гигабайт информации у Фейсбука есть, а нескольких слов - уже нет.
4. Выборочный анализ слов - тоже крайне прост. После ОК гугл обычно говорят поисковый запрос. И о чудо - по нему ищут информацию.
Не должна.
Это очередная глупость.
Она может ошибаться и по геолокации и даже по запросу в поисковике.
В одном из интервью он как раз говорил о ПАРАНОЙЕ О ПРОСЛУШИВАНИИ МИКРОФОНА (где-то с 1:45, таймкод криво вставляется):
Что Гугл вас слушает, хоть согласны?
А если он это делает, почему Фейсбуке не может?
Дискуссия не будет иметь смысла ибо обоснованной информации в интернете и тематических форумах достаточно, но вы гнёте свою линию.
Хорошего вам дня!
Сидим в саду, о чем-то треплемся, в руках у собеседника смарт. Я произношу какую-то фразу, не помню какую, но слов "ок гугл" там точно не было и мужик вдруг показывает мне смарт со словами "а это еще что за хрень?". В строке поиска слово в слово моя последняя фраза.
Сидели метрах в двух друг от друга, на улице, wifi там у меня очень неуверенный, хотя время от времени пробивается. Говорил я, правда, громко, тому товарищу очень хорошо за семьдесят и он, мягко говоря, глуховат, а фонового шума - разве что шелест листьев, особого ветра не было.
Вот и думайте, слушают вас, или нет. Я-то это видел вживую.
PS: Голосовые сервисы я ему, конечно, отключил тут же, не сходя с места, но хрен его знает, насколько честно они отключаются. Впрочем, последнее уже и в самом деле паранойя.
2. Да о каком качестве речь, когда он "окей, гугл"-то точно распознать не может ? Он не "мерседес" услышит, а "макароны".
3. Хранить-то информацию фейсбуку несложно, сложно её туда с устройств передать. Трафик - он, сцуко, платный, батарейка тоже по 4G не заряжается, а наоборот.
Отслеживать 10 слов в сутки у миллиарда людей - уже не катит?
Или только два слова "Привет Сири" и "ОК гугл" можно, а если больше - все падает и виснет?
Ну и не на все слова показывать рекламу. И смотрите ваш тенис/пенис спокойно.
Но потом наступает самое интересное, вот собрали вы информацию, дальше-то что с ней делать будете?
Поэтому я и говорю всем параноикам - пройдите хотя бы начальный ликбез, тогда ваша паранойя уйдет навсегда, уступив место полной уверенности - да, о каждом из нас собирается масса информации, да, ничего вы с этим сделать не сможете.
Ну разве что, по примеру Цукерберга, заклеить себе микрофон да видеокамеру скотчем.
Рекламодателю интересен, например, покупатель Мерседеса, который до этого не покупал машины этой марки.
М?
З.Ы. Про техническую возможность даже скучно - она есть. И гугл и аппл это демонстрируют.
Кого там ловили на отправке фото с камеры в маленьком разрешении, не напомните?
П.С. кстати лаптоп покупал с возможностью механически закрывать камеру, считаю это полезной фичей;)))
А в случае с "Ок, гугл" именно одна эта фраза распознаётся на телефоне, а всё, что человек говорит дальше - уже отправляется для распознавания по сети.
Это совсем не то же самое, что сливать звук 24/7.
Небольшой набор ключевых слов анализировать на телефонах ? Ну давайте подумаем, что из этого вышло бы. А вышло бы то, что компании поубивали бы друг друга нахрен, чтобы их слова попали в этот небольшой набор. И о том, сколько стоит туда попасть, знал бы самый последний SMM-щик.
А простые способы - к примеру, анализируя даже этот лог, машина может связать ник me45 с упоминанием Мерседеса, а по нику выйти на вашу персональную страничку, ваш фейсбук и вашу фамилию.
Ой, а вы не знаете случайно, сколько весит приложение Фэйсбука? А то у меня таки есть подозрение, что запихнуть тысячу сэмплов (а они навряд ли больше килобайта) ну вообще не составит труда.
Предположу от себя - в первую очередь потому, что проблема не в первичном сборе, а как раз в обработке, именно то о чем вы и пишите.
Заклеенная камера никак не спасет от посещений форумов, ЖЖ, фейсбучека и одноклассников, гугла и торговых площадок и прочая.
Но это скучно, конечно лучше просто верить.
И судя по всему - достаточно успешно распознается, раз она так продолжает делать.
Но ничего, мне кажется скоро появятся сомневающиеся, подождём!
Причем у нас с ним и фейсбука-то нет.
Несколько раз в год я бронирую на букинге отели. И каждый раз, когда я уже выехал и вернулся домой, букинг начинает заваливать меня предложениями жилья в этих местах.
Пример: сидим дома. На планшете девушки крутится онлайн-трансляция какого-то канала, там идёт "Лови волну". Открываю на телефоне какой-то сайт... А там бац - и реклама школы сёрфинга. При этом сёрфингом я никогда в жизни не занимался, не интересовался, и ни разу ничего о нём не гуглил. И всё потому, что оба устройства - в одной Wi-Fi сетке...