Адрес для входа в РФ: exler.world

Автоматический перевод видеороликов - вопросы

19.07.2021 11:55  18724   Комментарии (131)

Читаю новость о том, что в "Яндексе" создали "не имеющую аналогов в мире технологию автоматического перевода видеороликов".

«Яндекс» создал технологию машинного перевода видео. С ее помощью видеоролики зарубежных авторов смогут посмотреть даже те, кто не владеет иностранными языками – разработка «Яндекса» в автоматическом режиме переведет видео на русский язык и озвучит его закадровым голосом. Об этом CNews рассказали представители компании. По заявлению создателей, технология не имеет аналогов в мире.

На сегодняшний день у «Яндекса» готов прототип системы машинного перевода. Сейчас он работает только с роликами на английском языке. Разработчики утверждают, что опробовали технологию на видеозаписях на самые разные темы: изменение климата, машинное обучение, история Плутона.

Пользователям функция машинного перевода видеороликов доступна в фирменном браузере «Яндекса» для операционных систем Windows и macOS, однако лишь при просмотре ограниченного числа роликов. Специалисты компании создали на Youtube-канале "Yet another browser" подборку из 12 видео (плейлист «Перевод видео»), с помощью которых любой желающий сможет убедиться в работоспособности технологии. В ближайшее время пользователи получат возможность самостоятельно выбирать, какие именно ролики переводить, обещают в «Яндексе».

Над созданием прототипа работало несколько команд. Сейчас в нем применяются технология синтеза речи, разработки «Яндекс.переводчика» и биометрия. Последняя используется для определения пола говорящего – это, как отмечают в «Яндексе», важно и для перевода, и для синтеза речи, в частности, позволяет подобрать подходящий голос для закадровой озвучки.

Технология «Яндекса» поддерживает синхронизацию закадрового голоса с видеорядом, при необходимости корректируя темп речи виртуального переводчика и добавляя в нее паузы. Синхронизация необходима, поскольку исходные и переведенные реплики могут значительно отличаться по длительности – например, в английском языке часто используемые фразы нередко лаконичнее своих русских аналогов.

Для тех, кто внимательно следит за тем, что происходит в мире машинных переводов, все это звучит совершеннейшей фантастикой. Обычные-то текстовые переводчики пока, мягко говоря, далеки от совершенства (хотя нельзя не признать, что с каждым годом они работают все лучше и лучше - благодаря нейросетям), а уж автоматическое воспроизведение текста голосом - это все слушается очень криво.

А тут нам утверждают, что они научились не только распознавать голос в ролике, не только качественно переводить его на другой язык, но и озвучивать на другом языке? Мне в это верится с большим трудом.

Компания предлагает послушать типа как "образцы работы технологии". Сделать это можно только в Яндекс.Браузере, для чего я его поставил, в нем в Yotube открыть плейлист "Перевод видео", и там можно включить перевод.

Для тех, кому не хочется со всем этим возиться - ставить Яндекс.Браузер и так далее, - я заснял небольшой ролик о том, как это все работает.

Так вот. То, что я вижу и слышу в ролике - это даже рядом никакой не "автоматический перевод". Это перевод, явно сделанный профессиональным переводчиком и озвученный профессиональным актером (безусловно, живым человеком, это даже рядом не автоматическая озвучка, как в ридерах с такой функцией).

Ну и в чем юмор, ребята? Ну сделали вы войсовер для нескольких роликов, молодцы. Но на черта это выдавать за "автоматический перевод", когда там за версту понятно, что это никакой не автоматический перевод?

Если вы работаете над этой технологией, но пока вам нечего показать - ну так и напишите, что работаете, но показать пока нечего.

Если вы создали подобную технологию, она работает, и вы готовы ее продемонстрировать - ну так разрешите ее использовать для любых роликов, оговорив, конечно, что голос человека в ролике должен быть только один. Тогда хоть можно будет понять, что она собой представляет.

А так - вообще не пойми что. Показывать обычный войсовер в качестве "демонстрации технологии автоматического перевода" - это как-то очень и очень странно.

Комментарии 131

простите, но это не живой голос.
я много работаю над пет проектами где используется озвучка от яндекса (новости в машине мне магнитола зачитывает)
у них там 5-6 голосов и вроде 3 интонации для каждого (это про их достижения)

тут звук идет "на одной волне" без остановок на "глотнуть воздуха" - однозначно робот
23.07.21 10:42
0 1

Не могут они тупо врать, что это перевод, если это войсовер
20.07.21 01:52
0 1

Алекс, а с чего такой вывод про профессионального актёра? Ты можешь купить колонку с Алисой и поболтать с ней. Будешь удивлён.
Ну или просто с Алисой в смартфоне.
19.07.21 19:40
0 6

Вопрос вызывает только точность распознования речи.
Сам перевод и голос вполне себе обычный.
19.07.21 19:10
0 1

распознования
"распознавания"
(проверочное слово - "познать")

Да это разве актёр? Слышно же озвучку роботом.
19.07.21 18:52
0 10

Так, Яндекс прошел-таки тест Тьюринга у Алекса...
19.07.21 18:38
0 21

Какой-то странный наезд на Яндекс. Если "работа технологии впечатляет безмерно", то, может, не стоит голословно заявлять про "перевод, явно сделанный профессиональным переводчиком и озвученный профессиональным актером"?
19.07.21 17:42
2 9

Так-то нет ничего сложного в цепочке
Человек в видео как раз об этом говорит. Каждый элемент цепочки неидеален, ошибки накапливаются, на выходе получаем глухой телефон.
20.07.21 09:49
2 0

Так-то нет ничего сложного в цепочке: трансляция речи на иностранном языке в иностранный текст - давно реализовано (на смартфоне говорите "Ok, Google" и диктуйте), перевод текста на иностранном языке в текст на русском языке - есть Google-переводчик, в принципе, у Яндекса тоже есть, потом озвучивание текста на русском языке - тоже давно сделано - см. программы для слепых в Windows. Да и просто голосовой перевод речи с одного языка на другой тоже вроде уже реализован в смартфонах.
19.07.21 18:01
1 3

Ещё один робот Фёдор... и если всякие Сколково и Роскосмосы пилят гос.бюджеты и с ними всё ясно, то насчет Яндекса не совсем понятно зачем им этот позор.
19.07.21 17:42
9 3

происходит разрыв шаблона
Насчет робота Фёдора я тоже неправ?
21.07.21 04:07
0 0

speach
"speech"

Просто у некоторых, которые не понимают, что в России технологии могут быть на уровне не ниже мирового, происходит разрыв шаблона.
19.07.21 22:56
3 7

Алекс, у вас запись экрана почему-то с перекосом получилась. 😄
В Windows наверняка есть функциональность, подобная имеющейся в программе QuickTime для MacOS, позволяющая вести запись экрана с включенным микрофоном. Это выглядело бы как-то опрятнее, чем запись экрана монитора на камеру сотового телефона. Я понимаю, что вы здесь "сам себе режиссер", но ведь вас многие считают "гуру компьютерных наук", да и я в свое время учился по вашим книгам. ?
19.07.21 17:39
5 8

Да есть Win+G клавиши нажать..

Мне кажется, тут иной случай, чем у механической озвучки текста. Если есть исходник на другом языке, записанный человеком, то, как минимум, эмоциональную окраску вполне можно пытаться скопировать с его голоса. Смена темпа речи, акценты на словах, смысловые паузы и т.д. - все это переносится в текст на другом языке.
19.07.21 17:01
0 4

Без всякой связи с конкретной технологией - мои знакомые подняли стартап по транскрипции совещаний - т.е. speech-to-text. Их гениальная в простоте идея - в SLA с клиентами было указано что текст "отправляется на просмотр" редакторам и будет доступен в течение ЕМНИП двух часов. Параллельно с этим были наняты "редакторы" в Индии и завертелось.
В результате - к моменту готовности настоящей AI-модели у компании были уже пару десятков платящих клиентов и приличный набор данных...
19.07.21 16:46
0 7

А не стремно клиентам, что содержание совещаний будет гулять по рукам всяких там "редакторов" из Индии (при всем уважении к Индии в общем и редакторам в частности)?

Ну, разве может если это что-то совсем протокольное, типа: "Сидоров взял на себя и со всей ответственностью несет, Иванов болен, Петров в отпуске"

На совещаниях идеи обсуждаются, решения принимаются, глупости говорятся, в конце концов. Отважные у них клиенты.
20.07.21 03:05
0 4

Алекс, спасибо за комплимент технологии Яндекса.
Это действительно робот озвучивает.
Позволю себе процитировать комментарий от рук-ля Я.Бро с vc.ru:

Для начала хочу отметить, что мы в Яндекс.Браузере давно работаем над тем, чтобы стереть языковые барьеры для наших пользователей. К примеру, про это мы говорили в похожих выражениях весной, можно почитать в анонсе перевода картинок здесь:

Далее, что касается нашего продукта, он всё-таки сильно отличается от вашего расширения. Уже сейчас в прототипе, который был представлен вчера, мы:
1. Самостоятельно переводим с помощью Яндекс.Переводчика (на ряде языковых пар он работает лучше).
2. Автоматически распознаем пол говорящего в оригинальной аудио-дорожке и подбираем соответствующий голос. Женщин переводит женский голос, мужчин — мужской. Это называется биометрия.
3. Используем собственную озвучку. Наш алгоритм следит за темпом речи говорящего, чтобы переводчик мог делать паузы, замедлять или ускорять речь. Таким образом закадровый голос совпадает с картинкой. Русский язык длиннее английского, в среднем, на 30%, поэтому наш алгоритм умеет применять методы речевой компрессии (совсем как настоящие синхронные переводчики в ООН).

Как вы понимаете, реализация такого сложного проекта и подготовка к его анонсу занимает отнюдь не неделю. К примеру, версия браузера 21.6.0, в которой эта функция работает, выпущена 1 июля, вчера мы лишь включили её всем. А работать над этой функциональностью мы начали несколько месяцев назад.

И ведь это только начало, мы стремимся к тому, чтобы наша технология перевода заработала на абсолютно любом видео как на YouTube, так и на других видеохостингах независимо от того, есть ли там субтитры.
19.07.21 16:25
2 8

на ряде языковых пар он работает лучше
- Чем?! Чем лучше?!
- Чем армян. (с)
Женщин переводит женский голос, мужчин — мужской. Это называется биометрия.
Это называется "Радзинский удивился" если речь о РФ и "На вас подал в суд Грег Гонзалес" если о загнивающем западе. Но прикольно.

Ну перевод-то действительно машинный - там слишком много неуместных "калек". Ну или переводчик - тупой мозгожоп, отвратно владеющий русским языком.
19.07.21 16:11
0 5

Yandex'у нужно максимально поторопиться с разговорчивым искусственным интеллектом. Потому что заглянешь, бывает, в Yandex Дзен и Yandex Новости, а там какой-то естественный интеллект такую бредятину пишет, что вся надежда на AI
19.07.21 15:25
0 7

заглянешь, бывает, в Yandex Дзен
Правильный алгоритм работы AI в этом случае - х...ячить разрядом в 10 КВ всякого кто читает посты Дзен. За чтение комментов - 30 КВ
Таким образом выработается безусловный рефлекс на попытку открыть Дзен
19.07.21 15:29
1 5

Очень очень крутой робот, но у меня ухо набито и я слышу кучу нюансов, которые его выдают.
19.07.21 15:01
1 6

не имеющую аналогов в мире технологию
Технология может не иметь аналогов только по двум причинам
а) Её невозможно реализовать на данном этапе при данных ресурсах и заявления о её создании - враньё
б) Она нафиг никому не нужна и мы имеем дело с огурцом Малахова

В случае с яндексом не так легко сразу определить, какой из вариантов мы имеем в данный момент, но чаще они конечно идут по варианту а. Врут, иными словами они.
19.07.21 14:57
13 3

То есть, при отсутствии другого материала для пишущего стержня, карандаш тождественен графиту?
Если я говорю что "пишу графитом" - в данном конкретном случае да. Если "пишу карандашом" - нет.

Нашёлся какой-то другой принципиальный принцип распространения того, что мы называем "радиоволны"?
То есть, при отсутствии другого материала для пишущего стержня, карандаш тождественен графиту?

Я рад, что вам понравилась новая игрушка! Я совершенно не против, играйте и дальше.

Честно говоря, ждал, когда автор сам мне об этом расскажет.
Ну да. Спарта тырит у Афин технологию окрашивания тканей вместе с её изобретателем - всё дело в России, которая начнёт быть где-то лет через полторы тысячи.

Вы зря не остановились как планировали.

Нужно просто добавлять везде ключевое слово "Россия", и мысли Пафнутия сразу заиграют свежими красками.
Ну, так-то я догадливый. 😉
Честно говоря, ждал, когда автор сам мне об этом расскажет.
Не дождался, но результат настолько превзошел ожидания, что прямо - ух!
19.07.21 17:44
1 7

Нужно просто добавлять везде ключевое слово "Россия",

Нужно просто добавлять везде ключевое слово "Россия", и мысли Пафнутия сразу заиграют свежими красками.
19.07.21 17:13
1 11

Напомню, что радио, как пример технологии, первым упомянули именно вы.
Вы уверены что когда я употребил "скопировали и реализовали" я имел ввиду "радиоволны" как явление? 😉
И должен сообщить вам, как явному специалисту по по швейцарскому туризму: понятия радио и электромагнитные волны вовсе не тождественны.
Нашёлся какой-то другой принципиальный принцип распространения того, что мы называем "радиоволны"?
И таки да, радио - это технология. Технология передачи сообщений
Таки нет. Радио - не технология, способы передачи и приёма - технология.
посредством электромагнитных волн
А, нет. Не нашёлся. Всё таки электромагнитных.
Пожалуй, на этом я и остановлюсь.
Моего словарного запаса вряд ли хватит выразить ту степень благодарности, которую я сейчас испытываю.

Если для вас само радио, то есть электромагнитные волны - это ТЕХНОЛОГИЯ, то лучше остановитесь прямо тут. А то пополните ряды специалистов по швейцарскому туризму
Напомню, что радио, как пример технологии, первым упомянули именно вы.
И должен сообщить вам, как явному специалисту по по швейцарскому туризму: понятия радио и электромагнитные волны вовсе не тождественны.
И таки да, радио - это технология. Технология передачи сообщений посредством электромагнитных волн в относительно небольшом диапазоне частот.
Пожалуй, на этом я и остановлюсь.

Повторюсь, чья бы корова...
Простите, но это ВЫ мне отвечаете. Да, моя "корова" промычала про беспрецедентность наличия в мире нормальной и нужной работающей технологии без аналогов.

И примером какой же технологии, у которой был аналог, является радио?
Если для вас само радио, то есть электромагнитные волны - это ТЕХНОЛОГИЯ, то лучше остановитесь прямо тут. А то пополните ряды специалистов по швейцарскому туризму.

Вы начали о чём-то о своём
Повторюсь, чья бы корова...


Вы пытаетесь придраться на уровне кванта времени?
Фраза достойная отливания в граните.


Та "пара примеров" как раз таки была о технологиях, у которых аналоги были. О чём в примерах и сказано вполне себе обычными буквами.
И примером какой же технологии, у которой был аналог, является радио?
Можно сказать и обычными буквами, но лучше все-таки словами.

Примеров чего? Технологий, которых не существовало ранее
Вы начали о чём-то о своём, и, как это всегда бывает в таких случаях - зря, хотя и весьма успешно.
на некий момент времени (т.е. не имело аналогов)
Вы пытаетесь придраться на уровне кванта времени? Не в моих силах вам помешать, могу только спросить - а зачем?

Я говорил о технологиях не имеющих аналогов в мире.
Они все таковые, без исключения - пару примеров вы сами лично привели выше.
Та "пара примеров" как раз таки была о технологиях, у которых аналоги были. О чём в примерах и сказано вполне себе обычными буквами.

У вас дыра в логике.
Да что вы говорите!

Если радио практически сразу скопировали и реализовали в нескольких странах, а метод напыления монослоя в вакууме украли ещё на стадии чертежей, то это не значит, что все эти технологии существовали вечно.
НЕ МОЖЕТ БЫТЬ!!! А мне вот тут выше специалист без дыр в логике пишет:

Технология может не иметь аналогов только по двум причинам
а) Её невозможно реализовать на данном этапе при данных ресурсах и заявления о её создании - враньё
б) Она нафиг никому не нужна и мы имеем дело с огурцом Малахова

Примеров не будет, я вас правильно понял?
Примеров чего? Технологий, которых не существовало ранее на некий момент времени (т.е. не имело аналогов)? Они все таковые, без исключения - пару примеров вы сами лично привели выше.
И снова не благодарите - Ваш Кэп.

То есть в вашем мире все ныне существующие технологии существовали с начала времен?
У вас дыра в логике. Если радио практически сразу скопировали и реализовали в нескольких странах, а метод напыления монослоя в вакууме украли ещё на стадии чертежей, то это не значит, что все эти технологии существовали вечно.

Примеров не будет, я вас правильно понял? Жаль.

У вас есть шанс дать пример такой необычной ситуации.
То есть в вашем мире все ныне существующие технологии существовали с начала времен?
Ну, поздравить вас с этим представлением о мироздании я не могу - могу посочувствовать.

А еще технология может не иметь аналогов, потому что ей нет аналогов
В мире? Ок. У вас есть шанс дать пример такой необычной ситуации. Впервые в человеческой истории, с чем вас и поздравляю.

А еще технология может не иметь аналогов, потому что ей нет аналогов (внезапно!).
Ваш Кэп.

Автоматические субтитры - ок, для незнакомого языка сгодится. Но за каким лядом их озвучивать?
19.07.21 14:28
0 1

Точно! Нафиг им выбор, пусть смотрят в кинотеатрох что положено и проверено.

Можно убрать всех людей из совка, но не из всех людей можно убрать совок...
Так их! Они ещё и наркотики запрещают! А сейчас ещё и сигареты гнобить начали - на святое покусились!!!111

Вам что не понятно-то, польза от расширения возможностей получать иформацию?
Мне было непонятно, что у нас - абстрактная демагогия о неопределенном будущем или речь о каких-то реальных кейсах. С некоторыми усилиями мы выяснили, что "Автоперевод расширит выбор", т.е. демагогия.

Ну так может, стоит сделать пребывание "в Ютубе" максимально некомфортным для детей?
Точно! Нафиг им выбор, пусть смотрят в кинотеатрох что положено и проверено.

Можно убрать всех людей из совка, но не из всех людей можно убрать совок...

Или вот еватым образом речь про тех, кто учится по автопереведенным курсам?
Есть примеры тех, кто учится по просто переведённым курсам. Но их количество ограничено. Автоперевод расширит выбор.

Есть ещё куча другого контента и его потребителей, прям вот живой пример - моя жена и Origins, который она ещё не может воспринимать в оригинале, но очень хочется, а дайдер куда-то пропал (или не успевает).

Вам что не понятно-то, польза от расширения возможностей получать иформацию?

Возможно вы не в курсе, но в современном мире дети проводят в Ютубе намного больше времени, чем в кинозалах.
Ну так может, стоит сделать пребывание "в Ютубе" максимально некомфортным для детей?
20.07.21 09:13
0 0

- Ты прикинь, сейчас одного пассажира пропустил, у него в чемодане кирпичи! Говорит - в Париже дом строит. Идиот, прадва?- Ну не знаю. Он дом в Париже строит, а мы тут на таможне сидим...То, что они ещё не выучили английский не делает их глупыми. Они как раз умнеют в любом случае, ибо учатся.
Вот тут непонятно, кто умеет - кирпичи или таможенники? Или вот еватым образом речь про тех, кто учится по автопереведенным курсам? Можно пример таких? Реально интересно, кто дошёл до жизни такой. Потому что если это абстрактность из разряда "а как только научимся преодолевать световой барьер, человечество распространится по вселенной", то...

Сомневаюсь, что вы предпочитаете смотреть видео на русском с субтитрами (на русском же).
Не понял этого места. Русский мой родной, поэтому если звук разборчив, субтитры выключаю. Если же речь о том, предпочитаю ли я видео смотреть на русском, то тут очень зависит от того, что за видео. Любой изначально русский контент - безусловно. Зарубежные фильмы - как правило, нет. Оригинал с титрами оптимален. Привычка. Даже на испанском/японском. Начиная с просмотра сериала "Мост" я понял, что так гораздо лучше.
Прогресс будет, безусловно. Я очертил временное окошко, о котором я говорю. В обозримом будущем вменяемого автодубляжа не будет. И я писал именно об этом.
Поэтому
очевидный пример того "за каким лядом их озвучивать"
настолько же очевиден, насколько бессмысленнен.
20.07.21 08:27
0 1

Пафнутий, не останавливайтесь, тут еще несколько веток есть
И вы специально скакали три дн... прибежали ещё и сюда чтоб мне об этом сообщить?
Какое поразительное неприятие "бесполезного флейма" с вашей стороны. Я восхищён.

А не надо изобретать велосипед. Во всем мире для мультиков/фильмов для детей младшего возраста используют дубляж.
Фильмы и дети был приведен, как очевидный пример того "за каким лядом их озвучивать".
Возможно вы не в курсе, но в современном мире дети проводят в Ютубе намного больше времени, чем в кинозалах. И не-дети тоже.
И доступность контента на родном языке сильно варьируется, как несложно догадаться.
И этот контент - не только мультики.
Так что, упомянутая технология вполне подойдет для массы видеороликов, интересных детям и взрослым, где высокохудожественный перевод не нужен.
Наконец, новые технологии имеют удивительное свойство совершенствоваться.
В целом, субтитры вместо звука - это больше компромисс, костыль. Сомневаюсь, что вы предпочитаете смотреть видео на русском с субтитрами (на русском же).
19.07.21 17:35
0 2

Пафнутий, не останавливайтесь, тут еще несколько веток есть, которые вы можете заткнуть своей гениальной душнотой. Последнее слово будет все равно за вами, мы верим.

А не надо изобретать велосипед
Да и велосипед не надо было. Нормально ж без него по деревьям лазили...
А вот тем, кто учится по автоматически переведенным лекциям и слушает автоматически переведенные аудиокниги, мои искренние соболезнования.
- Ты прикинь, сейчас одного пассажира пропустил, у него в чемодане кирпичи! Говорит - в Париже дом строит. Идиот, прадва?
- Ну не знаю. Он дом в Париже строит, а мы тут на таможне сидим...

То, что они ещё не выучили английский не делает их глупыми. Они как раз умнеют в любом случае, ибо учатся.
Во всем мире для мультиков/фильмов для детей младшего возраста используют дубляж.
Ага. Официальный дубляж в кинотеатре (могу таймкод дать):
Оригинал: - It's Snape!
Дубляж: - Это я!
"Вы будете уродовать своих детей этим, не жалко их, нет?" (с)

Попробуйте посмотреть вместе с детьми младшего возраста мультфильм/кинофильм с субтитрами, к примеру.
Хотя, вообще говоря, ведь это тоже возможный путь прогресса. Если мы не можем научить ИИ говорить неотличимо от людей, пусть люди с детства учатся говорить, как ИИ. Поначалу без знаков препинания и монтонно будет немного непривычно, но ничего, после того, как сменится пара поколений, будем воспринимать как должное.
19.07.21 16:49
1 1

Попробуйте посмотреть вместе с детьми младшего возраста мультфильм/кинофильм с субтитрами, к примеру.
А не надо изобретать велосипед. Во всем мире для мультиков/фильмов для детей младшего возраста используют дубляж. Даже в тех странах, где привыкли обходиться субтитрами (скандинавские страны, например).
Еще раз, мы говорим об автоматическом переводе. Вы будете уродовать своих детей этим, не жалко их, нет?
Когда я ищу инструкцию по разборке какой-либо хрени и нахожу только видеовариант на немецком языке, которого я не знаю, субтитры помогают мне понять, в чем там суть, когда самого видеоряда недостаточно.
Но смотреть фильм, озвученный автоматом...Нет. Знаю язык - нафиг надо. Не знаю язык - текста достаточно, в оригинальных интонациях актеров есть свое преимущество. И я вполне допускаю, что ближайшие двадцать-тридцать лет, то есть пока это будет для меня актуально, качество автоматического перевода текста станет приемлемым.
А для удовлетворительного дубляжа я, скорее всего, не доживу (и слава богу, если честно).
Вот тут привели в качестве возможного применения как помощь тем, у кого проблемы со зрением. Это как раз имеет смысл, об этом я не подумал.
А калечить детей - последнее дело. Им надо лучшее.
19.07.21 16:44
0 4

Но за каким лядом их озвучивать?Вас, видимо, это удивит, но люди бывают невидящие, а на ютубе бывают аудиокниги и лекции.
Невидящие - аргумент. Плюсик.
А вот тем, кто учится по автоматически переведенным лекциям и слушает автоматически переведенные аудиокниги, мои искренние соболезнования.

Но за каким лядом их озвучивать?
Действительно, нафига людям уши, если уже есть глаза!
Попробуйте посмотреть вместе с детьми младшего возраста мультфильм/кинофильм с субтитрами, к примеру.
19.07.21 15:07
0 5

Но за каким лядом их озвучивать?
Вас, видимо, это удивит, но люди бывают невидящие, а на ютубе бывают аудиокниги и лекции.

Помнится, Юбисофт на геймконах за якобы игровые ролики выдавала специально сделанные синематики. Яндекс решила принять на вооружение этот старый прием?
19.07.21 14:25
3 2

В начале 80-х синтез голоса казался фантастикой, а цифровая обработка звука была невозможна - в силу малой вычислительной мощности процессоров.
В начале 90-х распознавание ПЕЧАТНОГО текста казалось фантастикой - а к концу 90-х вошло в наш быт.
В начале 2010-х переводчики на смартфонах были чем-то малореальным. Но уже в 2014-15 годах я в Таиланде переводил этикетки и вывески с тайского.
Во время ЧМ по футболу народ довольно активно общался с иностранцами при помощи голоса в переводчиках на смартфонах
На Ютубе сейчас автоматически создаваемые субтитры на русском с других языков процентов на 70 - адекватны.
Так что просто вопрос времени и наработок.
Да, сейчас - пока криво. Но лет через 10 - думаю будет вполне вменяемо.
19.07.21 14:06
0 15

Хромает тут грамматика. Причём так что даже костыли не помогают понять изначальный смысл
Что ж вы врёте-то, а?
Мне понадобилось перечитывать куски (в сумме - весь текст) раза по три-четыре
И опять. Я понимаю, хочется любым способом уконтрапупить оппонента, но надо же и честь знать!
Приведённый пример диктовки вполне понятен. Если читать его примерно с той скоростью, с какой он начитывался, легко ставятся нужные паузы. Как будто слушаешь монотонную речь - что, собственно, он и воспроизводит. Вот этого вашего "ах, ах, нихера не понятно, тёмный лес!" и в заводе нету.
Скажите, вы правда такой, как о вас тут говорят?

У жены про, как вот это вот попробовать чтоб с пунктуацией?
У меня язык системы английский, не обессудьте.

System Preferences / Keyboard / Dictation
Select "On"
Choose a language
Choose a shortcut

Диктуете так: "Распознавание речи тире работает запятая каждый может это проверить в своём телефоне точка".
Возможно, поможет, если представите себя советским телеграфистом.
Перед словом с большой буквы говорите "с большой буквы" или "с заглавной буквы" - поэкспериментируйте.
В общем, проговаривайте знаки препинания.

Специально для вас - надиктовала в Айфон.
Этот абзац чудовищен для понимания, просто пытка какая-то.
20.07.21 14:42
0 0

Распознавание речи на MacBook Pro
Поподробнее можно? У жены про, как вот это вот попробовать чтоб с пунктуацией?

На Ютубе сейчас автоматически создаваемые субтитры на русском с других языков процентов на 70 - адекватны.
Одна тонкость: это автоперевод субтитров, написанных человеком. А попробуйте перевести автоматически сгенерированные субтитры - получите массу непечатных впечатлений.
20.07.21 11:16
0 1

Ну что можно сказать? Пунктуация - хромает на обе ногиХромает? На обе ноги?! Простите, но тут у неё нет ног вообще!
к
Да кому ты доказываешь. Эти люди уже привыкли слушать аутотюн, смотреть стандартное кино, читать тексты длиной не больше 255 символов. Какая на хрен пунктуация )

И вот как это перевести на русский одновременно с видеорядом я просто себе не представляю. Особенно если автор использует длинные предложения.
Буферизацией и переводом звука "заранее".
19.07.21 19:36
1 2

Я вообще-то уже не вижу и сегодня особых проблем (как простой юзер)
проблема в том, что перевод нужно воспроизвести одновременно с видео, т.е. перевести предложение ещё до того, как его произнесут до конца. Английский в этом отношении далеко не "worst case". В немецком "отделяемая" приставка глагола помещается в конец предложения, и может менять смысл предложения на противоположный. Ну вот например: Meine Frau nimmt in der letzten Zeit ab/zu. Если в конце предложения стоит ab, то жена сбрасывает вес в последнее время, если zu - набирает. И вот как это перевести на русский одновременно с видеорядом я просто себе не представляю. Особенно если автор использует длинные предложения.
19.07.21 19:28
0 3

Распознавание речи на MacBook Pro (Retina, 15-inch, Mid 2015):

"Я вообще то уже не вижу я сегодня особых проблем(как простой юзер). Распознавание речи– работает, каждый может это проверить в своём телефоне. Перевод текстов аудио– работает. Синтезаторы речи–сегодня могут говорить люди, потерявший голос или вообще никогда не говорившие, и им возможно дать не просто голос, лишь бы говорил, акцент и манеру речи под конкретного человека создать. Автоматический перевод текстов тоже работает."
Вижу некоторые недочеты, но в общем и целом неплохо. Не могу сообразить пока, что надо сказать, чтобы получился абзацный отступ.

Пунктуация - хромает на обе ноги
Так надо проговаривать знаки препинания - "запятая", "точка" и т. п. Если слово начинается с заглавной буквы, говорите "с большой буквы" ПЕРЕД тем, как произнести слово, то есть если сказать "с большой буквы лена", то на выходе получите "Лена".

я когда надиктовываю, говорю "запятая", "точка", "восклицательный знак"
Я тоже. Именно на эти "мелочи" я и хотел в итоге обратить внимание, потому что пунктуация, постите за пафос - "сестра" интонации, но очень младшая и простенькая. И коль скоро ИИ (нейросеть, что угодно) ещё не может, и даже не пытается, с ней справится то интонации в автоозвучке... Пока не. 😄

Внезапно диктовка в смартфонах работает вполне приличноК вам то же предложение. Особенно приятно будет увидеть корректно расставленную пунктуацию, что явно проще, чем правильно синтезировать интонацию в тексте.
я когда надиктовываю, говорю "запятая", "точка", "восклицательный знак":) И в нужном месте они появляются))

Уверена, если бы вы потратили на это время отданное пустым флэймам тут
А у вас неплохая самооценка. Удачи вам с ней.

Уверена, если бы вы потратили на это время отданное пустым флэймам тут (а я уверена, это не единственное место, где вы изливаете желчь, так что времени у вас много), вы бы преуспели в ваших поисках.
Я в вас верю, у вас получится.

Пафнутий, ваши душные тексты тоже надо перечитывать по несколько раз, что бы понять.
А я и не претендую, между прочим.
Но я как-то не делаю из этого выводов, что вы никуда не годитесь.
В писатели текстов быстрых для понимания - однозначно не гожусь.

Я думаю, если бы я приложила даже минимум усилий, я бы нашла что-то работающее лучше.
Речь не о лучше/хуже, речь о применимости к задачам. Если случится оказия и у вас получится - сообщите, пожалуйста. Потому что моих усилий, совсем не минимальных, на это не хватило.

Пафнутий, ваши душные тексты тоже надо перечитывать по несколько раз, что бы понять. Но я как-то не делаю из этого выводов, что вы никуда не годитесь.

Я воспользовалась технологией, которая есть у каждого в кармане, уверена она не самая идеальная. Я думаю, если бы я приложила даже минимум усилий, я бы нашла что-то работающее лучше. Возможно даже разработанное в Чехии, что бы вам было спокойнее.

Мой брат подрабатывал на медицинских конференциях синхронным переводчиком. И переводил юридические тексты.
Судя по тому что он рассказывал об особенностях процесса - до автоматизации крайне далеко.
Не в последнюю очередь из-за необходимости учитывать контекст и из-за обилия терминологии
А мне кажется, именно там должно быть проще. Специфическая лексика доставляет проблемы именно переводчику, так как он не является специалистом в данной области. Однако она понятна специалистам, не знающим языка 😉 Так что для машин должно быть проще.

Как-то раз, еще в бытность мою работником банка, мы отдали переводчикам на перевод статью о финансовом рынке. Нам был возвращен текст про урожайность. Я думаю, что конечно это была сознательная провокация переводчиков, что бы не загрузжали всякой фигней (они были правы, кстати). Но формально yield - это и урожайность, о доходность.
19.07.21 15:54
1 0

Ну что можно сказать? Пунктуация - хромает на обе ноги
Хромает? На обе ноги?! Простите, но тут у неё нет ног вообще! Ампутировано даже место, откуда они росли.
Хромает тут грамматика. Причём так что даже костыли не помогают понять изначальный смысл, к примеру, вот этого:
каждый может это проверить своем телефоне перевод текста в аудио работает синтезатор речи
а это приводит к тому что конечный результат не идеален
Идеал никто не ищет. Вопрос в том, применима ли технология на данном этапе хоть для каких-то целей.
Так что вполне.
Мне понадобилось перечитывать куски (в сумме - весь текст) раза по три-четыре что бы понять. То есть применяя к прослушыванию лекций, мне быстрее будет со словарём понять. Вывод - вообще не годится.

Ну и? Ведь речь нигде не шла о стопроцентно работающих технологиях.

Специально для вас - надиктовала в Айфон.

Я вообщето уже не вижу сегодня особых проблем как простой юзер распознавание речи работает каждый может это проверить своем телефоне перевод текста в аудио работает синтезатор речи сегодня могут говорить люди потерявший голос не вообще никогда не говоривший им возможно дать не просто голос лишь бы говорил акцент и манеру речи под конкретного человека создать автоматический перевод текстов тоже работает все части есть понятно что не стопроцентного совершенства не на одном из этапов а это приводит к тому что конечный результат не идеален ещё монотонность надо преодолеть ну нейросети тут должны сильно помочь я не думаю что надо будет ещё 10 лет ждать хотя на сегодня как я читала где-то конференции по машинного перевода перевод живые переводчики

Ну что можно сказать? Пунктуация - хромает на обе ноги, бесспорно (моя тоже была неидеальна), а что касается текста - ошибок не меньше, чем у меня при наборе (а я правила, то что писала!). Большинство ошибок отношу к моим "фефектам фикции" - проглоченные предлоги, ни-не-нет. Это ненамного хуже большинства писанины, которую можно встретить в интернете и это бытовая технология, доступная каждой домохозяйке.

Так что вполне.

Особенно приятно будет увидеть корректно расставленную пунктуацию
Пунктуацию - фтопку! Тексты заменять на смайлики!

Мой муж практически не пользуется клавиаурой на телефоне, ему лень, он все надиктовывает и как я вижу, на турецком он практически не редактирует.
Ага. Вот в этом "практически" вся собака и порылась.

Внезапно диктовка в смартфонах работает вполне прилично
К вам то же предложение. Особенно приятно будет увидеть корректно расставленную пунктуацию, что явно проще, чем правильно синтезировать интонацию в тексте.

как я читала где-то, конференции по машинному переводу переводят живые переводчики ?
Мой брат подрабатывал на медицинских конференциях синхронным переводчиком. И переводил юридические тексты.
Судя по тому что он рассказывал об особенностях процесса - до автоматизации крайне далеко.
Не в последнюю очередь из-за необходимости учитывать контекст и из-за обилия терминологии
19.07.21 15:18
0 3

Мой муж практически не пользуется клавиаурой на телефоне, ему лень, он все надиктовывает и как я вижу, на турецком он практически не редактирует. На английском редактирует очень много, но у него английский....хм... далек от идеала...
Я - всегда пишу, у меня действительно не получается надиктовывать. Но мне не так много надо по-русски писать, а англиский я сама за собой много правлю. Но я допускаю, что если бы я приложила некоторые усилия, я бы освоила голосовой ввод. В этом вопросе я ретроград.

А вы наговорите вот этот свой пост и выложите результат сюда без редактирования.
Внезапно диктовка в смартфонах работает вполне прилично

Распознавание речи - работает, каждый можрт это проверьть в своем телефоне.
А вы наговорите вот этот свой пост и выложите результат сюда без редактирования.

Я вообще-то уже не вижу и сегодня особых проблем (как простой юзер).
Распознавание речи - работает, каждый можрт это проверьть в своем телефоне.
Перевод текста в аудио - работает.
Синтезаторы речи - сегодня могут говорить люди, потерявшие голос или вообще никогда не говорившие, и им возможно дать не просто голос, лишь бы говорил, а акцент и манеру речь под конкретного человека создать.
Автоматический перевод текстов тоже работает.

Все части есть , понятно, что нет 100% совершенства ни на одном из этапов, а это приводит к тому что конечный результат не идеален. Еще монотонность надо преодолеть, но нейросети тут должны сильно помочь. Я не думаю, что надо будет еще 10 лет ждать.

Хотя на сегодня, как я читала где-то, конференции по машинному переводу переводят живые переводчики 😉
19.07.21 14:43
2 1

На Ютубе сейчас автоматически создаваемые субтитры на русском с других языков процентов на 70 - адекватны.Если эти субтитры озвучить, что вполне возможно, то я могу себе представить автоматический перевод.
Я даже могу представить хорошо озвученный перевод, у тебя уже есть интонации на оригинальном языке, их тоже можно использовать.
19.07.21 14:39
0 1

я могу себе представить автоматический перевод.
И я о том же.
Другое дело что сейчас мы видим первые робкие неуверенные шаги. Но тем не менее начало положено.
19.07.21 14:18
0 4

На Ютубе сейчас автоматически создаваемые субтитры на русском с других языков процентов на 70 - адекватны.
Если эти субтитры озвучить, что вполне возможно, то я могу себе представить автоматический перевод.
19.07.21 14:12
0 4

Алекс, побалуйся здесь: https://dictor.mail.ru/
Там тебе не только озвучат, но и "визуально" проговорят.
В целом, думаю, технологии перевода и озвучки совсем скоро уже выйдут на тот уровень, при котором сложно будет отличить от реальности )))
Нейросети учатся, Скайнет не за горами.
19.07.21 13:49
0 2

Задача понимания текста - это вообще ИИ-полная задача (можете погуглить), ее может решить только сильный ИИ (ну, или человек).
Так, прекращайте сейчас же все работы и стирайте файлы. А то так мы дойдём до Массачусетской Машины.
20.07.21 14:39
0 0

Лет 10 назад условный гугл транслэйт работал как не пойми кто. Теперь фактически нормальный перевод.
Задача понимания текста - это вообще ИИ-полная задача (можете погуглить), ее может решить только сильный ИИ (ну, или человек).
Я возражал конкретно этому тезису:

В целом, думаю, технологии перевода и озвучки совсем скоро уже выйдут на тот уровень, при котором сложно будет отличить от реальности )))
Что сомневаюсь в скором достижении такого уровня.
То что мы видим на этой демонстрации (и по ссылкам) - это неоспроимый прогресс, но до варианта "сложно отличить от человеческой речи" - далеко, на мой дилетантский взгляд.
Вполне возможно, что и не достижимо - в том числе, потому что нафик не надо.
19.07.21 18:33
0 1

Задача понимания текста - это вообще ИИ-полная задача (можете погуглить), ее может решить только сильный ИИ (ну, или человек).
19.07.21 17:51
0 0

> эмоционально окрашенную речь не умеют совсем пока
Ну, скажем балована ваша Гала. Лет 10 назад условный гугл транслэйт работал как не пойми кто. Теперь фактически нормальный перевод.
19.07.21 17:09
0 2

Ну, эмоционально окрашенную речь не умеют совсем пока.
Для этого ИИ нужно, как минимум, "понимать" текст.
Так что, "скоро" - это вряд ли.
19.07.21 14:04
0 1

Использую сервис для озвучки роликов. Там действительно можно "подкрутить" голос. Вот пример - голос Филиппа, что и в Яндексе, очевидно, кооперация. (Прошу прощения, если кому-то не понравится, что даю ссылку на свой ролик. )
19.07.21 13:42
0 11

Претензия относится лишь к уровню музыки - забивает текст - причем сильно забивает.
Я прослушал в ушах-вкладышах от айпода где-то до 1:10. Разборчивость текста великолепная, без напряга. Неужели дальше хуже?
20.07.21 11:00
0 1

У меня жена особо чувствительна к раздражающими акцентам и говору разных Ютюб-блогеров
О, да! У живых видеоблогеров нередко встречаются такие особенности дикции, которые через минуту начинают безумно раздражать. Ставить голос — непростая задача.
20.07.21 10:57
0 1

Спасибо. Но это сознательный выбор. Музыка должна быть тревожная.
Я так и понял что музыка сознательно выбрана тревожная - и это правильно.
Претензия относится лишь к уровню музыки - забивает текст - причем сильно забивает.
А тему вы поднимаете в ролике весьма актуальную. Хоть я и не в Питере живу
19.07.21 15:12
2 1

Спасибо. Но это сознательный выбор. Музыка должна быть тревожная. В данном случае при прослушивании на качественной аппаратуре низы действительно очень активны, но, к моему глубочайшему сожалению, ролик смотрят на 3/4 на смартфонах, и без наушников, а там как раз получилась нужная пропорция. Тестировал перед заливкой на Ютюб.
19.07.21 14:28
0 2

Ясно, спасибо. Но работа технологии впечатляет безмерно.
19.07.21 14:18
0 4

Да, это особенно удобно в работе, когда нужно отредактировать текст, поменять ударение, интонацию или что-то изменить. Подгружаешь новый блок текста, клик - и у тебя новый качественный звуковой файл с тем же тембром и звучанием. Вставок не заметно, меньше возни, по сравнению с живыми людьми, где для любых изменений нужно найти время.
У меня жена особо чувствительна к раздражающими акцентам и говору разных Ютюб-блогеров, а тут - сразу одобрила голос. Хоть и остается некоторая механистичность и некоторые промахи в интонациях, которые пока не настроить у робота.
19.07.21 14:15
0 2

Хороший ролик. И по содержанию, и по смыслу и по видеоряду и по голосовой озвучке.
Музыка неудачная. Возможно не сама музыка - а слишком высокий ее уровень. Долбит прямо в уши. (слушаю в наушниках)
19.07.21 14:10
3 2

То есть это озвученный Яндексом текст? Впечатляет, да.

Свой ролик - без проблем, ведь это для демонстрации.
19.07.21 14:04
2 2

Это явно не "перевод, явно сделанный профессиональным переводчиком и озвученный профессиональным актером".
19.07.21 13:40
1 21

cloud.yandex.com
Выберите голос филип и вставьте текст в поле слева.
(Понятно, что демороликах озвучку «подкрутили» тонкими настройками)
19.07.21 13:30
0 7

Мне там больше голос Оксана понравилась. Вроде наиболее естественно звучит.
19.07.21 19:05
0 0

Надо просто промотать страницу чуть вниз.
19.07.21 18:26
0 0

Скайнет не за горами.
Забавно, что вставку перед озвучкой: "Озвучено в Яндекс SpeechKit" Алёна произносит антирекламно: "СпичКыт".
это потому что там нет английского произношения, вот и вылезают такие приколы
19.07.21 14:08
0 0

Алёна произносит антирекламно: "СпичКыт".
Попробуйте английский текст туда влепить. 😉
Это не бага, это фича.
19.07.21 13:50
0 0

Да, действительно, впечатляет, спасибо.
19.07.21 13:50
0 1

Забавно, что вставку перед озвучкой: "Озвучено в Яндекс SpeechKit" Алёна произносит антирекламно: "СпичКыт".
19.07.21 13:41
1 1

Только "Demo" сначала в верхнем меню выбрать надо. Или вот прямая ссылка:
cloud.yandex.com
19.07.21 13:34
0 1

"...браузер Эндекс..." на 1:13 - профессиональный чтец закосил под бездушную машину? 😉
19.07.21 13:28
1 2

Я это заметил, но возможно, что специально, да 😄

Это робот Фёдор сидит и всё переводит! Так что - роботизация и автоматизация на марше!
19.07.21 13:27
0 3

Гугл же умеет генерировать автоматические субтитры (не всегда чётко, но всё же). И переводить их на другие языки. Осталось добавить последний шаг - озвучить их. Но Гугл почему-то это не реализовал, хотя синтезатор речи у него есть. Видимо не стал потому, что на выходе совсем кринжово получается. 😄
19.07.21 13:01
0 6

Отчего же? "Крипово" — это ещё и "мерзко", "отталкивающе", "ничтожество". " I'm a creep, I'm a weirdo"
20.07.21 16:33
0 0

Крипово - это "пугающе". Чего ж пугающего в синтезаторе речи? А кринжово - это "отвратительно", "убого" или вызывающее чувство "испанского стыда".
20.07.21 14:48
0 1

что на выходе совсем кринжово получается.
А чо, "крипово" уже не говорят? Эх, я отстал, отстал!
20.07.21 10:52
0 0

Практически всегда, когда мне надо сделать субтитры для речей шефа, Гугл определяет язык как Dutch? (шеф - курд, речи на английском
Хорошо еще не double Dutch.
19.07.21 14:26
0 0

Практически всегда, когда мне надо сделать субтитры для речей шефа, Гугл определяет язык как Dutch? (шеф - курд, речи на английском ). Его (шефа) английский корректный, он правильно говорит и пишет, но говорит быстро, торопится, у него есть акцент, но не очень ярковыраженный, я бы даже скорее сказала, что это просто не очень внятная речь и голос не поставленый.
Хотя при этом чистых англичан Гугл очень неплохо распознаёт, какая бы каша у них во рту на была.
19.07.21 13:50
1 1

Именно так, потому что результат пока - ниже плинтуса.
19.07.21 13:02
3 1

"Последняя используется для определения пола говорящего" - разработчики ступили на скользкую дорожку... Прилетит им по полной программе.
19.07.21 12:57
0 10

Это только если яндекс их некорректно распознает.
19.07.21 13:19
0 0

Прилетит им по полной программе.
от боевых вертолётов?
19.07.21 13:07
0 1

Ну, поправят на "определение тембра голоса говорящего", делов -то...
19.07.21 13:02
0 0

Fake it till you make it
19.07.21 12:53
1 5
Теги
Сортировать по алфавиту или записям
BLM 21
Calella 143
exler.ru 272
авто 442
видео 4000
вино 359
еда 500
ЕС 60
игры 114
ИИ 29
кино 1581
попы 192
СМИ 2761
софт 930
США 132
шоу 6