Ищем видео на YouTub`е.

/ Просмотров: 395
Ищем видео на YouTub`е.

Помню у Артемия Лебедева в одном из выпусков честных новостей было лаконично изложены события вокруг ЛНР, ДНР. Но вот беда, не помню в каком выпуске. Помню пару фраз из этого виде. Берем youtube-dl и ищем по автоматическим субтитрам. Скачаем субтитры всех видео из плейлиста, потом в этих файлах найдем нужную фразу.

1. Первая попытка:

youtube-dl.exe --write-auto-sub --sub-lang ru --skip-download "https://www.youtube.com/watch?v=XsSj1nlS1R0&list=PLmlTp5uCBYk7w6pryTr-Bd4SUZUvG4fQj"

Началось скачивание, но примерно на 40 видео возникла ошибка:

WARNING: Unable to download video info webpage: HTTP Error 410: Gone
ERROR: Sign in to confirm your age
This video may be inappropriate for some users.

Исправляем. Запускаем Chrome устанавливаем это расширение. Заходим на YouTub, авторизуемся. С помощью установленного расширения экспортируем куки в файл youtube.com_cookies.txt

2. Проверяем

youtube-dl.exe --cookies youtube.com_cookies.txt --write-auto-sub --sub-lang ru --skip-download "https://www.youtube.com/watch?v=XsSj1nlS1R0&list=PLmlTp5uCBYk7w6pryTr-Bd4SUZUvG4fQj"

Титры видеоролика с возрастным ограничением скачались, но возникла другая ошибка:

Unable to download webpage: HTTP Error 429: Too Many Requests (caused by HTTPError()); please report this issue on https://yt-dl.org/bug.

youtube-dl была последней на тот момент версией (2021.12.17), обновляться некуда. Я сдался, буду делать некрасиво.

3. Скачиваем список видео из плейлиста Честных новостей

youtube-dl-2021-12-17.exe -j --flat-playlist "https://www.youtube.com/watch?v=XsSj1nlS1R0&list=PLmlTp5uCBYk7w6pryTr-Bd4SUZUvG4fQj" > pl.txt

4. Правим в FAR`е, так, чтобы pl.txt состоял только из одних идентификаторов видео:

6YYXY83GPLw
hEkqhMS2RDs
-- -6wrrw6bVX4
OFXzngLeq8A
BDE7DXqeq4Q
CWY9XNnVTBA
-- -EWA7A-Het0
CK3Xt8DxYc8

при этом важно, чтобы идентификатор начинающийся на "-" был с префиксом "--"

5. Перебираем файл со списком идентификаторов:

for /f "tokens=*" %%i in (pl.txt) do (
youtube-dl-2021-12-17.exe --socket-timeout 10 --cookies youtube.com_cookies.txt --write-auto-sub --sub-lang ru --skip-download -o "%%i" %%i
)

6. FAR`ом ищем по всем субтитрам нужную фразу. Все.

PS: Оказалось видео было выпущено 23.02.2022, прямо за день до печальных событий.