Получаем тексты из видео и аудио (транскрибация) | Python, FFMPEG, Models vosk

Опубликовано: 21 Январь 2025
на канале: Andrievskii Andreii
3,416
120

Этот скрипт представляет собой комплексное решение для работы с видео и аудиофайлами, предназначенное для извлечения аудиодорожки из видео, её последующей обработки и конвертации в формат WAV с определёнными параметрами, а затем транскрибации полученного аудио в текст. Работа скрипта делится на несколько основных этапов, каждый из которых выполняет свою уникальную функцию.

Установка путей для ffmpeg:
setx /m PATH "C:\ffmpeg\bin;%PATH%"
ffmpeg -version

Установка зависимостей для Python:
pip install -r requirements.txt

★ Подпишись на мой канал с бесплатными курсами программирования!
► моя IDE: https://www.jetbrains.com/pycharm/dow...

★ ССЫЛКИ ПО ТЕМЕ ★
https://github.com/Black-coffe/AudioE...
https://www.gyan.dev/ffmpeg/builds/#r...
https://alphacephei.com/vosk/models

▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
★ НАШЕ КОМЬЮНИТИ ★
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
★ Телеграм (Front End): https://t.me/joinchat/FQXf-hN9LRuCosQ...
★ Discord (All):   / discord  

▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
★ Тайм-коды ★
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
00:01 – Что это будет...
00:45 – Демонстрация финального результата
02:00 – Установка кодека FFMPEG
05:30 – Прописываем системные пути для кодека FFMPEG
08:20 – Скачиваем языковые модели vosk для распознавания текста в аудио
10:50 – Скачиваем бесплатную IDE (PyCharm Community)
12:25 – Работа с кодом внутри IDE
15:00 – Варианы импортирования зависимостей (библиотек)
18:00 – Как подготовить видео файл
21:40 – Как работать с файлом requirements.txt
24:10 – Использование предобученныхмоделей vosk
29:00 – Готовим скрипт для запуска
30:30 – Работа с сырым текстом
32:20 – Обработка текста в GPT-4 чате
34:50 – Обработка текста в GPT-3 чате
36:00 – Пишу с GPT дополнительный функционал скрипт по разбивке текста в блоки
38:50 – Скармливаю части с текстом GPT3-5 для написания статьи

Автор: Андриевский Андрей
Раздел: Проекты на Python

#Python #moviepy #pydub #vosk #Аудиообработка #РаспознаваниеРечи #ОбработкаВидео #ПреобразованиеАудио #ТранскрипцияАудио #Программирование #Python3 #Автоматизация #МашинноеОбучение #ОбработкаДанных #ГлубокоеОбучение #АудиоВТекст #ГрафическиеПриложения

▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
★ РЕКОМЕНДУЮ ВИДЕО ПО ТЕМЕ ★
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
● [[ Курс Python 3 ]] : [[    • Курс Python 3 | Подготовка рабочей среды   ]]
● [[ Базовый JavaScript ]] : [[    • Знакомство с JavaScript – Урок #1 | Б...   ]]
● [[ Курс HTML & CSS ]] : [[    • Знакомство с основным каркасом страни...   ]]

▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
★ ПОПУЛЯРНЫЕ ПЛЕЙЛИСТЫ ★
▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬▬
● Курс HTML & CSS:    • Знакомство с основным каркасом страни...  

● Базовый курс JavaScript:    • Знакомство с JavaScript – Урок #1 | Б...  

● Базовый курс Python:    • Курс Python 3 | Подготовка рабочей среды  

● Базовый курс PHP7:    • Установка и настройка PHP-7.4.1 на Wi...  

● Динамический сайт с нуля:    • Установка сервера WAMP (ampps) | Дина...  


распознавание речи, vosk, python, обработка аудио, обработка видео, pydub, moviepy, аудио в текст, извлечение аудио, конвертация аудио, конвертация видео, сохранение текста, обрезка аудио, wave, KaldiRecognizer, json, обработка текста, текстовые файлы, программирование, аудиодорожка, видеоролик, WAV, MP3, моно, частота дискретизации, видео в аудио, автоматическое распознавание речи, машинное обучение, AI, ИИ, алгоритмы распознавания, звуковой сигнал, текстовая транскрипция, обработка данных, анализ аудио, извлечение текста, аудиофайл, видеофайл, кодировка, разделение текста, скриптование, Python библиотеки, аудио анализ, видео анализ, data science, наука о данных, deep learning, глубокое обучение