- Saved searches
- Use saved searches to filter your results more quickly
- License
- nateshmbhat/pyttsx3
- Name already in use
- Sign In Required
- Launching GitHub Desktop
- Launching GitHub Desktop
- Launching Xcode
- Launching Visual Studio Code
- Latest commit
- Git stats
- Files
- README.md
- speakerpy 0.1.2
- Навигация
- Ссылки проекта
- Статистика
- Метаданные
- Сопровождающие
- Классификаторы
- Описание проекта
- SpeakerPy
- Возможные сферы применения SpeakerPy
- Особенности и преимущества SpeakerPy
- Установка
- Системные требования
- Установка через pip
- Установка и запуск через Docker
- Использование CLI
- Lib Speak
- Пример использования функции speak
- Использование класса SeleroText
Saved searches
Use saved searches to filter your results more quickly
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session.
Offline Text To Speech synthesis for python
License
nateshmbhat/pyttsx3
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
Name already in use
A tag already exists with the provided branch name. Many Git commands accept both tag and branch names, so creating this branch may cause unexpected behavior. Are you sure you want to create this branch?
Sign In Required
Please sign in to use Codespaces.
Launching GitHub Desktop
If nothing happens, download GitHub Desktop and try again.
Launching GitHub Desktop
If nothing happens, download GitHub Desktop and try again.
Launching Xcode
If nothing happens, download Xcode and try again.
Launching Visual Studio Code
Your codespace will open once ready.
There was a problem preparing your codespace, please try again.
Latest commit
Git stats
Files
Failed to load latest commit information.
README.md
Offline Text To Speech (TTS) converter for Python
pyttsx3 is a text-to-speech conversion library in Python. Unlike alternative libraries, it works offline.
If you get installation errors , make sure you first upgrade your wheel version using :
pip install —upgrade wheel
Linux installation requirements :
- If you are on a linux system and if the voice output is not working , then : Install espeak , ffmpeg and libespeak1 as shown below:
sudo apt update && sudo apt install espeak ffmpeg libespeak1
- ✨ Fully OFFLINE text to speech conversion
- 🎈 Choose among different voices installed in your system
- 🎛 Control speed/rate of speech
- 🎚 Tweak Volume
- 📀 Save the speech audio as a file
- ❤️ Simple, powerful, & intuitive API
import pyttsx3 engine = pyttsx3.init() engine.say("I will speak this text") engine.runAndWait()
Single line usage with speak function with default options
import pyttsx3 pyttsx3.speak("I will speak this text")
Changing Voice , Rate and Volume :
import pyttsx3 engine = pyttsx3.init() # object creation """ RATE""" rate = engine.getProperty('rate') # getting details of current speaking rate print (rate) #printing current voice rate engine.setProperty('rate', 125) # setting up new voice rate """VOLUME""" volume = engine.getProperty('volume') #getting to know current volume level (min=0 and max=1) print (volume) #printing current volume level engine.setProperty('volume',1.0) # setting up volume level between 0 and 1 """VOICE""" voices = engine.getProperty('voices') #getting details of current voice #engine.setProperty('voice', voices[0].id) #changing index, changes voices. o for male engine.setProperty('voice', voices[1].id) #changing index, changes voices. 1 for female engine.say("Hello World!") engine.say('My current speaking rate is ' + str(rate)) engine.runAndWait() engine.stop() """Saving Voice to a file""" # On linux make sure that 'espeak' and 'ffmpeg' are installed engine.save_to_file('Hello World', 'test.mp3') engine.runAndWait()
Full documentation of the Library
Feel free to wrap another text-to-speech engine for use with pyttsx3 .
speakerpy 0.1.2
`SpeakerPy` — это Python-библиотека для синтеза речи, основанная на моделях Silero Text-to-Speech.
Навигация
Ссылки проекта
Статистика
Метаданные
Метки синтез речи, text-to-speech, озвучивание текста, python, Silero, TTS, аудио, голос, синтезатор голоса, чтение текста, оффлайн TTS, мультиязычный TTS, преобразование текста в речь, генерация речи, аудиокниги
Требует: Python >=3.10,
Сопровождающие
Классификаторы
Описание проекта
SpeakerPy
SpeakerPy — это Python-библиотека для синтеза речи, основанная на моделях Silero Text-to-Speech.
Возможные сферы применения SpeakerPy
SpeakerPy предлагает ряд возможностей для синтеза речи, что делает его полезным инструментом для различных задач и сфер деятельности. Ниже приведены некоторые примеры областей, где может быть использовано приложение SpeakerPy :
- Образование: SpeakerPy может использоваться для озвучивания учебных материалов, таких как лекции, статьи и книги, что поможет студентам и преподавателям легче воспринимать информацию и экономить время.
- Аудиокниги: SpeakerPy может быть использован для создания аудиокниг из текстовых документов, что облегчит доступ к литературе для людей с ограниченными возможностями и тех, кто предпочитает слушать, а не читать.
- Подкасты и радио: SpeakerPy можно использовать для создания подкастов и радиопередач на основе текстовых материалов, таких как новости, статьи или блоги.
- Доступность: SpeakerPy может быть полезным для разработки приложений и веб-сайтов с функцией Text-to-Speech, что позволит сделать контент доступным для людей с нарушениями зрения или другими ограниченными возможностями.
- Озвучивание видео: SpeakerPy можно использовать для автоматического озвучивания видеоматериалов, таких как презентации, обучающие видео или даже корпоративные ролики.
- Иностранные языки: SpeakerPy может быть использован для озвучивания текстов на иностранных языках, что поможет изучающим язык лучше понять произношение и интонацию.
- Навигационные системы: SpeakerPy можно применять в навигационных системах и голосовых помощниках для автоматического озвучивания маршрутов, инструкций и другой полезной информации.
- Техническая поддержка: SpeakerPy может быть интегрирован в системы технической поддержки для автоматического озвучивания ответов на часто задаваемые вопросы или инструкций по решению проблем.
- Маркетинг и реклама: SpeakerPy может быть использован для создания голосовых объявлений, промо-роликов и презентаций, что позволит сэкономить время и средства на озвучивание профессиональными дикторами.
- Медицина: SpeakerPy может применяться для озвучивания медицинских текстов, инструкций по применению лекарств или результатов диагностики, что упростит восприятие информации для пациентов и медицинских специалистов.
- Наука и исследования: SpeakerPy может использоваться для озвучивания научных статей, докладов и конференций, что облегчит доступ к информации для ученых и исследователей.
- Кастомизация голосовых ассистентов: SpeakerPy может быть использован для кастомизации голоса виртуальных ассистентов, таких как Siri, Google Assistant или Alexa, что позволит пользователям выбирать голосовые опции, которые им больше нравятся.
- Замена голоса: SpeakerPy может использоваться для смены голоса в существующих аудиозаписях, например для анонимизации подкастов или интервью.
- Текстовые редакторы: SpeakerPy может быть интегрирован в текстовые редакторы для предоставления функции Text-to-Speech, что поможет авторам и редакторам проверять свои тексты на ошибки и стилистические неточности.
Эти примеры лишь часть возможностей применения SpeakerPy. Благодаря своей гибкости и мощным функциям, SpeakerPy может быть адаптирован для использования в самых разнообразных сферах и отраслях, где требуется синтезировать речь из текста. От маркетинга и рекламы до медицины и науки, SpeakerPy может стать полезным инструментом для разработчиков, специалистов по контенту и конечных пользователей.
В целом, возможности использования SpeakerPy ограничены лишь фантазией и потребностями конкретных пользователей или проектов. Благодаря своей универсальности и простоте использования, SpeakerPy может найти свое место в самых разных областях и помочь решать самые разнообразные задачи.
Особенности и преимущества SpeakerPy
- Транскрипция чисел и английских слов: SpeakerPy способен озвучивать числа и английские слова через транскрипцию.
- Синтез больших объемов текста: SpeakerPy может синтезировать большие объемы текста без проблем.
- Корректное деление текста на куски: благодаря использованию библиотеки nltk, SpeakerPy корректно делит большие тексты на предложения.
- Кеширование синтезированного текста: SpeakerPy синтезирует и хранит текст по кускам, что позволяет кешировать уже ранее синтезированный текст и избежать повторного синтезирования.
- Работа в автономном режиме: SpeakerPy синтезирует звук локально, без подключения к интернету, что позволяет использовать его в автономном режиме.
- Сохранение синтезированного текста в MP3: SpeakerPy предоставляет возможность сохранять синтезированный текст в формате MP3.
Установка
Системные требования
Установка через pip
SpeakerPy можно установить с помощью pip:
Установка и запуск через Docker
docker pull xable/speakerpy
Использование CLI
╰─➤ python -m speakerpy --help usage: __main__.py -l -f FILE -t SAMPLE_RATE SPEED NAME_TEXT AUDIO_DIR SpeakerPy: CLI для синтеза речи с использованием SpeakerPy 🎙️ options: -h, --help show this message and -l --language Язык синтеза en -f FILE, --file FILE Путь к файлу с текстом для озвучивания -t --type_out Каким образом вывести синтезированный текст speak -sr SAMPLE_RATE, --sample_rate SAMPLE_RATE Частота дискретизации умолчанию: -s SPEED, --speed SPEED Скорость чтения умолчанию: -n NAME_TEXT, --name_text NAME_TEXT Имя для текста, с таким именем сохранится итоговый mp3 файл умолчанию: имя файла с текстом -a AUDIO_DIR, --audio_dir AUDIO_DIR Папка для сохранения готовых аудио файлов умолчанию: текущая папка использования: python -m speakerpy -l ru -t speak -f ./books/example.txt python -m speakerpy -l ru -t mp3 -f ./books/example.txt python -m speakerpy -l en -t speak -f ./books/example.txt python -m speakerpy -l en -t mp3 -f ./books/example.txt
Проект состоит из двух основных компонентов: Lib Speak и Lib SL Text.
Lib Speak
Lib Speak включает классы Speaker и SpeakerBase для синтеза речи с использованием моделей Silero. Основные методы класса Speaker :
Пример использования функции speak
Lib SL Text содержит класс SeleroText для обработки текста перед синтезом речи. Основной метод класса SeleroText :
Использование класса SeleroText
Разделение текста на куски с помощью метода chunk() :