Silero.ai is a company that provides pre-trained speech-to-text (STT) and text-to-speech (TTS) models and benchmarks. They offer enterprise-grade STT that is comparable to Google’s STT and sometimes even better. They also provide Silero VAD which is a pre-trained enterprise-grade voice activity detection (VAD) model that was trained on huge corpora that include over 100 languages and it performs well on audios from different domains with various background noise and quality levels.
Location: Anguilla
Mentions in press and media 7
Date | Title | Description |
31.10.2024 | The Rise of Open-Source Text-to-Speech Solutions: A New Era in Voice Synthesis | In the world of technology, the voice is a powerful tool. It conveys emotion, intent, and information. Text-to-speech (TTS) technology has evolved dramatically, transforming how we interact with machines. Today, open-source solutions are at... |
30.10.2024 | Синхронизация речи и действий: голосовой AI ассистент | История о том, как я пытаюсь создать голосового AI помощника для моего 5-летнего сына. Создание AI помощника - идея не новая, особенно с учетом массового распространения ИИ в последний год и появления голосового ассистента от OpenAI и их Re... |
30.10.2024 | Text-to-speech. Анализ открытых решений синтеза речи | Всем привет! В этой статье будут рассмотрены открытые проекты по синтезу речи с поддержкой русского языка. Под словом «открытые» будем иметь в виду, что разработчики безвозмездно предоставляют в пользование результаты своих трудов (спасибо ... |
18.06.2024 | Моя б̶е̶з̶умная колонка: часть вторая // программная | Привет, Хабр! В прошлой статье я описал аппаратную реализацию своего голосового ассистента на базе бюджетного одноплатника Orange Pi Zero 2W с 4Гб оперативной памяти. Эту же статью хочу посветить программной реализации данного устройства. Е... |
11.03.2023 | ChatGPT в роли стримера | В прошлом году мне выдалась возможность впервые поиграться c ChatGPT от OpenAI, однако практические применения, которые приходили мне в голову, оказались слишком сложными для реализации моими неполноценными студенческими знаниями, из-за чег... |
22.09.2022 | OpenAI решили распознавание речи! Разбираемся так ли это… | Вчера OpenAI выпустили Whisper. По сути они просто опубликовали веса набора больших (и не очень) рекуррентных трансформеров для распознавания речи и статью (и самое главное, в статье ни слова про compute и ресурсы). И естественно уже вчера ... |
05.10.2021 | Как мы проверили качество распознавания речи у Яндекса, Гугла, Тинькофф, Amazon и др | Всем привет! Я руковожу «Наносемантикой», сегодня хотел бы поделиться с вами результатами нашего сравнения сервисов ASR на русском языке. Мы подготовили датасет, проанализировали результаты работы систем распознавания речи разных вендоров, ... |