[Авторская] Флибустьер (Flibooster) Твоя личная языковая лаборатория на компьютере.

Bot

Администратор
Команда форума
23 Янв 2020
207,535
3,148
113
269049.jpg

Как это технически устроено и сколько стоит?
Программа спроектирована так, чтобы вы сами выбирали уровень погружения:
1) полностью офлайн на одном ноутбуке
2) работа с предоплаченными сервисами по обработке голосав в текст и текста в голос
3) общий облачный сервер на компанию складчиков для экономии до 30% денег (в сравнении с индивидуальными оплатами).
Все три режима переключаются настройками.

Сценарий 1. Только локально, без интернета.

Ставите программу — она работает. В комплекте идет мощный движок распознавания речи, разработанный на языке Rust, который использует мультиязыковую модель Whisper Large-v3-Turbo ~1,6 ГБ (скачивается одной кнопкой при первом запуске).
Локальная модель умеет всё те же функции, что и платные сервисы: распознаёт английскую речь, превращает её в текст, склеивает субтитры из видео, но делает это менее качественно.

Что работает без интернета:
- Anki + Yomitan + локальная LLM (для переводов и анализа) ваше ядро.
- Запись и распознавание речи
а) анализ аудио-ответов при работе с программй;
б) "текст под курсор" - вставляет то, что Вы сказали в любое окно Вашей ОС для удобства и скорости взаимодействия.
- Shadowing с прокручиванием субтитров.
- Диктанты, повторение слов голосом, работа со словарём Anki.
- Видеоплеер с двумя дорожками субтитров (En, Ru) и Yomitan-всплывашкой по словам.
- Локальная LLM для оценки ответов (если поставите Ollama или LM Studio с любой моделью класса qwen-7B / gemma-7B / phi-3 — у меня qwen2.5 на 7 миллиардов параметров оценивает одну карточку ~2,5 секунды).

Что НЕ работает офлайн:
- Более качественное Text-to-Speech уровня живого диктора (локальные TTS пока сильно слабее ElevenLabs).
- Скачивание YouTube без VPN. Скачивание более 27 000 видео с видеохостинга.
- Получение качественных субтитров для тех видео, где их нет (длинные фильмы — это тяжёлый STT, локально на CPU будет идти часами).
- Разделение голосов на дорожке (диаризация) на профессиональном уровне.

Минимальные требования (без локальной LLM):
- 4-ядерный процессор не старше 2018 года, 8 ГБ ОЗУ, 5 ГБ свободно на диске.
- Видеокарта желательна, но не обязательна. На CPU распознавание короткой фразы (3-5 секунд) — около 2-3 секунд ожидания.

Рекомендуемые (с локальной LLM для оценки ответов):
- 8 ядер, 16 ГБ ОЗУ, видеокарта с поддержкой Vulkan/Metal/CUDA и от 6 ГБ видеопамяти.
- На таком железе всё работает с задержкой как у живого репетитора — речь распознаётся за доли секунды, оценка ответа — пара секунд.
Стоимость: 0 ₽ в месяц. Платите один раз за саму программу.

---
Сценарий 2. Свои ключи: ElevenLabs + GPT

Тут вы покупаете лично свой аккаунт у ElevenLabs и если нужно у OpenAI для внешней GPT вместо локальной LLM и вписываете ключи в настройки.Программа сама будет ходить к ним напрямую, никаких посредников.

Что добавляется по сравнению со Сценарием 1:
- Распознавание речи с премиум-точностью на сегодняшний день и моментальным откликом (ElevenLabs Scribe v2 — лучший на рынке для английского).
- Голосовой синтез с настоящими «человеческими» голосами для диктантов и shadowing.
- LLM-оценка вашего ответа на уровне ChatGPT-4 — с разбором смысла.
- Генерация контекстных примеров под уровень A1/A2/B1/B2 для каждой новой карточки.

Тарифы ElevenLabs (актуальные на 2026):
┌─────────┬──────┬──────────────┬───────────────────────────────────────────────────┐
│ Тариф │ Цена │ Кредитов/мес │ На сколько хватает │
├─────────┼──────┼──────────────┼───────────────────────────────────────────────────┤
│ Starter │ $5 │ 30 000 │ 1 человек, лёгкая нагрузка (~30-50 карточек/день) │
├─────────┼──────┼──────────────┼───────────────────────────────────────────────────┤
│ Creator │ $22 │ 200 000 │ 3-4 человека на одном аккаунте (мой опыт) │
├─────────┼──────┼──────────────┼───────────────────────────────────────────────────┤
│ Pro │ $99 │ 1 000 000 │ Группа на 10-15 человек │
└─────────┴──────┴──────────────┴───────────────────────────────────────────────────┘

В распознавание речи обходится дешевле синтеза, поэтому если ваш сценарий — много слушать и говорить, а не генерировать аудио — Creator реально вытягивает четверых при ежедневных занятиях.

OpenAI: работаем по pay-as-you-go (постоплата). Реальный расход на одного активного ученика — $1-3 в месяц. Через программу настраивается на любой OpenAI-совместимый эндпоинт (т.е. подходит и Azure, и Together, и Groq).

Минимальные требования к ПК: заметно ниже, чем в Сценарии 1, потому что тяжёлая работа уехала в облако.
- 2 ядра, 4 ГБ ОЗУ, 2 ГБ на диске. Любой ноутбук последних 7-8 лет, без GPU.

Совокупная стоимость в месяц для одного активного ученика:
- Минимум: $5 (Starter) + $1 (GPT) ≈ 600 ₽/мес
- Комфорт: $22 (Creator) ÷ 4 пользователя + $2 (GPT) ≈ 700 ₽/мес на человека

---
Сценарий 3. Общий облачный сервер (складчина через Turmalin Gateway)

Это режим «вместе дешевле».

Создаём складчину на покупку Pro-тарифа на группу до 15 человек (групп может быть несколько).
Я как администратор облачного сервера, который специально написан для групповой модели добавляю купленный ключ и связываю его с участниками. У каждого участника будет свой ключ для работы с сервером и программа будет соединяться с ним во время работы.
Настраивается одним полем «адрес сервера» + ключ доступа.

Что даёт сервер сверх Сценария 2:
- Помогает скачивать видео из YouTube без заморочек с VPN, регистрацией и поиском подходящего софта - Shorts, длинные ролики, целые каналы.
- Скачивать видео для обучения на английском языка с видеохостинга с более чем 27 000 видео (фильмы, мультфильмы, сериалы).
- Готовые субтитры с AssemblyAI для длинных фильмов (бесплатные триал-аккаунты, ротируемые сервером — пока работает их щедрая программа). 300 часов видео на аккаунт~200 фильмов. Это даёт Вам возможность получитьт субтитры для видео где их не было и это целых 200 видо!.
- Общий аудиокеш: если кто-то уже сгенерировал озвучку слова «extraordinarily», следующему она прилетает мгновенно и бесплатно. На большой группе экономия достигает 40-60% к расходу токенов.
- «Делиться ресурсами»: участники с мощными GPU могут добровольно отдавать часть времени своего железа группе через специально разработанный канал — кто-то распознаёт речь другому, кто-то крутит локальную LLM. Не обязательно, но снижает нагрузку на платные ключи. Помогать участникам можно в удобное время: смотрите фильм, ушли в магазин. Вам - респект. "Коллегам" - экономия.

- Бонусы первой волны: в последние сутки месяца, когда квоты на аккаунте всё равно сгорят, активным участникам открывается безлимит на крупные переводы или озвучки книг. Вы об этом будете оповещены отдельно.

!!!Для первой группы доступ к видеохостингу АБСОЛЮТНО БЕСПЛАТНЫЙ !!! ТЫСЯЧИ ВИДЕО С СУБТИТРАМИ НА АНГЛИЙСКОМ И РУССКОМ ЯЗЫКАХ !!!

Экономика:

┌─────────────────┬──────────────────────────────────┬─────────────────────────────┬──────────────────────┐
│ Кол-во учеников │ Без сервера (каждый Creator $22) │ Через сервер (один Pro $99) │ Экономия на человека │
├─────────────────┼──────────────────────────────────┼─────────────────────────────┼──────────────────────┤
│ 5 │ $110/мес общая (22$ человека) │ $99/мес ÷ 5 = $20 │ 9% │
├─────────────────┼──────────────────────────────────┼─────────────────────────────┼──────────────────────┤
│ 10 │ $220/мес │ $99/мес ÷ 10 = $10 │ 55% │
├─────────────────┼──────────────────────────────────┼─────────────────────────────┼──────────────────────┤
│ 15 │ $330/мес │ $99/мес ÷ 15 = $7 │ 70% │
├─────────────────┼──────────────────────────────────┼─────────────────────────────┼──────────────────────┤
│ 30 │ $660/мес │ $330 (Scale) ÷ 30 = $11 │ 50% │
└─────────────────┴──────────────────────────────────┴─────────────────────────────┴──────────────────────┘

То есть когда наберётся хотя бы 10 человек — это уже экономия в 2 раза. На 15 — в 3 раза. С учётом аудиокеша (повторы слов и фраз между разными учениками одного уровня) реальная экономия ещё процентов на 20% выше, если есть общий контент.

Если группы нет: сервер просто не подключаете, работаете по Сценарию 1 или 2. Никаких принудительных подписок.

Требования к ПК ученика в этом режиме — те же что в Сценарии 2 (2 ядра, 4 ГБ, без GPU), потому что вся тяжёлая работа едет на сервер.

Главная мысль: программа полезна на любом из трёх уровней. Можно начать офлайн с нуля, попробовать, потом докупить ключ ElevenLabs когда упрётесь в качество TTS, потом присоединиться к складчине когда
захотите смотреть фильмы и качать YouTube. Никакого вендор-локина: ключи и подписки всегда ваши, при желании уходите без потери прогресса (Anki + ваша база — всё на вашем диске).