Слышали о MacWhisper? Незаменимая вещь для школьников, студентов и офисных трудяг, причём бесплатно

Олег

macOS

В современном мире учеба и офисная работа неразрывна связана с текстовыми данными. Приходится читать, выделять главное, аннотировать, исправлять — и хорошо, когда текст уже готов к работе и позволяет не делать лишних движений. Однако нередко бывает так, что его сначала нужно создать, например из устной лекции, доклада или «летучки» от начальника.

Подписаться на iGuides в Telegram, чтобы узнать обо всем первым — t.me/iguides

Приложения для расшифровки аудио и конвертации в текст существуют довольно давно, но сегодня на помощь приходят нейросети. Например, компания Apple встроила в свои iOS, iPadOS и macOS функцию, которая понимает устную речь и превращает её в текстовую заметку. К сожалению, опция пока не работает на русском языке, а даже если заработает, то будет доступна единицам — Apple установила очень высокие ограничения по совместимости с девайсами.

Сторонние разработчики тоже не сидят без дела: на днях большое обновление получило приложение MacWhisper. Благодаря бесплатной версии и поддержке русского языка оно вполне может быть вам полезно.

Что такое MacWhisper

Это приложение для macOS, которое умеет транскрибировать голосовые заметки в текстовый вид. Оно базируется на AI-технологиях и максимально интегрировано в систему, а потому может быть удобным и полезным.

Утилита позволяет расшифровывать не только подкасты или диктофонные записи (то есть аудиофайлы), но и голос пользователя прямо на ходу. То есть вы можете надиктовать всё, что хотели бы сохранить, прямо в реальном времени, и утилита превратит это в текст для дальнейшей работы и взаимодействия. Свежая версия MacWhisper 11 поддерживает работу с быстрой голосовой заметкой прямо из верхнего статус-бара, так что полноценно запускать приложение даже не требуется.

Преимущество именно нейросетевого транскрибирования в том, что оно может быть гораздо точнее обычного распознавания. Быстрый темп речи или невнятные слова не должны стать для него проблемой, как и расстановка знаков препинания. Дополнительно можно подключить сторонние ИИ-сервисы вроде Olama или LM Studio.

Разработчик заверяет, что по умолчанию приложение транскрибирует аудио прямо на вашем компьютере, без выгрузки данных в облако, что подразумевает неплохой уровень приватности. В платной версии опционально можно подключить облачную обработку на мощностях OpenAI с собственным ключом.

Какой выбрать?

macOS

На официальном сайте разработчика предлагаются два варианта приложения — MacWhisper и MacWhisper Pro, которая стоит 49 евро. Если нужно несколько лицензий, можно сэкономить и купить их комплектом. Однако для обычных бытовых нужд и домашнего использования будет вполне достаточно бесплатного варианта.

Базовый вариант поддерживает расшифровку аудиофайлов и записей «на ходу», интеграцию с macOS и замену стантартной диктовки от Apple на MacWhisper. При расшифровке программа удаляет междометия, вздохи, мычание и другие мусорные элементы, а также понимает шепот.

Pro-версия позволяет преобразовывать файлы «оптом», то есть не по одному, а сразу папкой, транскрибировать ролики с YouTube, поддержку ChatGPT и Claude, ручное добавление нескольких дикторов для большей упорядоченности стенограммы, опциональное удаление пометок о молчании, фоновое транскрибирование системного аудио (например, конференции Zoom в реальном времени), перевод стенограммы на другой язык по технологии DeepL, добавление субтитров к роликам и приоритетная поддержка от разработчиков.

Как скачать и пользоваться

macOS

На главной странице сайта выберите бесплатную лицензию и нажмите на черную кнопку I want this! Далее введите ваш email-адрес и цифру 0 в строку Add a tip. Нажмите Get, а потом Download. Ключ можно cкопировать, и еще он продублируется на email.

После скачивания утилита разархивируется в папке «Загрузки», поэтому перетащите её в «Программы». Запустите MacWhisper и на стартовом экране выберите ваше основное занятие — журналистика, учёба и так далее; это поможет приложению лучше понимать контекст информации для расшифровки.

macOS

На следующем экране будет предложено скачать модель транскрибирования. Для «бесплатников» доступны Basic и Small; разница в весе пакета и точности. Если у Mac нет проблем со свободным местом на накопителе, скачивайте Small.

macOS

После загрузки приложение можно настроить под свои потребности. В разделе General я выбрал отображение иконки только в статус-баре без Dock, а также выставил папку для сохранения расшифровок. Здесь же можно включить параметр, добавляющий в текст транскрипции временные метки из аудиофайла. 

macOS

На вкладке Dictation можно включить замену штатной диктовки Apple на сервис от MacWhisper, а также выбрать кнопку её активации — например, при удержании клавиши fn. Прочие настройки я не трогал.

macOS

Во время работы с Mac вы можете нажать на иконку микрофона в верхнем статус-баре и увидеть всплывающее окно с параметрами языка, микрофона и историей диктовок. Также распознавание речи запускается сочетанием клавиш cmd R и выбранной вами кнопкой в настройках (например, fn). 

MacWhisper

Если нужно расшифровать аудиофайл, просто перетащите его в окно программы — утилита поддерживает mp3, wav, m4a, aac и так далее. В основном меню приложения вы увидите, какие опции вам недоступны с пометкой Pro. 

4
iGuides в Дзене —  dzen.ru/iguides
iGuides в Telegram — t.me/iguides
iGuides в VK —  vk.com/iguides
iGuides в Ok.ru — ok.ru/iguides

Рекомендации

Рекомендации

Будь в курсе последних новостей из мира гаджетов и технологий

Мы в соцсетях

Комментарии

–1
Тупых станет ещё больше
10 декабря 2024 в 23:41
#

Читайте также