Бесплатные средства для распознавания текста
Бесплатные средства для распознавания текста
Многие из нас почти ежедневно что-то печатает. Но иногда требуется и обратный процесс — получение «электронного» текста с бумажных носителей. Что в таких случаях делать? Перепечатывать отсканированные страницы с текстом дело неблагодарное и если быть откровенным — довольно глупая. Особенно в наше время, когда компьютеры способны выполнять сложнейшие операции с вычислений, сравнений и даже предсказаний. Так размышлял я, начиная поиск бесплатного программного обеспечения для «вылущивания» текста из изображений.
И в принципе я не ошибся. Хотя таких инструментов не много, но они есть, а некоторые из них даже очень неплохие. Есть даже онлайн-сервисы, которые хоть и не позволяют вдоволь поиграть с настройками, однако позволяют быстро (без установки ПО) скачать отсканированные тексты и получить цифровые документы.
Эту категорию программного обеспечения обозначают аббревиатурой OCR ( Optical Character Recognition ) и используют для конвертации отсканированных книг и документов в цифровой текст, который можно редактировать в обычных текстовых процессорах. После тестирования десятка таких бесплатных программ и онлайн-сервисов я выбрал по два лучших (по моему мнению) представителя.
Среди наиболее качественных бесплатных «стационарных» OCR-программ в первую очередь можно отметить CuneiForm . Это программа для оптического распознавания, редактирования (исправления) и сохранение в популярных форматах текста отсканированного с бумажных носителей.
В полученных с помощью CuneiForm текстовых документах сохраняется структура документа и его форматирование.Также эта программа распознает таблицы различной степени сложности, различные шрифты, распечатки с принтеров, тексты пишущей машинки и т. п. Для повышения качества распознавания в программе используется проверка результата работы с помощью словарей, которые можно дополнять.
Другая достаточно качественная OCR-программа - gImageReader . Хотя вообще-то это не программа, а лишь пользовательский интерфейс для двигателя Tesseract , который нужно загрузить и установить до установки gImageReader. Двигатель Tesseract использует словари и средства проверки орфографии от OpenOffice, которые также нужно устанавливать отдельно.
Таким образом установка и настройка gImageReader превращается если не сложную, то во всяком случае на тягостную процедуру. Как для меня, это не позволяет рекомендовать ее широкому кругу пользователей. Но возможности программы достаточно широки и тот, кто пройдет все этапы установки получит хороший инструмент.
Онлайн-сервисы
NewOCR.com поддерживает конвертирование изображений из форматов JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu. Есть возможность распознавания текста, состоит из нескольких колонок; вращения, нормализации контраста и удаления теней с начального изображения загрузки результата в различных форматах, копирование ссылки на редактирование и перевод текста в сервисах Google.
Второй онлайн-сервис - i2OCR работает с форматами TIF, JPEG, PNG, BMP, GIF, PBM, PGM и PPM. Этот сервис не обладает столькими удобными инструментами, как предыдущий, но его результаты достаточно качественные, а интерфейс прост и удобен, так i2OCR может быть использован в качестве «резервного» средства.
PS
Я начал этот обзор с намерением найти способ перевести в электронный вид перефотографований многостраничный документ. К сожалению ни одна из бесплатных программ и онлайн-сервисов не смогли корректно обработать эти фото. В лучшем случае распознавался только маленький фрагмент текста на странице. Обработка «нелинейного» текста оказалась слишком сложной задачей.Конечно — в этом есть и моя вина (нужно было перефотографовуваты более аккуратно), но приходилось уже работать с тем что было.
После тщетных поисков бесплатного решения пришлось обращаться к коммерческому. А именно (это не реклама
— к онлайн-сервису FineReader Online. Конвертация 45 фотографий страниц документа в текст стоила мне $ 5. Не скажу, что все распозналось идеально, но подправить два-три предложения на страницу не так трудно, как перепечатывать все заново.
Также ознакомьтесь с похожими статьями:
- Сервисы для проверки уникальности текста Сервисы для проверки уникальности текста Внимание — плагиат! Плагиат — страшное...
- Chrome VS Firefox Chrome VS Firefox (опыт free soft ware) Несколько недель назад я...
- Cкачать софт. Программа для защиты системы PC Tools ThreatFire Cкачать софт. Программа для защиты системы PC Tools ThreatFire Программа PC...
- Как создать стартап бизнес в 16 лет Как создать стартап бизнес в 16 лет Для того, чтобы...
- Как читать статьи с Google Reader на Kindle Как читать статьи с Google Reader на Kindle Если ты...


Дайджест новых статей по интернет-маркетингу на ваш email
Новые статьи и публикации
- 2025-03-14 » SPF-запись
- 2025-03-07 » SEO на маркетплейсах: как оптимизировать карточку товара для поисковой выдачи
- 2025-02-18 » Топ-10 бесплатных нейросетей для генерации изображений: лучшие ии генераторы 2024 года
- 2025-02-11 » Критическая уязвимость в 1С-Битрикс
- 2025-02-11 » Google Search Console: руководство для начинающих вебмастеров
- 2025-02-11 » Методы измерения результативности рекламных кампаний: плюсы и минусы
- 2025-02-11 » Тренды SEO в 2025 году
- 2025-02-10 » Свой Google в локалке. Ищем иголку в стоге сена
- 2025-01-29 » SEO — это комплексная работа. Шесть главных факторов ранжирования сайтов
- 2025-01-29 » Гайд для главной страницы e-commerce сайта: как оформить, чтобы повысить конверсию
- 2025-01-20 » Krea AI выпустила бесплатную функцию преобразования изображений в 3D-объекты — их можно вращать и вписывать в фотографии
- 2025-01-19 » Отзывы на Яндекс Картах: как пройти модерацию
- 2025-01-15 » Топ-6 лучших российских нейросетей, в которых можно генерировать тексты и изображения бесплатно и без VPN
- 2025-01-14 » 15 бесплатных способов узнать, чем интересуется ваша аудитория
- 2025-01-11 » Бездепозитные бонусы в казино за регистрацию с выводом: особенности и возможности получения
- 2025-01-09 » Новая модель LAM способна выполнять задачи в Word
- 2024-12-26 » Универсальный промпт для нейросети: как выжать максимум из ChatGPT, YandexGPT, Gemini, Claude в 2025
- 2024-11-26 » Капитан грузового судна, или Как начать использовать Docker в своих проектах
- 2024-11-26 » Обеспечение безопасности ваших веб-приложений с помощью PHP OOP и PDO
- 2024-11-22 » Ошибки в Яндекс Вебмастере: как найти и исправить
- 2024-11-22 » Ошибки в Яндекс Вебмастере: как найти и исправить
- 2024-11-15 » Перенос сайта на WordPress с одного домена на другой
- 2024-11-08 » OSPanel 6: быстрый старт
- 2024-11-08 » Как установить PhpMyAdmin в Open Server Panel
- 2024-09-30 » Как быстро запустить Laravel на Windows
- 2024-09-25 » Next.js
- 2024-09-05 » OpenAI рассказал, как запретить ChatGPT использовать содержимое сайта для обучения
- 2024-08-28 » Чек-лист: как увеличить конверсию интернет-магазина на примере спортпита
- 2024-08-01 » WebSocket
- 2024-07-26 » Интеграция с Яндекс Еда
Все мы сидим в сточной канаве, но некоторые при этом смотрят на звезды Уайльд Оскар - (1854-1900) - английский писатель |
Мы создаем сайты, которые работают! Профессионально обслуживаем и продвигаем их , а также по всей России и ближнему зарубежью с 2006 года!
Как мы работаем
Заявка
Позвоните или оставьте заявку на сайте.
Консультация
Обсуждаем что именно Вам нужно и помогаем определить как это лучше сделать!
Договор
Заключаем договор на оказание услуг, в котором прописаны условия и обязанности обеих сторон.
Выполнение работ
Непосредственно оказание требующихся услуг и работ по вашему заданию.
Поддержка
Сдача выполненых работ, последующие корректировки и поддержка при необходимости.
Или напишите нам в WhatsApp
Или напишите нам в WhatsApp