Бывают ситуации, когда нужная информация хранится на бумажном носителе или в файле PDF, а вам нужно срочно перевести её в электронный документ. Если текст небольшой, его можно быстро перепечатать. Но что делать с большими документами? Как распознать текст с картинки, чтобы не тратить время на ручной перенос информации?
Google Drive
Есть у вас есть аккаунт Google (почта Gmail), то воспользуйтесь для распознавания текста возможностями сервиса Google Документы.
- Откройте Google Диск.
- Нажмите «Мой диск» и выберите «Загрузить файлы».
- Выберите картинку (PDF-файл), который нужно распознать.
После загрузки файла кликните по нему правой кнопкой и выберите открытие через Google Документы. Появится окно, в котором будет ваша картинка.Под ней – распознанный текст, который вы можете спокойно скопировать в Word.
Важно: проверьте текст на соответствие оригиналу. Если на снимке были какие-то дефекты, то распознавание может пройти с ошибками.
Однако у этого способа есть ряд ограничений:
- Размер файла не должен превышать 2 Мб.
- Поддерживаются только форматы JPG, GIF, PNG и PDF.
- В PDF распознается не более 10 страниц.
- Текст должен быть расположен ровно. Если есть какое-то смещение, то необходимо предварительно его устранить через графический редактор.
Если вы сделаете четкий снимок без размытостей и с равномерным освещением, то Google Документы без проблем распознает текст. Технология поддерживает письмо справа налево, слева направо и вертикальное (японский и китайский языки).
Онлайн-сервисы
Если аккаунта Google нет, или вам не понравилось качество распознавания текста, то попробуйте использовать специальные онлайн-сервисы. Сайтов-конвертеров, предоставляющих подобный функционал, достаточно много, поэтому остановимся на самых известных площадках.
FineReader Online
Признанный лидер рынка, отлично распознающий текст из файлов разного формата. Единственный минус – сервис этот платный. Бесплатно в месяц можно распознать не более 5 страниц. Если вы постоянно нуждаетесь в переводе из JPG в Word – покупайте пакет страниц.
Для разового же распознавания сервис подходит идеально. Поэтому если нужно перевести в Word меньше 5 страниц, воспользуйтесь приведенной ниже инструкцией:
- Перейдите на сайт https://finereaderonline.com/ru-ru. Создайте учетную запись (простая регистрация – e-mail и пароль).
- Нажмите кнопку «Распознать».
- Загрузите файл.
- Выберите язык (можно выбрать одновременно 3 языка).
- Укажите формат сохраняемого документа.
- Нажмите «Распознать».
После завершения конвертации откроется страница с распознанным текстом. Чтобы сохранить документ, просто нажмите на него.
OCR Convert
Если вы не хотите регистрироваться и вам не хватает тех возможностей, что бесплатно предоставляет сервис FineReader Online, то попробуйте альтернативные варианты. Например, используйте OCR Convert:
- Загрузите файл.
- Выберите язык.
- Укажите, что вы не робот.
- Нажмите «Process».
Из недостатков сервиса можно выделить ограниченный выбор форматов на выходе – текст переводится только в TXT. Еще один минус – слабое, по сравнению с FineReader, распознавание.
Некоторые буквы перепутаны, иногда внутри слов встречаются цифры. Поэтому обязательно перечитывайте текст после конвертации.
Есть и некоторые ограничения: в частности, размер исходника не должен превышать 5 Мб, работает сервис с форматами PDF, GIF, BMP и JPEG. Зато OCR Convert поддерживает низкое разрешение изображения, так что даже если снимок не очень хорошего качества, с него можно попытаться «снять» текст.
Схожим образом работает сервис Free Online OCR. Но, в отличие от OCR Convert, здесь чуть больше возможностей для конвертирования – готовый документ можно получить в трех форматах (DOCX, TXT, XLCX).
Ограничение на вес стандартное – 5 Мб. Без регистрации в час можно распознать 15 изображений. Если заведете учетную запись, ограничение снимается.
i2OCR
Еще один удобный сервис, поддерживающий более 60 языков и все основные форматы изображений. Главное отличие от предыдущих конвертеров – наличие возможности загрузить снимок из URL.
Порядок работы тот же: указываете язык, выбираете файл, вводите капчу и нажимаете «Extract Text».
Полученный текст можно загрузить на компьютер, перевести или редактировать в Google Документах.
Есть и другие подобные сервисы – Newocr, Free-OCR и другие OCR, позволяющие распознать текст с изображений. Однако нужно понимать, что машинный алгоритм не является безошибочным. Поэтому внимательно вычитывайте тексты после конвертации, чтобы не попасть в неловкую ситуацию.