Як розпізнати сканований текст

Як розпізнати сканований текст

При роботі з документами нерідко необхідно перевести до надрукованого аркуша у формат документа MS Word для подальшого редагування та підвищення зручності використання. Для цього після сканування тексту необхідно його розпізнати. Існує безліч програм для розпізнавання. Для того, щоб досягти максимального результату, недостатньо просто запустити документ на розпізнавання і зберегти файл, який вийшов на виході.

Інструкція

1. У першу чергу, подбайте про те, щоб відсканований варіант документа був максимальною чіткості, без зайвих помарок, розмитостей і засвічених ділянок тексту. У разі необхідності відскануйте текст ще раз.

2. Запустіть програму розпізнавання тексту. Програмою, що забезпечує найкращі результати в цій області, є ABBYY FceReader. Скачайте і встановіть останню версію цього розпізнавача, після чого запустіть її.

відсканованіаркуші3. За допомогою меню "Файл" додайте до списку розпізнавання. Для полегшення роботи бажано не розпізнавати їх по одному, а запустити відразу все. Майте на увазі, що програми розпізнавання можуть розпізнавати одночасно до десяти тисяч сторінок і не більше. Дочекайтеся завершення аналізу та розпізнавання тексту.

4. Після завантаження ваших файлів виставте мову розпізнавання. Відразу після цього переходьте до виділення областей для розпізнавання. Для цього видаліть всі області, автоматично виділені програмою, і виділіть їх вручну. Присвоюйте полю властивість "текст" або "картинка", залежно від того, чим вона є.

5. Запустіть процес розпізнавання. Після закінчення виберіть формат, в якому ви будете зберігати і вид форматування, яке хочете дотримуватися при збереженні.