Как перевести отсканированный файл в ворд. Как легко отредактировать отсканированные документы

Мы так делать не будем.:-)

Мы
напишем простой макрос для сканирования,
сделаем кнопку для него и, мало того,
еще и подпишем наш макрос цифровой подписью!

Даже те, кто не знает, что это такое, быстро все усвоят. Вперед!

1Пишем макрос.

  • Итак, открываем Word, заходим в " Файл- > Параметры -> Настройки ленты"
  • Включаем вкладку "Разработчик" в окне справа, поставив галку
  • Закрываем настройки ленты. В появившейся вкладке "Разработчик" жмем кнопку "Макросы" (слева вторая), откроется мастер добавления нового макроса
  • Внизу в окне " Макросы из: " выбираем макросы из Normal.dot (общего шаблона) для того чтобы и в других документах он был
  • Жмем "Создать" , откроется редактор VisualBasic
  • Заменяем этим кодом все строчки

Для Word 2010 код такой:


Sub InsertFromScanner()
On Error Resume Next
WordBasic.InsertImagerScan
End Sub

Для Word 2013,2016 код такой (для 64х см. комментарий в начале ):


" Scan for Word 2013
"

" ----------------------
" For 64-bit app need declare with
PtrSafe key:
" Private Declare PtrSafe Function GetTempPath Lib "kernel32"....

Private Declare Function GetTempPath Lib "kernel32" Alias "GetTempPathA" (ByVal nBufferLength As Long, ByVal lpBuffer As String) As Long

Private Function TempPath() As String
Const MaxPathLen = 256 " Max path length
Dim FolderName As String " Folder name
Dim ReturnVar As Long " Return Value
FolderName = String(MaxPathLen, 0)
ReturnVar = GetTempPath(MaxPathLen, FolderName)
If ReturnVar <> 0 Then
TempPath = Left(FolderName, InStr(FolderName, Chr(0)) - 1)
Else
TempPath = vbNullString
End If
End Function

Sub Scan()
"
" Scan Macro, to be invoked in Word
"
On Error Resume Next
Dim objCommonDialog As WIA.CommonDialog
Dim objImage As WIA.ImageFile
Dim strDateiname
" instantiate Scan WIA objects
Set objCommonDialog = New WIA.CommonDialog
Set objImage = objCommonDialog.ShowAcquireImage
strDateiname = TempPath & "Scan.jpg" " set temporary file
If Not objImage Is Nothing Then
Kill strDateiname
objImage.SaveFile strDateiname " save into temp file
Selection.InlineShapes.AddPicture strDateiname " insert in doc
Set objImage = Nothing
End If
Set objCommonDialog = Nothing
" MsgBox strDateiname " test output
End Sub

Что бы избежать ошибки при компиляции, нужно подключить библиотеку Microsoft WIA (в меню: Tools/Preferences), выделенная строка на рисунке ниже:


  • Заходим снова в настройки ленты, жмем кнопку "Создать вкладку" , и жмем кнопку "Создать группу". Можете переименовать их по своему выбору, у меня -"Разное".
  • В левой панели "Выбрать команды:" ищем "макросы" и добавляем наш созданный макрос в новую пользовательскую группу.

Все. Жмем ок . Теперь при открытии вкладки "Разное" у вас есть вот такая кнопка:


Теперь кнопка может работать. Но может и ругнуться, если у вас отключены макрос ы в политике безопасности. Откройте "Разработчик->Безопасность макрос ов" и можете включить макрос ы как на рис. (стрелка 3.)
Все, "Кнопка" работает!
Но так оставлять не рекомендуется!
А для тех кому немного важна безопасность, следующий пункт.

3. Сертифицируем для локального пользователя.
Но пойдем дальше и отключим "все макросы, кроме макросов с цифровой подписью"!
Приступим:
Опять открываем "Разработчик->Visual Basic" , в меню ищем "Tools->Digital signature.." , откроется окошко "Цифровая подпись" , как видите там пусто.


Нажав выбор, видим:

Это потому, что на компьютере нет пользовательских сертификатов для VBA проектов MS Office.
Надо бы сделать…
Запускаем "Средство создания цифровых сертификатов для проектов VBA" из пакета программ MS Office. Запускаем и создаем сертификат, я его назвал "Local VBA cert" .
(Примечание: если данное средство недоступно, воспользуйтесь программой
"C:\Program Files\Microsoft Office\Office15\SELFCERT.EXE " или
"C:\Program Files\Microsoft Office\root\Office16\SELFCERT.EXE")

В меню "Tools->Digital signature..", в окошке "Цифровая подпись" жмем кнопку "Выбрать".

Вуаля, найдется наш сертификат:


Казалось бы все, но нет! Жмем "подробности" в окне "Цифровая подпись" и убеждаемся, что доверия к сертификату пока нет:
Будем делать так, как подсказывает наша совесть - доверять. Жмем Win+R и запускаем оснастку управления сертификатами "certmgr.msc" .
Открываем "Личное->Сертификаты" , находим наш "Local VBA cert" и копируем его в два места:
"Доверенные корневые центры сертификации" и в "Доверенные издатели" .

Теперь закрываем оснастку управления сертификатами.
Откройте "Разработчик->Безопасность макросов".
Сертификат будет виден в надежных издателях.

Можете "отключить все макросы, кроме макросов с цифровой подписью" как на рис. в пункте 2 ., если конечно уже это не сделали. :-)
Перезапускаем Word.

Все готово!

PS: если меняете что-то в коде макроса, не забывайте обновить созданную кнопку.

С помощью программы FineReader можно легко преобразовать текст с бумажного носителя в файл формата Ворд и отредактировать его при необходимости.

Узнать все этапы проведения данной процедуры можно в представленной статье.

Большое количество пользователей, работающих с документами, нередко сталкиваются с необходимостью копирования текста с бумажного носителя в Word. В этом случае самым оптимальным выбором будет сканирование текста и его дальнейшее редактирование.

Сделать это возможно с помощью современной программы FineReader, она успешно преобразует обычную фотографию, полученную со скана, в осмысленный набор слов.

Работа с документом в FineReader

FineReader – наиболее актуальная программа автоматического распознавания отсканированного документа, она была создана российскими программистами. Ее главными достоинствами можно считать возможность поддерживания большого количества языков, среди которых имеются даже самые древние.

Помимо этого в этой программе допускается пакетная обработка многостраничного текста.

Ее преимуществами также можно назвать:


Пробную версию данной программы можно загрузить на официальном сайте, ее единственный недостаток заключается в том, что там установлено ограничение. Бесплатно можно обработать не более пятидесяти отсканированных страниц текста.

Полная версия программы стоит около пятидесяти долларов, на ней подобное ограничение отсутствует.

Загрузка и сканирование

Самым первым этапом работы в FineReader является загрузка и сканирование файла.

Для запуска процесса:


Фото: распознавание несложно оформленных документов


Данная программа автоматом выделит фрагменты документа, рисунки и таблицы, при необходимости повернет сканированный текст по нужному направлению. После завершения сканирования, в данной программе требуется выбрать язык для расшифровки написанного.


Выбрать его можно в выпадающем окне «Язык документа», если загруженный скан будет написан на нескольких иностранных языках – следует выбрать автоматический режим.

Удаление форматирования из документа

Сейчас мы более подробно разберем, как можно отредактировать отсканированный документ в программе FineReader. На представленном изображении таблицы, картинки и тексты будут отличаться разными цветами.

Данные области расшифровываются автоматически в зависимости от своего типа. В дальнейшем работать с ними в данной программе позволяет раздел под названием «Проверьте области», он располагается в правом окне FineReader.

Для удаления какой-либо области из документа необходимо выбрать в выпадающем меню кнопку «Удалить область», а затем можно будет щелкать мышкой по тем фрагментам, которые следует удалить.

Допускается уничтожение всех картинок и таблиц, можно оставить только лишь нужный для распознавания и дальнейшего сохранения текст.

Видео: Как изображение перевести в Microsoft Word

Редактирование

Чтобы выделить какую-либо область требуется выполнить следующие действия:

  1. кликнуть мышью по кнопке «Выделить область Текст»;
  2. нажатой левой кнопкой обвести границы текстового блока в рамку.

А чтобы выделить картинку или таблицу потребуется:

  • выбрать кнопку «Выделить область Картинка» или же «Выделить область Таблица»;
  • точно также обвести границы блока также левой кнопкой мыши.

Многих пользователей интересует, можно ли в программе FineReader поменять размеры выделенного фрагмента. Это вполне реально, необходимо лишь щелкнуть мышью по нужному фрагменту, навести курсор на его границу до возникновения специального курсива.

Именно на нее требуется нажать левой кнопкой мыши и, удерживая, менять размер, перемещая мышь в большую или меньшую сторону.

Конвертирование в формат Word

После того, как все области будут выделены и отредактированы так, как нужно, можно будет приступить к распознаванию написанного документа и его сохранению в формате Word. Для проведения подобной процедуры следует нажать кнопку «Конвертировать» в меню программы.

Пользователю нужно будет подождать некоторое количество времени, после чего он сможет просмотреть результаты проделанной работы. Для сохранения текста необходимо ввести имя файла, выбрать для него место и формат сохранения.

Для создания файла в формате Microsoft Word нужно выбрать в окне «Rich Text Format (*.rtf)».

Завершающее редактирование отсканированного документа в Ворде

Фото: вспомогательные функции программы

После проведенных манипуляций документ будет создан в формате Ворд, пользователь может открыть его и сравнить с оригиналом. Если будут выявлены какие-либо ошибки, их можно будет без труда отредактировать в обычном режиме программы.

Как правило, программа FineReader отлично распознает написанное на любом языке, но при плохом качестве исходника некоторые слова могут быть распознаны неверно.


Программа FineReader позволяет пользователям существенно экономить свое время при обработке текста, таблиц или картинок с бумажного носителя. Для того чтобы действительно оценить все преимущества работы с ней, можно скачать бесплатную пробную версию программы на пятнадцать дней на официальном сайте.

Как конвертировать отсканированный документ в формат Microsoft Word?

Вы когда-нибудь сталкивались с ситуацией, когда хотели изменить содержимое отсканированного файла и не могли сделать это? Теперь вы можете сделать это мгновенно, просто поменяв формат файла. В статье приведены шаги, как конвертировать отсканированный документ в Microsoft Word.

При сканировании документа или сканер предлагает вам список форматов, в которых вы можете сохранить файл. Однако, как правило, дальнейшее редактирование файла невозможно. Если же вам нужно изменить содержимое файла, то придется пройти через утомительный процесс перезаписывания или повторного сканирования документа. Сберечь время и усилия можно, просто изменив несколько настроек в компьютере. Так вы получите отсканированный документ в формате.doc, который затем сможете отредактировать.

Примечание: Для редактирования сначала нужно установить программу Microsoft Office Document Imaging .

Как это сделать?

Для пользователей ОС Windows 7 или Vista:

Пуск-Панель управления-Программы-Программы и компоненты

Для пользователей ОС Windows XP:

Пуск-Панель управления-Установка и удаление программ-Изменение или удаление программ
В появившемся списке программ найдите Microsoft Office и кликните по нему правой кнопкой мыши. Из открывшегося выпадающего меню выберите пункт Изменить

Вы будете перенаправлены на окно "Измените установку". Выберите пункт "Добавить или удалить компоненты " и нажмите кнопку Продолжить .

Выберите там опцию Средства Office и найдите в открывшемся списке Microsoft Office Document Imaging. Кликните правой кнопкой мыши, и в открывшемся списке выберите Запускать все с моего компьютера , и нажмите Продолжить (Обновить)

Теперь Microsoft Office Document Imaging установлена и готова к использованию.

Создание документа Word

Если у вас уже есть отсканированный документ, просто откройте его в Paint. Если же нет - в той же программе выберите в меню Файл-Со сканера или камеры и запустите процесс сканирования. Так как вы сканируете документ для текстового файла, в окне настроек сканера выберите опцию Черно-белый рисунок или текст . После того, как документ отсканирован, откройте его в Paint.

Выберите Пуск - Все программы - Microsoft Office - Средства Microsoft Office - Microsoft Office Document Imaging

В окне программы выберите в меню пункт Файл-Открыть , найдите в открывшемся диалоговом окне созданный нами ранее tiff-файл, и откройте его

Теперь нужно выделить текст, содержащийся в нем. Для этого нажмите комбинацию клавиш CTRL+A, а затем CTRL+C, чтобы скопировать текст в буфер обмена.

Создайте новый документ в Microsoft Word, и нажмите CTRL+V, чтобы вставить скопированный ранее текст. Затем через пункт Файл-Сохранить как сохраните файл с расширением.doc.

Таким образом, документ Word создан. Теперь только осталось внести в него изменения, если это необходимо.

Если Вы выбрали быстрый путь написания теоретической главы, о котором мы говорили в параграфе 2.1., вероятней всего Вам не обойтись без сканирования документов. В ином случае, этот пункт можете пропустить и начинать конспектировать материалы найденные в библиотеке .

Перед началом сканирования нужно определиться, что именно Вы хотите использовать при написании работы. А для этого нужно сначала просмотреть имеющуюся литературу и выделить карандашом нужные моменты.
Когда я впервые сканировал статью из журнала для своей первой курсовой, для меня это занятие было невообразимо сложным. В результате нескольких часов работы со сканером и FineReader’ом у меня на выходе вышла бредятина, не поддающаяся редактированию. В итоге пришлось все набирать руками. Чтобы у Вас не случилось подобного, рассмотрим подробнее все технические моменты сканирования.

Для сканирования вам понадобится:

  • Книга или журнал, который нужно отсканировать
  • Компьютер с установленным FineReader’ом
  • Качественный сканер

Сканер не обязательно покупать. Можно, например, взять на время у товарища. Я пользуюсь сканером CanoScan Lide 60. Это хоть и не самая новая модель, но мне очень нравится этот компактный, быстрый и удобный в работе “девайс”. Если Вы взяли на время сканер, для того чтобы он работал нужно сначала установить программу-драйвер. Драйвера и руководство по установке всегда можно найти на установочном диске, который прилагается к устройству или скачать на сайте у производителя. После установки драйвера, подключите сканер к компьютеру с помощью соединительного шнура. Теперь можно уже непосредственно приступить к сканированию.

Но сначала немного теории. Вы должны знать, что процесс сканирования состоит из двух этапов:

1. Непосредственно сканирование документа. На этом этапе сканнер как бы фотографирует поверхность сканируемого документа и сохраняет полученное изображение на компьютер в виде обычного файла.jpg .gif или в другом формате;

2. Распознавание документа. Это процесс преобразования текста из изображения сделанного сканером в обычный тест, который потом можно сохранить в Word и редактировать. Распознавание осуществляется без участия сканера, с помощью специальной программы (самая популярная Adobe FineReader). Таким образом, Вы можете сначала отсканировать несколько листов текста и сохранить их в виде изображения и только потом преобразовывать в текст.

Итак, начнем этап первый – сканирование :

Запускаем драйвер сканера:

Пуск – Все программы – Canon – ScanGear (название драйвера я указываю для своего сканера). Появится окно драйвера:

Открываем крышку сканера и кладем книгу. Книгу, журнал или что у вас там есть нужно класть текстом вниз, как можно ровнее по отношению к краям рабочей поверхности сканера:

Очень важно сделать так, чтобы крышка сканера как можно плотнее прижимала сканируемый документ, не допуская попадания внешнего освещения не рабочую поверхность сканера, которая соприкасается с документом.

Выполним необходимые установки в драйвере сканера.

Первым делом нужно установить разрешение, в котором будет отсканирован документ. Разрешение – это показатель, который определяет уровень детализации объекта при сканировании и определяется в точках на дюйм (dpi, или т/д). Чем больше разрешение, тем качественнее получается изображение. Но, при сканировании текстовых документов нет смысла устанавливать максимальное разрешение, поскольку толку от этого будет ноль. Кроме того, сканирование с большим разрешением занимает больше времени. Я рекомендую устанавливать разрешение в пределах 400-500 т/д (dpi). При такой настройке изображения получаются достаточно качественными для хорошего их распознания, а сам процесс сканирования не занимает много времени. Посмотрите скриншот установок моего сканера:

Для начала нужно перейти в “Расширенный режим”. Источником всегда будет “Планшет” (планшетный сканер). Цветной режим лучше установить “Черно-белый” , ведь для сканирования текста нам цвета не нужны, а это уменьшит размер изображений на выходе. Разрешение, как я уже сказал, следует установить 400 т/д . Выходной размер изображения – обязательно “А4” . Теперь можно смело жать на кнопку “Сканировать” . Мой сканер устроен таким образом, что сначала запоминает отсканированные изображения во внутренней памяти, и только при закрытии окна драйвера предлагает сохранить их на компьютер. Мне остается только указать место, куда будут сохранены результаты работы.

У вас должны получаться файлы такого типа:

При увеличении такого изображения должен быть отчетливо виден текст.

Распознавание

Второй этап распознание полученных изображений и их преобразование в текст. Как я уже говорил, для этого понадобится специальная программа – FineReader . Скачайте программу по этой ссылке (72Мб) . Чтобы скачать нажмите на стрелочку в правом верхнем углу окна. Распакуйте архив и в папке afr_lrp найдите файл – ABBYY FineReader 12.0.101.exe . Двойной клик на этом файле запустит установку программы на вашем компьютере. Эта версия программы достаточно новая. Все скриншоты ниже я делал используя более старую версию, поэтому интерфейс программы будет немного отличаться от скриншотов. Учтите это при изучении данной инструкции.

Окно FineReader имеет следующий вид:

После установки языка, на котором напечатаны отсканированные Вами ранее документы, можно начинать распознание. Если в тексте присутствует сразу два языка (например, русский и английский) установку сделайте соответственно.

Чтобы начать распознание нажмите на стрелку справа от первой кнопки Сканировать – а затем – Открыть изображение:

Откроется окно выбора изображений. Откройте папку в которую Вы сохранили отсканированные изображения, нажмите CTRL + A (английское) на клавиатуре и нажмите на кнопку Открыть .

После этого слева в окне FineReader’а появятся эскизы добавленных файлов, по центру – на данный момент выделенный эскиз в увеличенном виде, снизу – еще большее увеличение, а справа результат распознания:

Для примера я взял всего два изображения. На скриншоте выше выделено первое из них, его сейчас и распознаем. Как видите, изображение отсканировано вертикально, чтобы распознать текст снимок нужно сначала развернуть на 90 градусов. Для этого воспользуемся кнопками и . Следующим шагом нужно указать программе, какую именно часть изображения нужно распознать, а также задать тип данных, которые должны получиться на выходе текст, таблица или изображение. Для этого существуют кнопки, соответственно: . Например, если нужно отметить текстовый блок, нажимаем левой кнопкой на , после этого нажимаем левой кнопкой мышки в левом верхнем углу текстового блока и, удерживая левую кнопку, перетягиваем в правый нижний угол. Для примера я полностью подготовил к распознанию одно изображение:

Как видите, все текстовые блоки в примере выше выделены зеленым, а рисунки – красным. Таблицы подготавливаются к распознанию аналогично. Для этого предназначена кнопка . Для того, чтобы перейти к следующему снимку, кликните левой кнопкой мыши на его эскизе слева. Таким образом подготавливаются к распознанию все полученные в результате сканирования изображения. После того, как подготовка изображений завершена, следует выделить их все. Для этого кликните левой кнопкой в пустом месте на панели эскизов (она называется Пакет ) и нажмите Ctrl+A (английское) на клавиатуре. Далее кликните на кнопку и подождите пока FineReader преобразует изображения в текст. После этого можно сохранять полученный текст в Word с помощью кнопки , после нажатия на которую откроется окно Мастер сохранения результатов . В нем необходимо выбрать формат для сохранения – Microsoft Word, а также поставить отметку чтобы сохранились все страницы.

1. Выберите один PDF файл или файл изображения для распознавания.
2. Нажмите кнопку Распознать .




7. Пользуйтесь на здоровье

1. Выберите один ZIP файл содержащий изображения для распознавания. Только 20 файлов могут быть распознаны одновременно.
2. Нажмите кнопку Распознать .
3. Файл отсылается на наш сервер и распознавание начинается немедленно.
4. Скорость распознавания зависит от размера файла, скорости Вашего интернет соединения и доступных ресурсов на наших серверах.
5. Когда распознавание закончено, файл возвращается в то же самое окно браузера (не закрывайте Ваш браузер).
6. В случае невозможности распознавания, причина будет указана красным цветом.
7. Пользуйтесь на здоровье

Выберите PDF или файл изображение для распознавания Поддерживаются только PDF/JPG/JPEG/PNG/BMP/GIF/TIF/TIFF файлы

Русский English German French Spanish Italian Belgium Arabic Chinese Simplified Chinese Traditional Hindi Indonesian Tamil Telugu Portuguese Malaysian Ukranian

Идет распознавание


Это может занять несколько минут

На данной странице возможно распознавание только PDF JPG JPEG PNG BMP GIF TIF .

  • Для конвертирования MS Word (DOC DOCX) в PDF воспользуйтесь ссылкой Word в PDF .
  • Для конвертирования RTF ODT MHT HTM HTML TXT FB2 DOT DOTX XLS XLSX XLSB ODS XLT XLTX PPT PPTX PPS PPSX ODP POT POTX в PDF воспользуйтесь ссылкой Другие документы в PDF .
  • Для конвертирования JPG JPEG PNG BMP GIF TIF TIFF в PDF воспользуйтесь ссылкой Изображение в PDF .
  • Для извлечения текста из PDF документа воспользуйтесь ссылкой PDF в TXT .
  • Для конвертирования DOC DOCX RTF ODT MHT HTM HTML TXT FB2 DOT DOTX в DOC DOCX DOT ODT RTF TXT или XLS XLSX XLSB XLT XLTX ODS в XLS XLSX или PPT PPTX PPS PPSX ODP POT POTX в PPT PPTX PPS PPSX JPG TIF PNG GIF BMP воспользуйтесь ссылкой Другие форматы .
  • Для конвертирования DOC DOCX DOT DOTX RTF ODT MHT HTM HTML TXT в FB2 воспользуйтесь ссылкой Документы в FB2 .
  • Для конвертирования JPG JPEG JFIF PNG BMP GIF TIF ICO в другие форматы, воспользуйтесь ссылкой Конвертировать изображение .
  • Для конвертирования PDF в MS Word (DOC, DOCX), воспользуйтесь ссылкой Конвертировать PDF в Word .
  • Для конвертирования PDF в JPG, воспользуйтесь ссылкой Конвертировать PDF в JPG .
  • Для конвертирования DJVU в PDF, воспользуйтесь ссылкой Конвертировать DJVU в PDF .

Выберите ZIP архив для распознавания Поддерживаются только ZIP файлы

Русский English German French Spanish Italian Belgium Arabic Chinese Simplified Chinese Traditional Hindi Indonesian Portuguese Malaysian Ukranian



В продолжение темы:
Android

Популярная социальная сеть ВКонтакте позволяет находить новых друзей и держать контакт со всеми близкими. Помимо этого, каждый пользователь может делиться собственными...