ФинеРеадер Експрес 8,4: препознати текст из било ког извора на лету (дистрибуција код завршен)
Макрадар Од технологије / / December 19, 2019
Дигиталног садржаја, и електронске верзије докумената око нас са свих страна. Папир у нашим животима је готово нема места. Новине и часописи су се преселили у онлине формату књиге читамо о читача е-мастила или таблета, обични писма су замењени емаил и смс. Ипак, понекад морамо да потпомогну првих радова да им се електронску копију. Овде долазимо до помоћ посебних програма који користе ОЦР технологију да би ОЦР текста (Оптицал Цхарацтер Рецогнитион). Најпознатији од њих је несумњиво АББИИФинеРеадер. Можете га користити за претварање папирних докумената у уређивати формата, и сачувати ПДФ то претраживати тексту. И данас имамо велику прилику да науче нешто више о томе.
* * *
За Мацс, АББИИ нуди само ФинеРеадер Екпресс, ипак има потребну функционалност. Кључне карактеристике АББИИ ФинеРеадер Екпресс је тачност препознавања и задржавање распоред, подршку за више језика (171 језика до три језика у једној документ), трансформација и стварање ПДФ (ПДФ конверзију у уређивати формата), уредник за употребу обележавање подручја (текст, табела, слике) и једноставан, разумљив интерфејс Програм.
prvi поглед
Лингво Експрес ради прозор је прилично минималистички, постоје само најнужније ствари. Бочни панел садржи скице додаје странице и на иснтрументов панел тастера са падајућих листа за избор језика и излазну датотеку. Ипак постоји конверзија и дугме зум. У супротном, интерфејс одговара брзо Екпресс верзија, која се кладим на аутоматско обављање послова са минимум конфигурације и учешћа корисника.
Пролазе тестове
Након покретања Лингво нам испуњава компактан прозор са избором сценарија. Овде се од нас тражи да изаберете извор снимање: скенер, факс, или читати из датотеке. Такође је препоручљиво да наведете језик документ (или језика, уколико је више од једног) - то ће помоћи да се побољша прецизност препознавања оригиналног документа. Па, у ствари формат излазне датотеке, све је једноставно - изабрати на основу врсте документа на папиру.
Скенер при руци нисам имао, али то је још боље - користи као извор фотографије Маде уз помоћ иПхоне, сам закомпликовао задатак да призна текста. Као пример текста, узео сам једну од књига из његове супруге, као пример табеле - неке старе радничке филм пошиљку иПхоне. Па, да почнемо.
Свака страница са текстом
Због недостатка скенера сам урадио резервисање фотографије - фото нормалној собној светлости, без статива и друге твеакс. Хере ис тхе оригинал:
Да видимо шта може да уради са ФинеРеадер. Ми наводе да желимо да извуче текст фото, дефинише језик као руски, и започети процес.
Мора се признати да је пријава мора се рећи да је дефинисан цео текст, укључујући и случајно сам се савија у суседну страницу. Парче стола, који сам посебно оставио у оквиру, дефинише као очекиваног слици. Али то није страшно, јер смо ручно да промените домен, одредити њихов тип (ако програм није правилно постављен) и уклоните поље, од којих је признање је потребна. Све манипулације ми је мање од једног минута, али на крају сам добио овде је сасвим прихватљив резултат:
Након кратког лектура и измене документ је спреман. Мислим да је ово добар резултат за брзо, готово аутоматски процес признавања што је.
препознати сто
Као експериментални сто служи непретенциозан закон, који је такође снимљен на иПхоне. Већ постоји у употреби украјински (уз потврду подршке језика), који је такође добро за нашег искуства. Избор новог сценарио (⌘Н) Наведите извор - чита из датотеке, језик - украјински и датотеке излаз - табеле.
Програм мисли за неколико секунди, а овде имамо резултат:
Уз овај програм сто је тако добро не рукује, али је више или мање прихватљиво, у принципу, текст дефиниције, осим ако је разлог да се заврши ћелије које нису у оригиналном документу. Тамо ће морати да петљам мало дуже да се коначни облик карте документа, али то је лакше него куцање знак руком од нуле.
Сачувај у ПДФ
Приликом чувања у ПДФ, програм на жалост не побољшава оригиналну слику (контраст, осветљеност) и налази се у ПДФ-документ као што је. Али мање, Текст је присутна, и то је добро.
довести
Као и свака алат, Лингво има своје предности и мане. Најјаче, поред наведених карактеристика произвођача, јесте да ОЦР столови и радови прилично добро, и претворити у ПДФ, како је обећао, подржава тражење Текст. Мана је недостатак могућности и врло оскудних средстава за ручно контролисање процеса. Али ово је делимично оправдан, чињеница да је изричит верзија и то ради аутоматски.
Кодови за Лингво Екпресс програма вона Грегори Усхар и Николај Блинов. Честитамо! Провери приватне поруке, кодови послао.