lapolvasó

Általában minden ami máshova nem fér

lapolvasó

HozzászólásSzerző: apu » 2017. május 29., hétfő 12:03

Új fiú vagyok, ezért lehet, hogy butaságot kérdezek, elnézést. Egy LibreOffice 5.3.3.2 (x64) -t használnék.
A kérdésem, ill. problémám, hogy OCR-t (lap beolvasása, szerkeszthetősége) szeretnék használni.
Az MS office-ban van egy modul, amely a scaner programját meghívja beolvasáskor és ez végzi
a scaner kezelését, majd a beolvasott adatot átadja az Office-nak.
Itt is megtaláltam a lehetőséget, de a lapolvasó kiválasztás menüpont nem csinál semmit, a help
pedig azt írja, hogy az eszköz programját kell telepíteni (megtörtént, mert egy multifunkcionális
eszközről van szó, amelyet nyomtatásra is használok), de ilyen program nincs, ill. van a scaner
program, amit az MS Office is használ beolvasásnál.
Azt szeretném tudni, hogy mit rontottam el, ill. mit kell még tennem, hogy összejöjjön az OCR
funkció. (Azt, hogy a MS Office mit csinál és hogyan viselkedik, onnan tudom, hogy egy másik
gépre az van telepítve és azt használjuk).
Várom a segítsége!

Üdvözlettel
Libre Office 5.3.3.2 (x64) WINDOWS 7 X64
apu
 
Hozzászólások: 5
Csatlakozott: 2017. május 29., hétfő 11:30

Re: lapolvasó

HozzászólásSzerző: Zizi64 » 2017. május 29., hétfő 13:21

Szkennelést, karakterfelismertetést ne az Apache Openoffice vagy a Libreoffice programmal végeztess el. Főleg ne az utóbbit. A szkennelés (a szkennelt dokumentum KÉPKÉNT való beillesztése egy ODF dokumentumba) még csak-csak sikerülhet, ha a szkenner TWAIN drájverrel is rendelkezik/működik. Az újabbak - tudtommal - már más drájvert használnak.

Volt már itt a fórumon olyan téma, ahol valaki a Wordbe beolvasott és felismertetett szöveget akarta egységessé szerkeszteni. Sajnos a Word a lap állásától függően olyan sokféle margóértéket, és bekezdés behúzásértéket határozott meg, hogy a .doc/.odt konverzió során több ezer különböző stílus jött létre, és ez lehetetlenné tette a normális munkát a dokumentummal.
Talán ez volt az a téma, de mindenesetre ez is hasonló:
https://forum.openoffice.org/hu/forum/v ... =16&t=1425

És az angol fórumon itt beszélnek a TWAIN drájver szükségességéről:
https://forum.openoffice.org/en/forum/v ... 4&p=406701

Emiatt javaslom, hogy minden idegen formátumból származó szöveges tartalmat FORMÁZATLAN SZÖVEG-ként emelj át az ODF dokumentumodba.
Soha ne idegen fájlformátumban dolgozz! Mindig a natív, nemzetközi szabványon alapuló ODF formátumokat használd a dokumentumaid tárolására, és szerkesztésére. Ha nagyon szükséges, a szerkesztés VÉGÉN exportálhatsz egy másolatot az elérhető idegen formátumokba.
Sok sikert!
Kovács Tibor (Win7x64Prof; W10x64prof; XPprofSP3: LO4.4.7; és a Hordozható AOO4.1.3, LO3.3.1-LO5.3.3)
Ha megoldódott a probléma, jelöld a témaindító hozzászólásod címe elejének szerkesztésével - tedd hozzá: [Megoldva].
Avatar
Zizi64
Globális moderátorok
 
Hozzászólások: 2941
Csatlakozott: 2008. november 12., szerda 21:22
Tartózkodási hely: Budapest

Re: lapolvasó

HozzászólásSzerző: apu » 2017. május 29., hétfő 14:22

Köszönöm a tanácsot, de ezzel a problémám nem oldódik meg, mármint nyomtatott lap szövegét szerkeszteni (a forrás valahol a világban). Ez MS Office-val működik minden átszerkesztési probléma nélkül, csak a MS Office Document Imaging modult kell használni, amely az OCR átalakítást is megcsinálja a kép file beolvasásának levezénylésével együtt és a használható szöveget átadja a Word-nek. Az írásod végét is meglehet valósítani, csak a Imaging-ből formázatlan szövegként kell kimenteni az OCR-rel előállított, szerkeszthető adathalmazt. Sajnos, ahogy írtam a LibreOffice-t használó gépen ezek szerint még mindig nem tudom megoldani a feladatot. Jó lett volna egy rakás pénzt megspórolni azzal, hogy nem veszek egy legális MS Office-t, használom a Libre-t. Köszi a segítséget és még várok további véleményt is, hátha összejön valami.
Libre Office 5.3.3.2 (x64) WINDOWS 7 X64
apu
 
Hozzászólások: 5
Csatlakozott: 2017. május 29., hétfő 11:30

Re: lapolvasó

HozzászólásSzerző: apu » 2017. május 29., hétfő 14:29

Bocsánat, az előbb még elfelejtettem írni, hogy a scaner használhatatlansága a többi modulban (Draw, Calc) is probléma. Képet sem lehet beolvasni, vagy táblázatot adatokkal együtt. Ezért is jó lenne valami scaner használati megoldást találni.

Üdvözlettel
Libre Office 5.3.3.2 (x64) WINDOWS 7 X64
apu
 
Hozzászólások: 5
Csatlakozott: 2017. május 29., hétfő 11:30

Re: lapolvasó

HozzászólásSzerző: Zizi64 » 2017. május 29., hétfő 14:51

a scaner használhatatlansága a többi modulban (Draw, Calc) is probléma. Képet sem lehet beolvasni, vagy táblázatot adatokkal együtt. Ezért is jó lenne valami scanner használati megoldást találni.

Erre írtam a TWAIN drájveres megjegyzést. Telepíts TWAIN drájvert a szkenneredhez / multifunkciós printeredhez. Az újabb Windows-os szkenner drájver neve "VIA". A VIA driverrel nem működik a LibreOffice a fórumbejegyzések tanúsága szerint.

Ráadásul a hálózati (NET-csatlakozóval használt) multifunkciós nyomtató/szkenner esetében egy rakás beállítani való van (magán az eszközön, vagy a drájverében), hogy távoli szkennerként is működjön. (Hiszen azt inkább úgy használod általában, hogy odaállsz elé, beteszed a lapot/lapokat, és a billentyűzetéről a szkennelt képet/dokumentumot elirányítod a hálózaton a saját számítógépedre. És nem úgy csinálod, mint a régi, az asztalodra telepített USB eszköz esetében, amikor a PC-dről vezérelted az egész szkennelést a felbontás, kimeneti típus megadásával együtt.)

Én ugyan azt is butaságnak tartom, hogy optimalizálás nélkül képet emeljek be egy dokumentumba... Soha nem csinálok ilyet. Erre egy harmadik féltől származó szoftvert szoktam (célszerű) használni. Az IrfanView nevű szoftverrel például optimálisra be tudod állítani a képek színmélységét, a fájlformátumot (png, vagy jpg), a DPI értéket és az abszolút méreteket. Teljesen fölösleges a LibreOffice-t és a géped memóriáját, processzorát több (több tíz) MiB-bájtméretű képekkel terhelni. A kész megoldások kényelmesnek látszanak, de rengeteg galibát tudnak okozni. Elveszted ugyanis a kontrollt a munkafolyamat fölött. A fórumokon megjelenő jelentős mennyiségű probléma amiatt merült fel, hogy a beszúrt, másolással, vagy vonszolással beemelt képeket sűrítetlen fájlformátumban, 10 MiB feletti méretben tucatjával próbálják meg belegyömöszölni a dokumentumba.
Sok sikert!
Kovács Tibor (Win7x64Prof; W10x64prof; XPprofSP3: LO4.4.7; és a Hordozható AOO4.1.3, LO3.3.1-LO5.3.3)
Ha megoldódott a probléma, jelöld a témaindító hozzászólásod címe elejének szerkesztésével - tedd hozzá: [Megoldva].
Avatar
Zizi64
Globális moderátorok
 
Hozzászólások: 2941
Csatlakozott: 2008. november 12., szerda 21:22
Tartózkodási hely: Budapest

Re: lapolvasó

HozzászólásSzerző: Zizi64 » 2017. május 31., szerda 7:20

a scaner használhatatlansága a többi modulban (Draw, Calc) is probléma. Képet sem lehet beolvasni, vagy táblázatot adatokkal együtt. Ezért is jó lenne valami scanner használati megoldást találni.


Miután nem tartom megfelelő megoldásnak, sose próbáltam meg közvetlenül beolvasni az AOO/LO programba a szkenneremről. Most a kedvedért kipróbáltam.

Brother gyártmányú multifunkciós hálózati eszközről VIA(!) drájverrel a Draw programba gond nélkül beolvastam egy képet. (Ugyanez a munkahelyemen más gyártmányú eszközzel nem sikerült: "a printer nincs távoli üzemmódra állítva", vagy valami hasonló hibaüzenettel megállt a folyamat)
LibreOffice 4.4.7-tel, LibreOffice Portable 5.3.3-mal, illetve AOO 4.1.3 Portable verziókkal próbáltam, mindegyikkel működött otthon, az eszköz alapbeállításaival.
Szkenner_VIA.png


Ilyenkor természetesen (vagy inkább: igen nagy valószínűséggel) a szkenner/printer saját szoftveres lehetőségeit használja az AOO/LO, és nem a saját szoftver-ágait. Ez azért is logikus, mert a printer/szkenner gyártók a legkülönfélébb módon vezérlik a saját eszközeiket, tehát nekik kell egy viszonylag egységes csatolófelületet biztosítaniuk. Viszont továbbra sem tudom ezen a módon MEGFELELŐEN optimalizálni a beemelt képeket, ami később - főleg sok kép esetén - jelentős problémákat okozna - ha ezt az utat használnám.

A LO Calc applikációban a szkennelési lehetőség eleve ki van szürkítve a menüben, (az AOO 4.1.3 Calc-ban meg se jelenik), tehát ott - a fejlesztők akarata szerint - nem is kell működnie. Emeld át a képet a Draw-ból - vagy még jobb, ha a szabályos módon, fájlból (optimalizált kép fájlból) töltöd be a képeket.
Sok sikert!
Kovács Tibor (Win7x64Prof; W10x64prof; XPprofSP3: LO4.4.7; és a Hordozható AOO4.1.3, LO3.3.1-LO5.3.3)
Ha megoldódott a probléma, jelöld a témaindító hozzászólásod címe elejének szerkesztésével - tedd hozzá: [Megoldva].
Avatar
Zizi64
Globális moderátorok
 
Hozzászólások: 2941
Csatlakozott: 2008. november 12., szerda 21:22
Tartózkodási hely: Budapest

Re: lapolvasó

HozzászólásSzerző: Zizi64 » 2017. május 31., szerda 7:33

Léteznek ingyenes, sőt nyílt forrású OCR szoftverek:

https://pdf.iskysoft.com/ocr-pdf/open-source-ocr.html
http://www.makeuseof.com/tag/top-5-free ... o-text-nb/

De semmiképpen NEM JAVASLOM az olyan funkciók használatát, amelyek megpróbálnak bármiféle automatikusan "felismert" formázási paramétereket belevinni a kimeneti fájlba. Csakis formázatlan szövegként vidd be a LO/AOO Writerben a felismert szövegeket. Eleve célszerű ilyen formázásokat nem tartalmazó (pl: .txt) kimeneti fájlformátumot használni az OCR szoftverben.
Sok sikert!
Kovács Tibor (Win7x64Prof; W10x64prof; XPprofSP3: LO4.4.7; és a Hordozható AOO4.1.3, LO3.3.1-LO5.3.3)
Ha megoldódott a probléma, jelöld a témaindító hozzászólásod címe elejének szerkesztésével - tedd hozzá: [Megoldva].
Avatar
Zizi64
Globális moderátorok
 
Hozzászólások: 2941
Csatlakozott: 2008. november 12., szerda 21:22
Tartózkodási hely: Budapest

Re: lapolvasó

HozzászólásSzerző: apu » 2017. június 3., szombat 17:13

Köszönöm, hogy ennyit foglalkoztál a problémámmal, de én nem vagyok software-s, így sok minden ismeretlen számomra a leírtakból. Annyit már próbáltam, hogy körbe néztem a nyomtató gyártónál, hogy mi van még a nyomtatóhoz, de nem találtam semmit újat, amit adtak a nyomtatóval és fellehető az interneten, az fel van telepítve. Ez egy Epson SX600FW, nem mai gyerek, de nagyon jól működik MS Office-val mind a három interface-n (USB, Hálózat, párhuzamos interface) keresztül.
Az az érzésem, hogy feladom a Libre-val való kísérletezést. Ha sűrűn lesz szüksége az OCR-re, akkor kénytelen leszek még egy MS Office-t venni.
Libre Office 5.3.3.2 (x64) WINDOWS 7 X64
apu
 
Hozzászólások: 5
Csatlakozott: 2017. május 29., hétfő 11:30

Re: lapolvasó

HozzászólásSzerző: Zizi64 » 2017. június 3., szombat 18:07

de én nem vagyok software-s


Én sem. Egyszerűen: számítógép használó vagyok - igaz, műszaki vénával megáldva...


De azért VALAMILYEN módon (de nem az MS Office-szal) képes vagy beszkennelni a képeket? Mert akkor "meg vagy mentve": szkenneld be a képet, optimalizáld valamilyen képszerkesztő szoftverrel, hogy ne legyen fölöslegesen nagy bájt-mérete a képnek, aztán a normál módon emeld be a dokumentumodba.
Sok sikert!
Kovács Tibor (Win7x64Prof; W10x64prof; XPprofSP3: LO4.4.7; és a Hordozható AOO4.1.3, LO3.3.1-LO5.3.3)
Ha megoldódott a probléma, jelöld a témaindító hozzászólásod címe elejének szerkesztésével - tedd hozzá: [Megoldva].
Avatar
Zizi64
Globális moderátorok
 
Hozzászólások: 2941
Csatlakozott: 2008. november 12., szerda 21:22
Tartózkodási hely: Budapest

Re: lapolvasó

HozzászólásSzerző: apu » 2017. június 4., vasárnap 12:08

Igen, az EP scaner programjával, de így csak képként lesz benne, nem szerkeszthető a szöveg, ami szükséges lenne. Van még egy másik megoldás is: mivel a képet PDF formában is be lehet olvasni, egy free PDF-valamire konverter programmal lehet kísérletezni (még nem próbáltam), de ez is idő, ami gyakran nincs. Még egyszer kösz a segítséget.
Libre Office 5.3.3.2 (x64) WINDOWS 7 X64
apu
 
Hozzászólások: 5
Csatlakozott: 2017. május 29., hétfő 11:30

Re: lapolvasó

HozzászólásSzerző: Zizi64 » 2017. június 4., vasárnap 12:22

Igen, az EP scaner programjával, de így csak képként lesz benne, nem szerkeszthető a szöveg, ami szükséges lenne.


Utóbbi esetben a Draw programba történő szkennelési problémádra reagáltam. Oda - gondolom - nem szövegként akarod beemelni a szkennelés eredményét...
Sok sikert!
Kovács Tibor (Win7x64Prof; W10x64prof; XPprofSP3: LO4.4.7; és a Hordozható AOO4.1.3, LO3.3.1-LO5.3.3)
Ha megoldódott a probléma, jelöld a témaindító hozzászólásod címe elejének szerkesztésével - tedd hozzá: [Megoldva].
Avatar
Zizi64
Globális moderátorok
 
Hozzászólások: 2941
Csatlakozott: 2008. november 12., szerda 21:22
Tartózkodási hely: Budapest

Re: lapolvasó

HozzászólásSzerző: mkenczler » 2017. június 6., kedd 13:10

A témához:
-- az OCR ugye karakterhalmazt állít elő, nem bármilyen helyzetben célszerű karaktereket beilleszteni
-- a legjobb OCR 99,5%-os hibával dolgozik, ez 15 elütés egy 3000 karakteres (A4-es) oldalon
-- a fenti miatt az OCR-rel keletkezett szöveget minden egyes esetben ALAPOSAN ÁT KELL OLVASNI
-- az OCR nem szokásos (melléütéses) hibákat csinál, hanem teljesen butákat, pl. egy felkiáltójelből "tj" lesz -- vagy fordítva
Összegezve: az OCR mindenképpen külön munkamenet legyen a folyamatban.

((félig offtopic))
Mostanában fedeztem föl, hogy a Writerbe beillesztett képek jobbgombos menüjében van egy "Tömörítés" tétel.
tomor.jpg

Ez azt csinálja, hogy a beillesztett képet átalakítja akkorára, amekkora a beillesztési méret, és az átalakításhoz megadhatjuk a felbontást. A legtöbb esetben ez drámai méretcsökkenést eredményez, és nem kell külső programmal optimalizálni a képet beillesztés előtt.
Képernyős fogyasztásra szánt dokumentumnál a felbontás 100, nyomtatásra szánt dokumentumnál pedig 300 DPI. Én 254 DPI-t szoktam használni, mert így a kép pixeles és cm-es mérete azonos számjegyeket tartalmaz (egy 6x5,2 cm-es kép 600x520 pixel lesz -- mert a 254 DPI az pont 100 pixel/cm...)
LibreOffice 5.3.3_x64 Windows 7-en és Windows 10-en (továbbá 5.2.6 és 3.4.6 Portable)
mkenczler
Önkéntesek
 
Hozzászólások: 58
Csatlakozott: 2009. augusztus 27., csütörtök 11:11

Re: lapolvasó

HozzászólásSzerző: Zizi64 » 2017. június 6., kedd 14:37

Mostanában fedeztem föl, hogy a Writerbe beillesztett képek jobbgombos menüjében van egy "Tömörítés" tétel.

Ez azt csinálja, hogy a beillesztett képet átalakítja akkorára, amekkora a beillesztési méret, és az átalakításhoz megadhatjuk a felbontást. A legtöbb esetben ez drámai méretcsökkenést eredményez, és nem kell külső programmal optimalizálni a képet beillesztés előtt.


No, ezt kipróbálom, számomra is nagyon hasznos lehet...
Sok sikert!
Kovács Tibor (Win7x64Prof; W10x64prof; XPprofSP3: LO4.4.7; és a Hordozható AOO4.1.3, LO3.3.1-LO5.3.3)
Ha megoldódott a probléma, jelöld a témaindító hozzászólásod címe elejének szerkesztésével - tedd hozzá: [Megoldva].
Avatar
Zizi64
Globális moderátorok
 
Hozzászólások: 2941
Csatlakozott: 2008. november 12., szerda 21:22
Tartózkodási hely: Budapest


Vissza: Általános kérdések

Ki van itt

Jelenlévő fórumozók: nincs regisztrált felhasználó valamint 1 vendég

cron