Onko olemassa (mieluummin ilmaista) ohjelmaa, joka .jpg skannaukset .pdf muotoon, ocr tekstintunnistusksen kanssa?
Oli on valtava määrä skannattuja dokumentteja .jpg formaatissa ja tarkoitus muuntaa ne pdf formaattiin, jotta tekstihaku toimisi.
Eli jos hakisi sähkölasku, niin kone pystyisi löytämään kaikki sähkölaskukuitit. Kuvien kanssa tämä ei tietenkään toimi. Ja käsiin käydä läpi 2000+ kuvaa ei ole vaihtoehto.
Nyt on käytössä skannausohjelma, joka automaattisesti tekee .pdf+ocr tiedostot, mutta ennen ei minulla sellaista ollut, joten vanha kirjanpito on jpg formaatissa.
Jpg > Pdf + Ocr
Kuvankäsittely, taitto ja typografia
9 viestiä
• Sivu 1/1
-
- Viestit: 140
- Liittynyt: 14.7.2012 klo 17.19
Jpg > Pdf + Ocr
Viesti Kirjoittaja freeway »
-
- Viestit: 1114
- Liittynyt: 5.9.2006 klo 8.57
- Paikkakunta: Vantaa
Re: Jpg > Pdf + Ocr
Viesti Kirjoittaja jrp »
Nopealla Googlauksella löytyi tällainen ja toimii myös yhtä pikaisella testauksella.
https://itunes.apple.com/us/app/pdf-ocr ... 2933?mt=12
https://itunes.apple.com/us/app/pdf-ocr ... 2933?mt=12
-
- Viestit: 12718
- Liittynyt: 24.4.2005 klo 23.47
- Paikkakunta: Helsinki
Re: Jpg > Pdf + Ocr
Viesti Kirjoittaja homenamsi »
Kun olen viimeksi etsinyt vastaavaa ratkaisua niin muistaakseni kaikki, jotka kykenevät eräkäsittelyyn olivat maksullisia. Jostain löysin silloin aletarjouksen ABBY Fine Readerista. Hyvä muttei halpa, kokeiluversio kuitenkin maksuton.
https://apps.apple.com/fi/app/finereade ... l=fi&mt=12
jrp:n linkkaama näyttää olevan myös maksullinen eräkäsittelyversiona.
https://apps.apple.com/fi/app/finereade ... l=fi&mt=12
jrp:n linkkaama näyttää olevan myös maksullinen eräkäsittelyversiona.
-
- Viestit: 1114
- Liittynyt: 5.9.2006 klo 8.57
- Paikkakunta: Vantaa
Re: Jpg > Pdf + Ocr
Viesti Kirjoittaja jrp »
Eipä tullut testattua useammalla tiedostolla, joten aika askarteluksi menee tuolla...
Nyt kun asiaa hieman mietin, niin muistan, että olen aikaisemmin löytänyt skannaamiani tiedostoja niiden sisältämän teksin perusteella. En siis ole tehnyt noille minkäänlaista OCR -lukua, tai tallennusta. Enää vastaava ei onnistu. Apple lienee jättänyt ominaisuuden pois Venturasta.
Nyt kun asiaa hieman mietin, niin muistan, että olen aikaisemmin löytänyt skannaamiani tiedostoja niiden sisältämän teksin perusteella. En siis ole tehnyt noille minkäänlaista OCR -lukua, tai tallennusta. Enää vastaava ei onnistu. Apple lienee jättänyt ominaisuuden pois Venturasta.
-
- Viestit: 1114
- Liittynyt: 5.9.2006 klo 8.57
- Paikkakunta: Vantaa
Re: Jpg > Pdf + Ocr
Viesti Kirjoittaja jrp »
OCR toimii Esikatselussa ihan ilman kikkailuja (ja saattaa olla, että aiemminkin oli näin, eikä Finder haussa).
Oikean tiedoston etsimiseen tuosta ei kuitenkaan ole iloa, ellei jollain loitsulla hakua saa laajennettua tiedostojen sisälle.
Edit: OCR tallennus onnistuu Esikatselussa Vie -komennolla ja ruksimalla "Sisällytä teksti".
Oikean tiedoston etsimiseen tuosta ei kuitenkaan ole iloa, ellei jollain loitsulla hakua saa laajennettua tiedostojen sisälle.
Edit: OCR tallennus onnistuu Esikatselussa Vie -komennolla ja ruksimalla "Sisällytä teksti".
Näyttökuva 2023-3-19 kello 12.00.35.png
Sinulla ei ole tarvittavia oikeuksia nähdäksesi tämän viestin liitetiedostoja.
-
- Viestit: 140
- Liittynyt: 14.7.2012 klo 17.19
Re: Jpg > Pdf + Ocr
Viesti Kirjoittaja freeway »
jrp kirjoitti: ↑19.3.2023 klo 11.56 OCR toimii Esikatselussa ihan ilman kikkailuja (ja saattaa olla, että aiemminkin oli näin, eikä Finder haussa).
Oikean tiedoston etsimiseen tuosta ei kuitenkaan ole iloa, ellei jollain loitsulla hakua saa laajennettua tiedostojen sisälle.
Edit: OCR tallennus onnistuu Esikatselussa Vie -komennolla ja ruksimalla "Sisällytä teksti".
Näyttökuva 2023-3-19 kello 12.00.35.png
En saa toimimaan Venturassa.
Kun avaan jpg tiedoston Esikatselussa, niin Arkisto valikossa on kaksi vaihtoehtoa: "Vie" ja "Vie PDF:nä..." Mutta kummassakaan ei ole "Sisällytä teksti" vaihtoehtoa.
Jos teen "Vie PDF:nä..." sen jälkeen avaan tuon pdf tiedoston taas Esikatselussa, niin silloin "Vie" toimintoon ilmestyy "Sisällytä teksti" vaihtoehto.
Jos valitsen sen ja teen taas uuden PDF tiedoston, niin silti se on pelkää kuva, eikä sieltä esim pysty kopioimaan tekstiä. Eli se ei tee mitään.
-
- Viestit: 1114
- Liittynyt: 5.9.2006 klo 8.57
- Paikkakunta: Vantaa
Re: Jpg > Pdf + Ocr
Viesti Kirjoittaja jrp »
Tosiaan tallennus toimii vain pdf tiedostoon, joten jpegit pitää kääntää ensin pdf muotoon ja sitten toistamiseen uudeksi pdf:ksi.
Ymmärsin, että halusit Finder -haun löytävän tiedostot ja tämä toimii kun teet edellä mainitun toimenpiteen. Toki jos skannaus on kovin tumma tai suttuinen, niin saattaa jäädä toimimatta.
Tekstin pystyy myös kopioimaan maalaamalla halutun kohdan (edellyttäen, että teksti on tunnistautunut tekstiksi).
Ymmärsin, että halusit Finder -haun löytävän tiedostot ja tämä toimii kun teet edellä mainitun toimenpiteen. Toki jos skannaus on kovin tumma tai suttuinen, niin saattaa jäädä toimimatta.
Tekstin pystyy myös kopioimaan maalaamalla halutun kohdan (edellyttäen, että teksti on tunnistautunut tekstiksi).
-
- Viestit: 56
- Liittynyt: 7.1.2012 klo 19.55
- Paikkakunta: Turku
Re: Jpg > Pdf + Ocr
Viesti Kirjoittaja jopo-kissa »
tesseract-niminen komentoriviohjelma pitäisi toimia tässä tarkoituksessa. Tässä tutoriaali:
https://guides.library.illinois.edu/c.p ... &p=4121426
Voi olla että joku on luonut tälle myös graafisen käyttöliittymän. Toinen vaihtoehto olisi kysyä kuvia ymmärtävältä NLP-ohjelmalta, esimerkiksi ChatGPT:ltä, tällaista palvelusta. Tai jos ei vielä onnistu niin tämän teknisen kehityksen nopeuden perusteella pitäisi onnistua muutaman kuukauden sisällä.
https://guides.library.illinois.edu/c.p ... &p=4121426
Voi olla että joku on luonut tälle myös graafisen käyttöliittymän. Toinen vaihtoehto olisi kysyä kuvia ymmärtävältä NLP-ohjelmalta, esimerkiksi ChatGPT:ltä, tällaista palvelusta. Tai jos ei vielä onnistu niin tämän teknisen kehityksen nopeuden perusteella pitäisi onnistua muutaman kuukauden sisällä.

Macbook Pro 14" M1 Pro / iPhone 16 Pro
-
- Viestit: 643
- Liittynyt: 12.4.2019 klo 10.54
Re: Jpg > Pdf + Ocr
Viesti Kirjoittaja Sauerkrautzi »
Ohhoh. Olen tiennyt, että tällainen piilo-OCR on MacOS X:ssä mutta tämä ketju sai ajattelemaan millaisia mahdollisuuksia tällä on patch-toiminnolla. Ymmärtävätköhän kirjastot tämän? Meinaan että verkossa on aika tavalla esim. vanhoja opinnäytteitä jotka ovat pelkkiä pikseleitä, jos eivät ole sisältä haettavissa, mikään Turnitinkaan ei sinne pääse.
9 viestiä
• Sivu 1/1
Palaa sivulle “Kuva ja graafinen suunnittelu”
Hyppää
- Yleiset aiheet
- ↳ Ajankohtaista Apple-maailmasta
- ↳ Käyttöjärjestelmät
- ↳ Ohjelmat
- ↳ Yleiskeskustelu
- Mac ja oheislaitteet
- ↳ Yleiskeskustelu laitteista
- ↳ MacBook, MacBook Pro ja MacBook Air
- ↳ iMac
- ↳ Mac mini
- ↳ Mac Pro ja Mac Studio
- ↳ Ongelmia Macin kanssa?
- iPhone, iPad ja Apple Watch
- ↳ iPhone-, iPad- ja Apple Watch -laitekeskustelu
- ↳ iPhone-, iPad- ja Apple Watch -ohjelmat sekä iOS
- ↳ Ongelmia iPhonen, iPadin tai Apple Watchin kanssa?
- Huviksi ja hyödyksi
- ↳ Off-topic
- ↳ Kuva ja graafinen suunnittelu
- ↳ Audio ja musiikki
- ↳ Video, televisio ja elokuvat
- ↳ Pelit ja pelaaminen
- ↳ Ohjelmointi, skriptit ja palvelimet
- ↳ Tietoturva ja varmuuskopiointi
- ↳ Verkot, mobiilidata ja muut puhelimet
- ↳ Retronurkka
- ↳ Foorumin ylläpito
- Kauppapaikka
- ↳ Myydään Mac
- ↳ Myydään iPhone, iPad ja iPod
- ↳ Myydään muut Applen tuotteet
- ↳ Myydään muuta tietotekniikkaa
- ↳ Ostetaan Mac
- ↳ Ostetaan iPhone, iPad ja iPod
- ↳ Ostetaan muut Applen tuotteet
- ↳ Ostetaan muuta tietotekniikkaa
- ↳ Vaihdetaan, annetaan, työtä haetaan ja tarjotaan
- ↳ Kauppapaikan keskustelu ja hintavinkit