"Enter"a basıp içeriğe geçin

Linux için OCR En İyi Uygulamaları – Linux Önerileri

Bu makale, Linux için kullanılabilen faydalı OCR yazılımlarının bir listesini kapsayacaktır. Optik Karakter Tanıma (OCR) yazılımı, içeriği seçilemeyen veya kopyalanamayan ancak görüntülenebilen veya okunabilen metin olmayan dosyaların metin içeriğini algılamaya çalışır. Örneğin, OCR yazılımı, çeşitli algoritmalar ve yapay zeka tabanlı çözümler kullanarak dijital dosya biçimlerindeki, PDF’deki veya diğer taranan belgelerdeki görüntülerdeki metinleri tanıyabilir.

OCR programları, metin seçmek ve dijital kopyalar oluşturmak için kullanılabildikleri için özellikle eski belgeleri dönüştürmek ve korumak için kullanışlıdır. Bazen seçilen metin %100 doğru olmayabilir, ancak OCR yazılımı olabildiğince fazla metin ayıklayarak manuel düzenleme ihtiyacını büyük ölçüde ortadan kaldırır. Daha sonra doğruluğu artırmak ve tam kopyalar üretmek için manuel ayarlamalar yapılabilir. Çoğu OCR programı, metni ayrı dosyalara çıkarabilir, ancak bazıları orijinal dosyaların üzerine gizli bir metin katmanı eklemeyi de destekler. Yer paylaşımlı metin, içeriği orijinal baskısında ve biçiminde okumanın yanı sıra metni seçip kopyalamanıza olanak tanır. Bu teknoloji özellikle eski belgeleri PDF formatında dijital hale getirmek için kullanılır.

Tesseract OCR’si

Tesseract OCR, Linux işletim sistemi için kullanılabilen ücretsiz ve açık kaynaklı bir OCR yazılımıdır. Google sponsorluğunda ve birçok gönüllü tarafından sürdürülen bu, bazı ücretli özel çözümlerden daha iyi performans gösterebilen tartışmasız en kapsamlı OCR paketidir. Komut satırı araçlarının yanı sıra kendi programlarınıza entegre edebileceğiniz bir API sağlar. Birçok dilde metni iyi bir doğrulukla algılayabilir. Metin seçimi ve ayıklama için kullanılabilecek bir dizi önceden eğitilmiş veriyle birlikte gelir. Özel bir çözüme ihtiyacınız varsa, kendi eğitilmiş verilerinizi kullanabilir veya üçüncü taraflardan daha fazla model alabilirsiniz. Tesseract OCR birden çok algılama motoruyla birlikte gelir ve bunları kurulum yöntemine bağlı olarak ihtiyaçlarınıza göre kullanabilirsiniz.

Tesseract OCR’yi Ubuntu’ya kurmak için aşağıda belirtilen komutu kullanın:

$ sudo uygun İndirmek Tesseract-ocr

Paket yöneticisi aracılığıyla varsayılan depolardan diğer Linux dağıtımlarına kurabilirsiniz. Evrensel bir AppImage dosyası ve ek kurulum talimatları mevcuttur Burada.

Tesseract OCR, varsayılan olarak İngilizce içerik algılama desteğiyle gelir. Ek dilleri etkinleştirmek istiyorsanız, daha fazla dil paketi indirmeniz gerekebilir. Yukarıda verilen bağlantı, ek dil paketlerini yüklemek için talimatlar içerir. Ubuntu’da dil paketlerini doğrudan aşağıdaki komutu çalıştırarak bulabilirsiniz:

$ apt-cache’de ara tesseract-ocr-

Yukarıdaki komut, farklı dil paketleri için paket adlarını verecektir. Aşağıdaki biçimde bir komut çalıştırarak bunları kurmanız yeterlidir:

$ sudo uygun İndirmek<dil paketi>

Aşağıdaki komutu çalıştırarak kurulu tüm dil paketlerinin bir listesini alabilirsiniz:

Ana Tesseract OCR paketini ve ek dil paketlerini yükledikten sonra, resimlerden ve PDF’lerden metin algılamaya başlayabilirsiniz. Metni çıkarmak için aşağıdaki biçimlerdeki komutları kullanın:

Çıktı $tesseract image.png -ile İngilizce
Çıktı $tesseract image.png -ile İngilizce + Spa
Çıktı $tesseract image.png -ile ingilizce pdf

İlk komut, ‘eng’ metnini ‘image.png’ dosyasından çıkarır ve ‘output’ adlı bir dosyada saklar. İkinci komut, görüntüyü birden çok dil paketi kullanarak ayrıştırır. Üçüncü komut, görüntü dosyasına metin katmanı eklenmiş bir PDF dosyası oluşturmak için kullanılabilir.

Tesseract OCR için komut satırını kullanma hakkında daha fazla bilgi için aşağıdaki iki komutu kullanın:

$ –Yardım Edin
$ Adem Bir kitap veya makalenin fikrini veya amacını özetleyin

gImageReader

gImageReader, yukarıda belirtilen Tesseract OCR motoru için bir grafik istemcisidir. Tesseract OCR tarafından desteklenen komut satırı seçeneklerinin ve eylemlerinin çoğunu çalıştırmak için kullanabilirsiniz. Birden fazla dosyadan metin ayıklayın ve ayıklanan metin ile seçili metnin yazımını kontrol edin

gImageReader’ı Ubuntu’ya kurmak için aşağıda belirtilen komutu kullanın:

$ sudo uygun İndirmek görüntü okuyucu

Paket yöneticisi aracılığıyla varsayılan depolardan diğer Linux dağıtımlarına kurabilirsiniz. Dağıtım için daha fazla paket mevcut Burada.

belge

Paperwork, ücretsiz ve açık kaynaklı bir belge yöneticisidir. Özellikle büyük bir koleksiyonunuz varsa, belge kitaplığınızı verimli bir şekilde yönetmek için kullanabilirsiniz. Ayrıca Tesseract ve Cuneiform OCR motorlarına dayalı bir Python modülü olan “Pyocr” kullanan yerleşik bir OCR modu ile birlikte gelir. Paperwork’ün diğer önemli özellikleri arasında taranan belgeleri düzenleme yeteneği, belge kitaplığında arama yapmak için arama çubuğu, belgeleri sıralama yeteneği, tarayıcı desteği vb. bulunan.

Paperwork’ü Ubuntu’ya yüklemek için aşağıda belirtilen komutu kullanın:

$ sudo uygun İndirmek doc-gtk

Paket yöneticisi aracılığıyla varsayılan depolardan diğer Linux dağıtımlarına kurabilirsiniz. Evrensel Düz Paket de mevcuttur Burada.

OCRFeeder

OCRFeeder, GNOME ekibi tarafından sağlanan ücretsiz ve açık kaynaklı bir grafik OCR yazılımıdır. Birden çok dilde metin tanımayı destekler ve içeriği birden çok dosya biçiminde dışa aktarabilir. Tesseract OCR, GOCR, Ocrad ve Cuneiform dahil birçok OCR motorunu destekler. Ayıklanan metin içeriğinin biçimlendirmesini ve düzenini iyileştirmek için bazı son işlemler yapmanıza da olanak tanır.

OCRFeeder’ı Ubuntu’ya kurmak için aşağıda belirtilen komutu kullanın:

$ sudo uygun İndirmek ocrfeeder

Paket yöneticisi aracılığıyla varsayılan depolardan diğer Linux dağıtımlarına kurabilirsiniz. Evrensel Düz Paket de mevcuttur Burada.

Testlerimde Ubuntu depolarından yüklenen OCRFeeder’ın yalnızca bir OCR motoruyla geldiğini unutmayın. Bununla birlikte, yaklaşık 2 GB veri indirmesine rağmen, flatpak yapısı desteklenen dört OCR motorunun tümü ile birlikte geldi. Ubuntu deposunda bulunan paket boyutu çok daha küçüktü.

gscan2pdf

gscan2pdf, çeşitli dosya biçimlerinden metin tanımlayıp ayıklayabilen ücretsiz ve açık kaynaklı bir grafik aracıdır. Kağıtları taramak ve ardından OCR tarafından algılanan metin içeriğini PDF dosyalarına aktarmak için doğrudan tarayıcılarla çalışabilir. Ayrıca, bu motor paketleri sisteminizde kurulu olduğu sürece Tesseract OCR, GOCR, Ocropus ve Cuneiform dahil birden çok OCR motorunu da destekler. Kağıtların doğrudan taranmasının yanı sıra, görüntü dosyalarını içe aktarabilir ve bunlardan metin çıkarabilirsiniz.

gscan2pdf’yi Ubuntu’ya yüklemek için aşağıda belirtilen komutu kullanın:

$ sudo uygun İndirmek gscan2pdf gocr tesseract-ocr çivi yazısı

Paket yöneticisi aracılığıyla varsayılan depolardan diğer Linux dağıtımlarına kurabilirsiniz. Kaynak kodu ve yürütülebilir ikili dosyalar da mevcuttur Burada.

çözüm

Bunlar, Linux için mevcut olan en kullanışlı grafik OCR sürücülerinden ve yazılımlarından bazılarıdır. Tesseract OCR, piyasadaki en gelişmiş ve kapsamlı metin algılama aracıdır ve ihtiyaçlarınızın çoğu için yeterli olmalıdır. Tesseract OCR sonuçlarından memnun değilseniz bu yazıda bahsedilen diğer uygulamaları da deneyebilirsiniz.

Diğer gönderilerimize göz at

[wpcin-random-posts]

İlk Yorumu Siz Yapın

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir