Πώς να μετατρέψετε σαρωμένα έγγραφα σε Word - το ευτυχισμένο Android

Εάν πρέπει να ψηφιοποιήσετε ένα βιβλίο σε μορφή κειμένου, μπορεί να έχετε πολλές ερωτήσεις. Μπορεί να γίνει; Τι γίνεται με την ποιότητα, είναι καλή; Όχι μόνο μπορεί να γίνει, αλλά υπάρχουν επίσης διάφοροι τρόποι μετατροπής ενός σαρωμένου εγγράφου σε Word. Ας δούμε:

  • Σάρωση του εγγράφου σε μορφή PDF και επεξεργασία του αργότερα με το Adobe Acrobat XI Pro για αποθήκευση σε μορφή Word. Η Pro έκδοση του Acrobat πληρώνεται, αλλά μπορείτε να αγοράσετε μια δωρεάν δοκιμαστική άδεια 30 ημερών.
  • Από τον ιστότοπο OnlineOCR.net . Αυτή η εφαρμογή ιστού σάς επιτρέπει να μετατρέπετε έγγραφα σε μορφές PDF, JPG, TIFF και GIF σε Word, Excel και κείμενο. Στην δωρεάν έκδοση μπορούμε να μετατρέψουμε έως και 15 σελίδες ανά ώρα και έγγραφα όχι περισσότερο από μία σελίδα.
  • Σαρώνοντας το έγγραφο σε μορφή (OCR) και αποθηκεύοντάς το ως κείμενο. Στη συνέχεια μπορούμε να ανοίξουμε το Word και να το επεξεργαστούμε ή να το αποθηκεύσουμε σε μορφή .doc.
  • Χρησιμοποιώντας κάποιο πρόγραμμα αναγνώρισης οπτικών χαρακτήρων :
    •  VueScan (διαθέσιμο για Windows, Mac OS X και Linux)
    • Kooka  (για Linux)
    • Office Lens (για Android και iOS )
    • CamScanner (για Android και iOS )

Ο πιο αποτελεσματικός τρόπος για να πούμε είναι μέσω του Adobe Acrobat Pro, αλλά μόνο αν η σάρωση είναι πολύ, πολύ καθαρή και υψηλής ποιότητας. Οι εφαρμογές οπτικής αναγνώρισης χαρακτήρων έχουν προχωρήσει αρκετά, αλλά εξακολουθούν να εμφανίζουν κάποια κενά με πράγματα όπως έντονα ή πλάγια γράμματα και η μεταγραφή ορισμένων λέξεων ανάλογα με τον τύπο γραμματοσειράς του πρωτότυπου εγγράφου μπορεί να είναι λανθασμένη.

Προσπαθήστε να σαρώσετε και να μεταβιβάσετε αυτό το έγγραφο στο Word για να δείτε τι συμβαίνει

Από τον ίδιο τον σαρωτή

Ορισμένοι σαρωτές περιλαμβάνουν τη δυνατότητα οπτικής αναγνώρισης (OCR) στο δικό τους πρόγραμμα σάρωσης. Για να σαρώσετε ένα έγγραφο σε κείμενο, απλά πρέπει να ορίσετε τη μορφή ψηφιοποίησης και να κοιτάξετε ένα που αναφέρεται σε OCR ή παρόμοιο (εξαρτάται από την επωνυμία / μοντέλο του σαρωτή).

Μεταβείτε από το PDF στο Word με το Adobe Acrobat XI Pro

Μετά τη λήψη και εγκατάσταση του Adobe Acrobat XI Pro ( έχετε μια δωρεάν δοκιμαστική έκδοση 30 ημερών ΕΔΩ ) μεταβείτε στην ενότητα " Εργαλεία -> Αναγνώριση κειμένου -> Σε αυτό το αρχείο "

Στο παράθυρο " Αναγνώριση κειμένου " , κάντε κλικ στο " Επεξεργασία " και επιλέξτε τη γλώσσα κειμένου, το στυλ εξόδου και την ανάλυση.

Τέλος, επιστρέψτε στο " Εργαλεία -> Επεξεργασία περιεχομένου -> Επεξεργασία κειμένου και εικόνων " και τροποποιήστε το κείμενο εάν χρειαστεί να διορθώσετε οποιαδήποτε λέξη. Για να ολοκληρώσετε, κάντε κλικ στο " Αρχείο -> Αποθήκευση ως " και αποθηκεύστε το σε μορφή Word.

OnlineOCR

Το OnlineOCR είναι μια διαδικτυακή εφαρμογή για τη μεταφορά εικόνων ή pdf στο Word και είναι πολύ εύκολο στη χρήση. Θα εξηγήσω πώς λειτουργεί: Εισαγάγετε //www.onlineocr.net/ και κάντε κλικ στο " Επιλογή αρχείου ". Επιλέξτε το σαρωμένο έγγραφο και, στη συνέχεια, επιλέξτε τη γλώσσα και τη μορφή εξόδου από τα 2 αναπτυσσόμενα μενού που έχετε στο κέντρο της οθόνης.

Για να ολοκληρώσετε, κάντε κλικ στο " Μετατροπή ". Ακριβώς κάτω θα εμφανιστεί μια προεπισκόπηση απλού κειμένου που μπορείτε να επεξεργαστείτε εάν θέλετε να διορθώσετε τυχόν λέξεις. Τέλος, κάντε κλικ στο " Λήψη αρχείου εξόδου " και μπορείτε να κατεβάσετε το αρχείο σε μορφή Word. Ακολουθεί ένα παράδειγμα PDF που μετατράπηκε σε Word με OnlineOCR:

  • Αρχικό PDF:

  • Έγινε μετατροπή:

Εάν αυτή η εφαρμογή ιστού δεν σας ικανοποιεί, μπορείτε να δοκιμάσετε άλλες παρόμοιες εναλλακτικές λύσεις όπως το FreeOCR ή το Free-Online-OCR .

Προγράμματα αναγνώρισης οπτικών χαρακτήρων (OCR)

Εάν δεν θέλετε να τροποποιήσετε τα έγγραφά σας στο διαδίκτυο και χρειάζεστε μια εφαρμογή επιτραπέζιου υπολογιστή, μπορείτε να χρησιμοποιήσετε εφαρμογές όπως το VueScan (το οποίο είναι επίσης διαθέσιμο για Mac και Linux εκτός από τα πανταχού παρόντα Windows).

Μια άλλη δυνατότητα είναι να χρησιμοποιήσετε τη συσκευή σας Android ή iOS για να σαρώσετε το έγγραφο και να το μετατρέψετε σε κείμενο απευθείας. Υπάρχουν εφαρμογές όπως το Office Lens (για Android και iOS ) ή το CamScanner (για Android και iOS ) που εκτελούν ολόκληρη τη διαδικασία από την ίδια εφαρμογή. Συνιστάται σε αυτές τις περιπτώσεις να καθαρίσετε την εικόνα πριν τη μετατρέψετε σε κείμενο. Αν θέλετε να μάθετε περισσότερα για αυτήν τη μέθοδο ρίξτε μια ματιά σε αυτό το post .

Κατά την άποψή μου, η τεχνική αναγνώρισης οπτικών χαρακτήρων, αν και έχει βελτιωθεί πολύ τα τελευταία χρόνια, απέχει ακόμη λίγα χρόνια από την τέλεια τεχνική. Πολλές λεπτομέρειες, πολλές λέξεις που «μεταφράζει» με λανθασμένα γράμματα και σύμβολα που απορρίπτουν το κείμενο. Εξακολουθεί να μην διαθέτει αυτήν την επιπλέον ευφυΐα που τον κάνει να βλέπει ότι το " t &! $ Olog1a " δεν μπορεί να είναι έγκυρη μετάφραση οποιασδήποτε λέξης σε ένα κείμενο. Ακόμα δεν βλέπω μια κατανόηση ανάγνωσης, αλλά μια απλή οπτική αναγνώριση μεμονωμένων γραμμάτων που σχηματίζουν λέξεις χωρίς να τις ενσωματώσουν στο υπόλοιπο κείμενο. Ωστόσο, είμαι πεπεισμένος ότι η στιγμή που θα κάνουμε αυτό το τελευταίο μεγάλο άλμα πλησιάζει κάθε μέρα.

Έχετε εγκαταστήσει το Telegram ; Λάβετε την καλύτερη ανάρτηση κάθε μέρα στο κανάλι μας . Ή αν προτιμάτε, μάθετε τα πάντα από τη σελίδα μας στο Facebook .