సాంప్రదాయిక కాపీని ఉపయోగించి ఒక PDF ఫైల్ నుండి టెక్స్ట్ను తీయడం ఎల్లప్పుడూ సాధ్యపడదు. తరచుగా ఇటువంటి పత్రాల పేజీలు వారి కాగితపు సంస్కరణల స్కాన్ కంటెంట్. అలాంటి ఫైళ్ళను పూర్తిగా సవరించగలిగేలా టెక్స్ట్ డేటాగా మార్చుటకు, ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ (OCR) ఫంక్షన్తో ప్రత్యేక కార్యక్రమములు వాడబడతాయి.
అలాంటి పరిష్కారాలు చాలా కష్టంగా ఉంటాయి మరియు అందువల్ల చాలా ఖర్చు అవుతుంది. మీరు PDF ను క్రమం తప్పకుండా PDF గా గుర్తించాల్సిన అవసరం ఉంటే, తగిన ప్రోగ్రామ్ను కొనుగోలు చేయడం మంచిది. అరుదైన సందర్భాల్లో, అందుబాటులో ఉండే ఆన్లైన్ సేవల్లో ఒకదానితో సమానమైన విధులు ఉపయోగించడం మరింత తార్కికంగా ఉంటుంది.
ఎలా PDF నుండి ఆన్లైన్ గుర్తించడానికి
వాస్తవానికి, పూర్తి డెస్క్టాప్ పరిష్కారాలతో పోలిస్తే OCR ఆన్లైన్ సేవలు ఫీచర్ సెట్ పరిమితంగా ఉంటుంది. కానీ మీరు అలాంటి వనరులతో ఉచితంగా, లేదా నామమాత్రపు రుసుముతో పని చేయవచ్చు. ప్రధాన విషయం ఏమిటంటే సంబంధిత వెబ్ అప్లికేషన్లు వారి ప్రధాన పని, అవి టెక్స్ట్ గుర్తింపు, అలాగే భరించవలసి.
విధానం 1: ABBYY FineReader ఆన్లైన్
ఆప్టికల్ డాక్యుమెంట్ గుర్తింపు రంగంలో నాయకులలో ఒకరు సేవా డెవలప్మెంట్ కంపెనీ. Windows మరియు Mac కోసం ABBYY FineReader PDF కు టెక్స్ట్ మార్పిడి మరియు పని కోసం ఒక శక్తివంతమైన పరిష్కారం.
ప్రోగ్రామ్ యొక్క వెబ్ ప్రతినిధి, కోర్సు యొక్క, అది కార్యాచరణలో తక్కువగా ఉంటుంది. అయినప్పటికీ, స్కాన్ మరియు ఫోటోల నుండి 190 కన్నా ఎక్కువ భాషల్లో ఈ సేవను గుర్తించవచ్చు. PDF ఫైల్లను వర్డ్, ఎక్సెల్, మొదలైనవికి మార్చడానికి మద్దతు ఇస్తుంది
ABBYY FineReader ఆన్లైన్ ఆన్లైన్ సేవ
- మీరు సాధనంతో పనిచేయడానికి ముందు, సైట్లో ఒక ఖాతాను సృష్టించండి లేదా మీ Facebook, Google లేదా Microsoft ఖాతాను ఉపయోగించి లాగిన్ చేయండి.
లాగిన్ విండోకు వెళ్లడానికి, బటన్పై క్లిక్ చేయండి. "లాగిన్" ఎగువ మెను బార్లో. - లాగిన్ చేసిన తరువాత, కావలసిన PDF పత్రాన్ని బటన్ను ఉపయోగించి FineReader లోకి దిగుమతి చేయండి "అప్లోడ్ ఫైళ్ళు".
అప్పుడు క్లిక్ చేయండి "పేజీ సంఖ్యలను ఎంచుకోండి" మరియు టెక్స్ట్ గుర్తింపు కోసం కావలసిన span పేర్కొనండి. - తరువాత, డాక్యుమెంట్లో ఉన్న భాషలను ఎంచుకోండి, ఫలిత ఫైల్ యొక్క ఫార్మాట్ మరియు బటన్పై క్లిక్ చేయండి "గుర్తించు".
- ప్రాసెస్ చేసిన తరువాత, వ్యవధి పూర్తిగా పత్రం యొక్క పరిమాణంపై ఆధారపడి ఉంటుంది, మీరు దాని పేరుపై క్లిక్ చేయడం ద్వారా పూర్తి డేటాను టెక్స్ట్ డేటాతో డౌన్లోడ్ చేసుకోవచ్చు.
లేదా అందుబాటులో క్లౌడ్ సేవల్లో ఒకదానికి దీన్ని ఎగుమతి చేయండి.
ఈ సేవ స్పష్టంగా, బహుశా, చిత్రాల మరియు PDF ఫైళ్ళలో అత్యంత ఖచ్చితమైన వచన గుర్తింపు క్రమసూత్ర పద్ధతులు. కానీ, దురదృష్టవశాత్తు, దాని ఉచిత ఉపయోగం నెలకు ఐదు పేజీలు పరిమితం. మరింత భారీ పత్రాలతో పనిచేయడానికి, మీరు ఒక సంవత్సరం చందాను కొనుగోలు చేయాలి.
ఏదేమైనప్పటికీ, OCR ఫంక్షన్ చాలా అరుదుగా అవసరమైతే, ABBYY FineReader Online అనేది చిన్న PDF ఫైళ్ళ నుండి పాఠాన్ని సంగ్రహించడానికి ఒక గొప్ప ఎంపిక.
విధానం 2: ఉచిత ఆన్లైన్ OCR
టెక్స్ట్ డిజిటైజు కోసం సరళమైన మరియు సౌకర్యవంతమైన సేవ. రిజిస్ట్రేషన్ అవసరం లేకుండా, వనరు మిమ్మల్ని గంటకు 15 పూర్తి PDF పేజీలను గుర్తించటానికి అనుమతిస్తుంది. ఉచిత ఆన్లైన్ OCR పూర్తిగా డాక్యుమెంట్లతో 46 భాషల్లో పనిచేస్తుంది మరియు అధికారం లేకుండా మూడు టెక్స్ట్ ఎగుమతి ఫార్మాట్లకు మద్దతు ఇస్తుంది - DOCX, XLSX మరియు TXT.
నమోదు చేస్తున్నప్పుడు, వినియోగదారుడు బహుళ-పేజీ పత్రాలను ప్రాసెస్ చేయగలడు, కానీ ఈ పేజీల ఉచిత సంఖ్య 50 యూనిట్లకు మాత్రమే పరిమితం చేయబడింది.
ఉచిత ఆన్లైన్ OCR ఆన్లైన్ సేవ
- PDF నుండి "అతిథి" గా టెక్స్ట్ను వనరుపై అధికారం లేకుండా గుర్తించడానికి, సైట్ యొక్క ప్రధాన పేజీలో తగిన ఫారమ్ను ఉపయోగించండి.
బటన్ను ఉపయోగించి కావలసిన పత్రాన్ని ఎంచుకోండి "ఫైల్", ప్రధాన టెక్స్ట్ భాష, అవుట్పుట్ ఫార్మాట్ పేర్కొనండి, అప్పుడు ఫైల్ లోడ్ మరియు క్లిక్ కోసం వేచి "మార్చండి". - డిజిటైజేషన్ ప్రక్రియ ముగింపులో, క్లిక్ చేయండి "డౌన్లోడ్ అవుట్పుట్ ఫైల్" కంప్యూటర్లో టెక్స్ట్ తో పూర్తి పత్రాన్ని సేవ్ చేయడానికి.
అధికారం కలిగిన వినియోగదారుల కోసం, చర్యల క్రమం కొంతవరకు భిన్నమైనది.
- బటన్ ఉపయోగించండి "నమోదు" లేదా "లాగిన్" టాప్ మెనూ బార్ లో, వరుసగా, ఉచిత ఆన్లైన్ OCR ఖాతా సృష్టించుకోండి లేదా దానిలోకి వెళ్ళండి.
- గుర్తింపు ప్యానెల్లో అధికారం తర్వాత, కీని నొక్కి ఉంచండి «CTRL»అందించిన జాబితా నుండి మూలం పత్రం యొక్క రెండు భాషలను ఎంచుకోండి.
- PDF నుండి టెక్స్ట్ని సంగ్రహించడానికి మరిన్ని ఎంపికలను పేర్కొనండి మరియు బటన్ను క్లిక్ చేయండి. "ఫైల్ను ఎంచుకోండి" పత్రంలో పత్రాన్ని లోడ్ చేయడానికి.
అప్పుడు, గుర్తింపును ప్రారంభించడానికి, క్లిక్ చేయండి "మార్చండి". - పత్రాన్ని ప్రాసెస్ చేసిన తర్వాత, సంబంధిత నిలువు వరుసలో అవుట్పుట్ ఫైల్ పేరుతో లింక్పై క్లిక్ చేయండి.
గుర్తింపు ఫలితం వెంటనే మీ కంప్యూటర్ యొక్క మెమరీలో నిల్వ చేయబడుతుంది.
మీరు ఒక చిన్న PDF పత్రం నుండి వచనాన్ని సేకరించినట్లయితే, మీరు పైన వివరించిన సాధనాన్ని ఉపయోగించి సురక్షితంగా ఉపయోగించవచ్చు. పెద్ద ఫైళ్లతో పనిచేయడానికి, మీరు ఉచిత ఆన్లైన్ OCR లో అదనపు చిహ్నాలను కొనుగోలు చేయాలి లేదా మరొక పరిష్కారం కోసం రిసార్ట్ చేయాలి.
విధానం 3: NEWOCR
DjVu మరియు PDF వంటి వాస్తవంగా ఏవైనా గ్రాఫిక్ మరియు ఎలక్ట్రానిక్ పత్రాల నుండి పాఠాన్ని సేకరించేందుకు మిమ్మల్ని అనుమతించే పూర్తిగా ఉచిత OCR- సేవ. వనరు గుర్తించదగిన ఫైళ్ళ పరిమాణం మరియు సంఖ్యపై పరిమితులను విధించదు, రిజిస్ట్రేషన్ అవసరం లేదు, మరియు విస్తృత శ్రేణి సంబంధిత ఫంక్షన్లను అందిస్తుంది.
న్యూఓఆర్ఆర్ 106 భాషలకు మద్దతు ఇస్తుంది మరియు తక్కువ-నాణ్యత పత్రాల స్కాన్లను సరిగ్గా నిర్వహించగలదు. ఫైల్ పేజీలో టెక్స్ట్ గుర్తింపు కోసం మాన్యువల్గా మాన్యువల్గా ఎన్నుకోవచ్చు.
ఆన్లైన్ సేవ NewOCR
- కాబట్టి, మీరు అనవసరమైన చర్యలు చేపట్టవలసిన అవసరం లేకుండా వెంటనే వనరుతో పని చెయ్యవచ్చు.
నేరుగా ప్రధాన పేజీలో పత్రానికి సైట్కు దిగుమతి చెయ్యడానికి ఒక రూపం ఉంది. NewOCR కు ఒక ఫైల్ను అప్లోడ్ చేయడానికి, బటన్ను ఉపయోగించండి "ఫైల్ను ఎంచుకోండి" విభాగంలో "మీ ఫైల్ను ఎంచుకోండి". అప్పుడు రంగంలో "గుర్తింపు భాష (లు)" సోర్స్ డాక్యుమెంట్ యొక్క ఒకటి లేదా మరిన్ని భాషలు ఎంచుకోండి, ఆపై క్లిక్ చేయండి "అప్లోడ్ + OCR". - మీ ప్రాధాన్య గుర్తింపు సెట్టింగులను అమర్చండి, పాఠాన్ని సంగ్రహించడానికి కావలసిన పేజీని ఎంచుకోండి, మరియు బటన్ క్లిక్ చేయండి. «OCR».
- ఒక బిట్ను క్రిందికి స్క్రోల్ చేయండి మరియు బటన్ను కనుగొనండి. «డౌన్లోడ్».
దానిపై క్లిక్ చేయండి మరియు డ్రాప్-డౌన్ జాబితాలో డౌన్లోడ్ చేయడానికి అవసరమైన డాక్యుమెంట్ ఫార్మాట్ను ఎంచుకోండి. ఆ తరువాత, సంగ్రహించిన టెక్స్ట్తో పూర్తి చేసిన ఫైల్ మీ కంప్యూటర్కు డౌన్లోడ్ చేయబడుతుంది.
సాధనం సౌకర్యవంతంగా ఉంటుంది మరియు తగినంత అధిక నాణ్యతలో అన్ని పాత్రలను గుర్తిస్తుంది. అయితే, దిగుమతి చేయబడిన PDF పత్రం యొక్క ప్రతి పేజీ యొక్క ప్రాసెసింగ్ స్వతంత్రంగా ప్రారంభించబడాలి మరియు ఒక ప్రత్యేక ఫైలులో ప్రదర్శించబడుతుంది. మీరు ఖచ్చితంగా, వెంటనే క్లిప్బోర్డ్కు గుర్తింపు ఫలితాలను కాపీ చేసి, వాటిని ఇతరులతో విలీనం చేయవచ్చు.
అయితే, పైన స్వల్పభేదాన్ని ఇచ్చిన, న్యూఓఆర్ఆర్ను ఉపయోగించి పెద్ద మొత్తాల టెక్స్ట్ సేకరించడం చాలా కష్టం. అదే చిన్న ఫైల్స్ సేవ "ఒక బ్యాంగ్ తో."
విధానం 4: OCR.Space
వచన డిజిటైజింగ్ కోసం సరళమైన మరియు అర్థమయ్యే వనరు PDF పత్రాలను గుర్తించి, ఫలితాన్ని ఫలితాన్ని అవుట్పుట్ చేయడానికి ఒక TXT ఫైల్ను అనుమతిస్తుంది. పేజీల సంఖ్యపై ఎటువంటి పరిమితులు లేవు. ఇన్పుట్ పత్రం యొక్క పరిమాణం 5 మెగాబైట్లకు మించరాదని మాత్రమే పరిమితి.
OCR.Space ఆన్లైన్ సేవ
- సాధనతో పనిచేయడానికి నమోదు అవసరం లేదు.
పైన ఉన్న లింక్పై క్లిక్ చేసి, మీ కంప్యూటర్ నుండి మీ కంప్యూటర్ నుండి PDF పత్రాన్ని అప్లోడ్ చెయ్యండి "ఫైల్ను ఎంచుకోండి" లేదా నెట్వర్క్ నుండి - సూచన ద్వారా. - డౌన్ జాబితాలో "OCR భాష ఎంచుకోండి" దిగుమతి పత్రం యొక్క భాషను ఎంచుకోండి.
అప్పుడు బటన్ పై క్లిక్ చేసి టెక్స్ట్ గుర్తింపు ప్రక్రియని ప్రారంభించండి. "OCR ను ప్రారంభించండి!". - ఫైలు ప్రాసెసింగ్ ముగింపులో, ఫలితంగా చూడండి "OCR'ed ఫలితం" మరియు క్లిక్ చేయండి «డౌన్లోడ్»పూర్తి TXT పత్రాన్ని డౌన్లోడ్ చేయడానికి.
మీరు PDF నుండి టెక్స్ట్ సేకరించేందుకు అవసరం మరియు చివరి ఫార్మాటింగ్ అన్ని వద్ద ముఖ్యమైనది కాదు, OCR.Space ఒక మంచి ఎంపిక. సేవలో అదే సమయంలో రెండు లేదా అంతకంటే ఎక్కువ భాషల గుర్తింపును అందించడం లేదు కాబట్టి, ఒకే పత్రం "ఏకపక్షంగా" ఉండాలి.
ఇవి కూడా చూడండి: ఉచిత సారూప్యాలు FineReader
వ్యాసంలో సమర్పించిన ఆన్లైన్ సాధనాలను మూల్యాంకనం చేస్తూ, ABBYY నుండి FineReader Online చాలా ఖచ్చితంగా మరియు ఖచ్చితంగా OCR ఫంక్షన్ను నిర్వహిస్తుంది. మీరు టెక్స్ట్ గుర్తింపు గరిష్ట ఖచ్చితత్వం ముఖ్యమైనది ఉంటే, ప్రత్యేకంగా ఈ ఎంపికను పరిగణలోకి ఉత్తమ ఉంది. కానీ చెల్లించడానికి, చాలా మటుకు, కూడా ఉంటుంది.
మీరు చిన్న పత్రాలను డిజిటైజ్ చెయ్యాలి మరియు సేవలో మీ వద్ద లోపాలను సరిచేయడానికి సిద్ధంగా ఉంటే, కొత్తగా పిలవబడే, OCR.Space లేదా ఉచిత ఆన్లైన్ OCR ను ఉపయోగించడం మంచిది.