టెక్స్ట్ యొక్క గుర్తింపు. ఉచిత కార్యక్రమం - అనలాగ్ FineReader

ముందుగానే లేదా తరువాత, కార్యాలయ కార్యక్రమాలలో పనిచేసే వారందరూ ఒక విలక్షణమైన పనిని ఎదుర్కొంటున్నారు - పుస్తకం, మ్యాగజైన్, వార్తాపత్రిక, కేవలం కరపత్రాల నుండి టెక్స్ట్ని స్కాన్ చేసి, ఆపై ఈ పత్రాలను టెక్స్ట్ ఫార్మాట్లో అనువదిస్తారు, ఉదాహరణకు, వర్డ్ డాక్యుమెంట్లో.

ఇది చేయటానికి మీరు ఒక స్కానర్ మరియు టెక్స్ట్ గుర్తింపు కోసం ఒక ప్రత్యేక ప్రోగ్రామ్ అవసరం. ఈ వ్యాసం FineReader యొక్క ఉచిత అనలాగ్ చర్చించడానికి ఉంటుంది -Cuneiform (FineReader లో గుర్తింపు గురించి - ఈ వ్యాసం చూడండి).

ప్రారంభిద్దాం ...

కంటెంట్

  • 1. CuneiForm ప్రోగ్రామ్ యొక్క లక్షణాలు, లక్షణాలు
  • 2. టెక్స్ట్ గుర్తింపుకు ఒక ఉదాహరణ
  • బ్యాచ్ టెక్స్ట్ గుర్తింపు
  • 4. ముగింపులు

1. CuneiForm ప్రోగ్రామ్ యొక్క లక్షణాలు, లక్షణాలు

Cuneiform

మీరు డెవలపర్ సైట్ నుండి డౌన్లోడ్ చేసుకోవచ్చు: // cognitiveforms.com/

ఓపెన్ సోర్స్ టెక్స్ట్ గుర్తింపు సాఫ్ట్వేర్. అదనంగా, ఇది Windows యొక్క అన్ని వెర్షన్లలో పనిచేస్తుంది: XP, Vista, 7, 8, ఇది pleases. ప్లస్, కార్యక్రమం యొక్క పూర్తి రష్యన్ అనువాదం జోడించండి!

ప్రోస్:

- ప్రపంచంలోని 20 అత్యంత ప్రజాదరణ పొందిన భాషల్లో టెక్స్ట్ గుర్తింపు (ఈ సంఖ్యలో ఇంగ్లీష్ మరియు రష్యన్లు కూడా చేర్చారు);

- వివిధ ముద్రణ ఫాంట్లకు భారీ మద్దతు;

- గుర్తించబడిన నిఘంటువు తనిఖీ;

- అనేక విధాలుగా పని ఫలితాలను ఆదా చేసే సామర్థ్యం;

- పత్రం నిర్మాణం నిర్వహించడం;

- అద్భుతమైన మద్దతు మరియు గుర్తింపు పట్టికలు.

కాన్స్:

- చాలా పెద్ద పత్రాలు మరియు ఫైళ్లకు మద్దతు లేదు (400 dpi కంటే ఎక్కువ);

- స్కానర్లు కొన్ని రకాల నేరుగా మద్దతు లేదు (అలాగే, ఈ భయానకంగా కాదు, స్కానర్ డ్రైవర్లతో ఒక ప్రత్యేక స్కానర్ చేర్చబడింది);

- డిజైన్ ప్రకాశిస్తుంది లేదు (ప్రోగ్రామ్ పూర్తిగా సమస్య పరిష్కరిస్తుంది అయితే ఇది అవసరం).

2. టెక్స్ట్ గుర్తింపుకు ఒక ఉదాహరణ

మీరు గుర్తింపు కోసం అవసరమైన చిత్రాలను (ఇప్పటికే స్కాన్ అయ్యి, లేదా ఇంటర్నెట్లో పిడిఎఫ్ / djvu ఫార్మాట్ లో డౌన్ లోడ్ చేసి, వాటి నుండి అవసరమైన చిత్రాలు వచ్చాయి అని మీరు అనుకున్నారని మేము భావిస్తున్నాము - దీన్ని ఎలా చేయాలో - ఈ కథనాన్ని చూడండి).

1) CuineForm ప్రోగ్రామ్ (ఫైల్ / ఓపెన్ లేదా "Cntrl + O") లో అవసరమైన చిత్రం తెరువు.

గుర్తింపును ప్రారంభించడానికి - మీరు మొదట వేర్వేరు ప్రాంతాలను ఎంచుకోవాలి: టెక్స్ట్, చిత్రాలు, పట్టికలు మొదలైనవి. క్యునిఫారమ్ కార్యక్రమంలో, ఇది మానవీయంగా మాత్రమే చేయబడుతుంది, కానీ స్వయంచాలకంగా! దీన్ని చేయటానికి, విండో యొక్క పై పేన్లో "మార్కప్" బటన్పై క్లిక్ చేయండి.

3) తరువాత 10-15 సెకన్లు. కార్యక్రమం స్వయంచాలకంగా వివిధ రంగులతో అన్ని ప్రాంతాలను హైలైట్ చేస్తుంది. ఉదాహరణకు, ఒక టెక్స్ట్ ప్రాంతం నీలి రంగులో హైలైట్ చేయబడుతుంది. మార్గం ద్వారా, ఆమె సరిగ్గా మరియు త్వరగా అన్ని ప్రాంతాల్లో హైలైట్. నిజాయితీగా, నేను ఆమె నుండి ఇటువంటి ఒక శీఘ్ర మరియు సరైన స్పందన ఊహించలేదు ...

4) ఆటోమేటిక్ మార్కప్ను విశ్వసించని వారికి, మీరు మాన్యువల్ ను ఉపయోగించవచ్చు. ఈ కోసం ఒక టూల్బార్ ఉంది (క్రింద చిత్రాన్ని చూడండి), ధన్యవాదాలు మీరు ఎంచుకోవచ్చు: టెక్స్ట్, టేబుల్, చిత్రం. తరలించు, పెంచండి / ప్రారంభ చిత్రం తగ్గించడానికి, అంచులు ట్రిమ్. సాధారణంగా, మంచి సెట్.

5) అన్ని ప్రాంతాలను మార్క్ చేసిన తర్వాత, మీరు కొనసాగవచ్చు గుర్తింపు. దీన్ని చేయడానికి, క్రింద ఉన్న చిత్రంలో ఉన్న అదే పేరు గల బటన్పై క్లిక్ చేయండి.

6) సాహిత్యపరంగా 10-20 సెకన్లలో. మీరు మైక్రోసాఫ్ట్ వర్డ్లో గుర్తించబడిన టెక్స్ట్తో పత్రాన్ని చూస్తారు. ఆసక్తికరమైన విషయమేమిటంటే, ఈ ఉదాహరణకి పాఠంలో, వాస్తవానికి తప్పులు ఉన్నాయి, కానీ వాటిలో చాలా తక్కువ ఉన్నాయి! ముఖ్యంగా, అసలైన విషయం ఎలా ఉండేదో పరిశీలిస్తుంది - చిత్రం.

వేగం మరియు నాణ్యత FineReader తో చాలా పోల్చదగినది!

బ్యాచ్ టెక్స్ట్ గుర్తింపు

మీరు ఈ చిత్రంలో ఒక్కో చిత్రాన్ని గుర్తించాల్సిన అవసరం ఉండదు, అయితే ఒకేసారి అనేక కార్యక్రమాలు ఈ కార్యక్రమంలో ఉపయోగపడతాయి. బ్యాచ్ గుర్తింపుని ప్రారంభించేందుకు సత్వరమార్గం సాధారణంగా ప్రారంభ మెనులో దాచబడుతుంది.

1) కార్యక్రమం తెరిచిన తర్వాత, మీరు ఒక కొత్త ప్యాకేజీని సృష్టించాలి లేదా గతంలో సేవ్ చేయబడిన ఒకదాన్ని తెరవాలి. మా ఉదాహరణలో - క్రొత్తదాన్ని సృష్టించండి.

2) తరువాతి దశలో మనం ఒక పేరు ఇస్తాము, అటువంటి ఆరు నెలల తరువాత మేము దానిలో ఏది నిల్వ చేయబడుతుందో గుర్తుంచుకుంటుంది.

3) తరువాత, డాక్యుమెంట్ భాష (రష్యన్-ఇంగ్లీష్) ను ఎంచుకోండి, స్కాన్ చేయబడిన విషయాల్లో చిత్రాలు మరియు పట్టికలు ఉన్నాయో లేదో సూచించండి.

4) ఇప్పుడు గుర్తింపు కోసం ఫైల్స్ ఉన్న ఫోల్డర్ను మీరు పేర్కొనాలి. మార్గం ద్వారా, ఏ ఆసక్తికరంగా ఉంది కార్యక్రమం అది గుర్తించి ప్రాజెక్ట్ వాటిని జోడించండి అన్ని చిత్రాలు మరియు ఇతర గ్రాఫిక్ ఫైళ్లు కనుగొంటారు. మీరు అదనపు తొలగించాల్సిన అవసరం ఉంది.

5) తరువాతి దశ ముఖ్యమైనది కాదు - గుర్తింపు తరువాత, మూలం ఫైళ్ళతో ఏమి చేయాలో ఎంచుకోండి. నేను చెక్బాక్స్ "ఏమీ చేయవద్దు" ఎంపిక చేయాలని సిఫార్సు చేస్తున్నాను.

6) గుర్తింపు పత్రం సేవ్ చేయబడే ఫార్మాట్ను ఎంచుకోవడానికి మాత్రమే ఇది ఉంది. అనేక ఎంపికలు ఉన్నాయి:

- rtf - పదం పత్రం నుండి ఫైల్ అన్ని ప్రముఖ కార్యాలయాలు ద్వారా ప్రారంభించబడింది (ఉచిత వాటిని సహా, కార్యక్రమాలు లింక్);

- టిఎక్స్ టి - టెక్స్ట్ ఫార్మాట్, మీరు మాత్రమే టెక్స్ట్, చిత్రాలు మరియు పట్టికలు సేవ్ చేయవచ్చు;

- htm - హైపర్టెక్స్ట్ పేజీ, అనుకూలమైనది మీరు సైట్ కోసం ఫైళ్ళను స్కాన్ చేసి గుర్తించితే. అతని మరియు మా ఉదాహరణలో ఎంచుకోండి.

7) "ముగించు" బటన్ను క్లిక్ చేసిన తర్వాత, మీ ప్రాజెక్ట్ యొక్క ప్రాసెసింగ్ ప్రారంభమవుతుంది.

8) కార్యక్రమం అందంగా త్వరగా పనిచేస్తుంది. గుర్తింపు తరువాత, మీరు htm ఫైళ్ళతో ఒక టాబ్ను చూస్తారు. మీరు అటువంటి ఫైల్లో క్లిక్ చేస్తే, మీరు ఫలితాలను చూడగల ఒక బ్రౌజర్ ప్రారంభమవుతుంది. మార్గం ద్వారా, ప్యాకేజీ అది మరింత పని కోసం సేవ్ చేయవచ్చు.

9) మీరు చూడవచ్చు ఫలితాలు పని చాలా బాగుంది. కార్యక్రమం సులభంగా చిత్రాన్ని గుర్తించింది, మరియు సులభంగా కింద టెక్స్ట్ గుర్తించింది. కార్యక్రమం ఉచితం, ఇది సాధారణంగా సూపర్!

4. ముగింపులు

మీరు తరచుగా పత్రాలను స్కాన్ చేసి గుర్తించకపోతే, FineReader కొనుగోలు చేయడం బహుశా అర్ధవంతం కాదు. CuneiForm సులభంగా చాలా పనులు నిర్వహిస్తుంది.

మరొక వైపు, ఆమె కూడా నష్టాలు కలిగి ఉంది.

మొదట, సంభవించే ఫలితం సవరణ మరియు తనిఖీ కోసం చాలా తక్కువ టూల్స్ ఉన్నాయి. రెండవది, మీరు చిత్రాలు చాలా గుర్తించాలని ఉన్నప్పుడు, అప్పుడు FineReader లో కుడి కుడి కాలమ్ లో ప్రాజెక్ట్ జోడించబడింది ప్రతిదీ చూడండి మరింత సౌకర్యవంతంగా ఉంది: త్వరగా అనవసరమైన తొలగించండి, సవరణలు మొదలైనవి మరియు మూడవ, ఖచ్చితంగా చెడ్డ నాణ్యత పత్రాలు న, CuneiForm గుర్తింపు కోల్పోతుంది: మీరు డాక్యుమెంట్ను మనసులో ఉంచుకోవాలి - సరైన తప్పులు, విరామ చిహ్నాలు, కోట్స్ మొదలైనవి.

అంతే. మీరు ఏ ఇతర మంచి ఉచిత టెక్స్ట్ గుర్తింపు సాఫ్ట్వేర్ తెలుసా?