89
Ҳар икки дастур ҳам матнни тушунишдан ташқари бир неча қўшимча
имкониятларни таклиф қилади:
турли тиллар учун орфографияни текшириш;
сканерлаш;
тушунилган ҳужжатни турли форматларда сақлаш ва бошқа
дастурларга узатиш;
расмларни қайта ишлаш;
кўп тасвирларни пакетли қайта ишлаш;
матнни форматлаш.
Ҳар икки дастурда таклиф қилинаѐтган функциялар (улар деярли бир
хил) нинг фарқи фойдаланувчини қизиқтиради. Шунинг учун фойдаланувчи
учун муҳим бўлган бўлимлар бўйича изланиш олиб борамиз.
Бу характеристикалар ушбу дастурларни қўллашда энг муҳимларидан
ҳисобланади, чунки тушуниш саҳифа матнига кетган вақтни тежаши керак.
Бу эса тезлик ва сифатга боғлик бўлади. Тезлик
- дастурга тушуниш учун
сафрланадиган вақт ҳисобланади, олинган матнни тузатиш шартми ва матнни
тузатишга кетган вақт берилган матнни киритишга кетган вақтдан камлиги
эса унинг сифатга боғлиқ бўлади. Тажриба шуни кўрсатадики, сифат
тўғридан-тўғри бошланғич материалга ва тушуниш
дастурининг интеллект
даражасига боғлик бўлади.
Бошланишида биз фақат оддий матндан ташкил топган саҳифани
дастурлар қандай тушунишини кўрамиз. Кейин эса турли мураккабликдаги
бир неча вариантларни кўриб чиқамиз.
Бунинг учун А4 форматидаги, лазерли принтерида чоп қилинган
матнни оламиз, дюймига 300 нуқта рухсат этилган экранга оқ-қора муҳитда
сканер қиламиз ва TIFF форматида хотирада сақлаймиз (тест учун олинган
бошқа намуналар ҳам шу параметрларда сканер қилинади).
3-расм. Текшириш учун олинган матннинг кўриниши.
Бу расмда тушуниш учун ҳеч қандай қийинчиликлар йўқ, лекин…
Энди бу тасвир Fine Reader да ўқилади, тушунилиши керак бўлган
соҳани белгиланади ва "Распознать" тугмасини босилади. Бу жараѐн 4 сония
давом этади. Бу операцияни Cuneiform 2000 да ҳам синалганда, унда матнни
тушуниш учун 8 сония вақт сарфланади.
Шундай қилиб, Fine Reader дастури Cuneiform 2000 га нисбатан бу
функцияни тез бажаради. Энди сифат ҳақида: биринчи дастур фақатгина
92
Тушунилган матн кўрилганда, Fine Reader топшириқни нисбатан яхши
бажарди. Cuneiform «Ц» харфини тўғри тушуна олмади, ноль рақамини эса
«О» ҳхарфи деб тушунди.
9-Расм.Fine Reader да олинган матн.
Бир-иккита хатоларни тузатилса,
матн тайѐр бўлади.
10-расм. Cuneiform 2000 да олинган матн. Хатоликлар Fine Reader
дагига қараганда кўпроқ учрайди.
93
Энди эса сифати ѐмон нухсани тушуниш қандай натижа беришини
кўрамиз.
11-расм. Ёмон нусхали матн намунасидан олинган сканер кўриниши.
Етарли даражада сабр-тоқат ва билимга эга бўлиб, Photoshop имконият-
ларини ишга солиб уни яхшилаш мумкин.
Fine Reader - 1 дақиқа 48 сония, Cuneiform - 30 сония ичида бутун
саҳифадан фақатгина йигирмага яқин сўзни тўғри тушунган.
Fine Reader да
бошланғич материалнинг сифати ѐмон бўлишига қарамай, максимал
даражада тушунилган матнга эга бўламиз. Cuneiform фойдаланувчилари эса
матнни қўлда киритишига тўғри келади.
12-расм.Cuneiform топшириқни бажара олмади,
бундай матнни тушу-
нилган дейиш мумкин эмас.
94
13-расм. Бу матнни Cuneiform 2000 да олинган матн билан
солиштиринг, Fine Reader бу ишни қанчалик яхши бажарганини тушуниш
мумкин.
Шундай қилиб, дастурларда тушуниш вақти ҳар хил, уларнинг қайси
бири тез бажаришини айтиш қийин. Лекин шунга эътибор бериш керакки,
Fine Reader нинг тушуниш вақти бевосита оригиналнинг сифатига боғлиқ: у
кўпроқ тушунишга ҳаракат қилади ва шунинг учун ѐмон
сифатли тасвирни
тушунишга кўп вақт сарфлайди. Cuneiform 2000да эса тушуниш вақти
оригиналга унчалик боғлик эмас, шунинг учун тушунишга кам вақт
сарфлади, бу эса сифатга ѐмон таъсир кўрсатади. Хулоса қилиб айтиш
мумкинки Fine Reader ни яхши ва ѐмон сифатли бошланғич материални
тушунишда ишлатиш мумкин. Cuneiform 2000 ни эса ўртача ва ўтачадан
юқори сифатли материалларни тушунишда ишлатиш мақсадга мувоффиқ,
чунки у тушуниш учун кам вақт сарфлайди.
Do'stlaringiz bilan baham: