Министерство высшего и средне-специального образования Республики Узбекистан



Download 2,34 Mb.
bet1/7
Sana06.07.2022
Hajmi2,34 Mb.
#744122
TuriКурсовая
  1   2   3   4   5   6   7
Bog'liq
Технически средства распознования PDF DJVU (3)
ishlab chiqarish va istemol , Nizom, Forms, VideoWorks6, фалсафа 2, Фалсафа, Фалсафа, Fizika, 2 5470055663692419484, Talab va taklif nazariyasi, [Read only]nemis tili, QAYNOQ KLAVISHLAR , 2 5316866489620370349, 2-Чилангар-Электромонтажчи




Министерство высшего и средне-специального образования
Республики Узбекистан
Академический лицей
Филиала Российского государственного университета
нефти и газа (НИУ) имени И. М. Губкина в городе Ташкенте


КУРСОВАЯ РАБОТА
по специальности
Специалист по обработке, оцифрованию
и хранению электронных документов”


на тему:
«Технические средства распознавания PDF/DJVU файлов»
Проверила преподаватель информатики:
Ниязова Ф.Т.
Выполнил учащийся 2 курса группы Т1-20:
Зафаров Масуд


Ташкент-2022

Содержание
Введение
1.История
2.Форматы PDF и DJVU
2.1 Формат PDF
2.2 Формат DJVU
3. Программы для распознавания PDF/DJVU файлов
3.1 ABBYY FineReader
3.2 Readiris
3.3 CuneiForm
4. Литература
Введение
OCR – это технология преобразования файлов, созданных на основе изображений, в редактируемый текст. К файлам, созданным на основе изображений, относятся документы, отсканированные из учебников, журналов или рукописный текст в печатный, обычно сохраняемые в формате PDF. Технология распознавания символов (OCR) позволяет извлечь текст из этих изображений и сделать его редактируемым. Распознавание широко применяется для преобразования книг и документов в электронный вид, для автоматизации систем учёта в бизнесе или для публикации текста на веб-странице. Оптическое распознавание символов позволяет редактировать текст, осуществлять поиск слов или фраз, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тексту электронный перевод, форматирование или преобразование в речь. Оптическое распознавание текста является исследуемой проблемой в областях распознавания образов, искусственного интеллекта и компьютерного зрения. В настоящее время больше всего распространены так называемые «интеллектуальные» системы, с высокой степенью точности распознающие большинство шрифтов. Некоторые системы оптического распознавания текста способны восстанавливать исходное форматирование текста, включая изображения, колонки и другие нетекстовые компоненты.



Download 2,34 Mb.

Do'stlaringiz bilan baham:
  1   2   3   4   5   6   7




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2023
ma'muriyatiga murojaat qiling

    Bosh sahifa
davlat universiteti
ta’lim vazirligi
axborot texnologiyalari
zbekiston respublikasi
maxsus ta’lim
guruh talabasi
nomidagi toshkent
O’zbekiston respublikasi
o’rta maxsus
toshkent axborot
texnologiyalari universiteti
xorazmiy nomidagi
davlat pedagogika
rivojlantirish vazirligi
pedagogika instituti
Ўзбекистон республикаси
tashkil etish
haqida tushuncha
vazirligi muhammad
таълим вазирлиги
toshkent davlat
respublikasi axborot
O'zbekiston respublikasi
kommunikatsiyalarini rivojlantirish
махсус таълим
vazirligi toshkent
fanidan tayyorlagan
bilan ishlash
saqlash vazirligi
Toshkent davlat
Ishdan maqsad
fanidan mustaqil
sog'liqni saqlash
uzbekistan coronavirus
respublikasi sog'liqni
coronavirus covid
vazirligi koronavirus
covid vaccination
koronavirus covid
qarshi emlanganlik
risida sertifikat
sertifikat ministry
vaccination certificate
haqida umumiy
o’rta ta’lim
matematika fakulteti
fanlar fakulteti
pedagogika universiteti
ishlab chiqarish
moliya instituti
fanining predmeti