Распознавание текста и системы компьютерного перевода

Распознавание текста и системы компьютерного перевода

выработать навыки работы с программным оптического распознавания документов, компьютерными словарями и программами-переводчиками;

Скачать:

Вложение Размер
urok_no23_instrumenty_raspoznavaniya_tekstov_i_kompyuternogo_perevoda.docx 17.21 КБ

Предварительный просмотр:

Урок 23. Распознавание текста и системы компьютерного перевода. Пр/р №10 «Распознавание текстовых документов»

Цель урока: выработать навыки работы с программным оптического распознавания документов, компьютерными словарями и программами-переводчиками;

  1. Организационный момент (1мин)
  2. Проверка изученного материала по вопросам к §4.4; (15 мин)
  3. Изложение нового материала(10 мин)

Рассмотрение нового материала осуществляется с использованием презентации «Инструменты распознавания текстов и компьютерного перевода».

Программы оптического распознавания документов

Для ввода текстов в память компьютера с бумажных носителей используют сканеры и программы распознавания символов.

Одной из наиболее известных программ такого типа является ABBYY FineReader. Вместо сканера можно использовать цифровой фотоаппарат или камеру мобильного телефона.

Компьютерные словари и программы-переводчики

Компьютерные словари выполняют перевод отдельных слов и словосочетаний. Для перевода текстовых документов применяются программы-переводчики.

Компьютерные словари обеспечивают мгновенный поиск словарных статей. Они могут быть установлены на компьютер как самостоятельные программы, бывают встроенные в процессоры, существуют в онлайн режиме в сети Интернет. Для перевода больших текстов используются программы-переводчики.

  1. Выполнение практической работы (15 мин)

Сделать сканирование документа с помощью ABBYY FineReader.

Подключиться к Интернету и выполнить перевод текста из книги на сайте www.translate.ru

  1. Подведение итогов (3 мин)
  2. Домашнее задание (1 мин)

§4.5, вопросы и задания 1–7 к параграфу.

По теме: методические разработки, презентации и конспекты

Презентация к уроку в 10 классе базового курса УМК Угриновича Н.Д.

Практическая работа«Компьютерные словари и системы машинного перевода текста»1. Открыть Электронный словарь на сайте www.ver-dict.ru или по выбору.2.

Разработка урока на тему "Компьютерные переводчики. Системы распознавания текста"Урок предназначен помочь учащимся получить представление об компьютерных словарях и системах машинного перевода текста.

Данная практическая работа позволяет освоить первоначальные навыки работы с текстом в текстовом редакторе Microsoft Office Word.

ДЛя изучения текстового редактора составлен блок, в который входят 5 практических работ. Первая работа включает в себя оформление документа, форматирование текста.

Читайте также:  Как увеличить громкость динамика на iphone

Тема урока: «Системы перевода и распознавания текста. Примеры деловой переписки, учебной публикации (доклад, реферат). Образовательные области приоритетного освоения: информатика и ИКТ, общество.

Создание туристического маршрута по достопримечательностям Краснодарского края (мира) с использованием интернет-ресурсов.

Содержание урока

4.5.1. Программы оптического распознавания документов

4.5.1. Программы оптического распознавания документов

Ключевые слова:

Кроме текстовых процессоров, предназначенных для создания и обработки текстов на компьютере, существует ряд программ, позволяющих автоматизировать работу человека с текстовой информацией.

Очень часто возникает необходимость ввести в компьютер несколько страниц текста из книги, статью из журнала или газеты и т. д. Конечно, можно затратить определённое время и просто набрать этот текст с помощью клавиатуры. Но чем больше исходный текст, тем больше времени будет затрачено на его ввод в память компьютера.

Судите сами. Предположим, кто-то из ваших одноклассников, освоивших клавиатурный тренажёр, может вводить текстовую информацию со скоростью 150 символов в минуту. Выясним, сколько времени ему понадобится для того, чтобы ввести в память компьютера текст романа А. Дюма «Три мушкетёра». Одно из изданий этого романа выполнено на 590 страницах; каждая страница содержит 48 строк, в каждую строку входит в среднем 53 символа.

Вычислим общее количество символов в романе:

590 • 48 • 53 = 1 500 960 символов.

Вычислим время, необходимое для ввода этого массива символов в память компьютера: 1 500 960 : 150 ≈ 10 000 мин. А это приблизительно 167 часов.

При этом мы не обсуждаем вопрос о времени на исправление возможных ошибок при таком способе ввода текста, не принимаем в расчёт усталость человека.

Для ввода текстов в память компьютера с бумажных носителей используют сканеры и программы распознавания символов. Одной из наиболее известных программ такого типа является ABBYY FineReader. Упрощённо работу с подобными программами можно представить так:

1. Бумажный носитель помещается под крышку сканера.
2. В программе отдаётся команда Сканировать и распознать. Сначала создаётся цифровая копия исходного документа в формате графического изображения. Затем программа анализирует структуру документа, выделяя на его страницах блоки текста, таблицы, картинки и т. п. Строки разбиваются на слова, а слова — на отдельные буквы. После этого программа сравнивает найденные символы с шаблонными изображениями букв и цифр, хранящимися в её памяти. Программа рассматривает различные варианты разделения строк на слова и слов на символы. В программу встроены словари, обеспечивающие более точный анализ и распознавание, а также проверку распознанного текста. Проанализировав огромное число возможных вариантов, программа принимает окончательное решение и выдает пользователю распознанный текст.
3. Распознанный текст переносится в окно текстового редактора (например, Microsoft Word).

Вместо сканера можно использовать цифровой фотоаппарат или камеру мобильного телефона. Например, при работе с книгами в библиотеке вы можете сфотографировать интересующие вас страницы. Скопировав снимки на компьютер, вы можете запустить ABBYY FineReader, распознать тексты и продолжить работу с ними в текстовом процессоре (рис. 4.20).

Следующая страница 4.5.2. Компьютерные словари и программы-переводчики

Презентация была опубликована 4 года назад пользователемКирилл Гаврилов

Похожие презентации

Презентация на тему: " Тема урока: Компьютерные словари и системы машинного перевода текстов. Системы оптического распознавания документов." — Транскрипт:

1 Тема урока: Компьютерные словари и системы машинного перевода текстов. Системы оптического распознавания документов.

2 Цель урока: Познакомиться с компьютерными словарями; Системами машинного перевода текстов; Системами оптического распознавания документов.

3 Компьютерные словари и системы машинного перевода Компьютерные словари и системы машинного перевода

4 Как вы думаете, для чего нужны словари? Словари нужны для перевода текста с одного языка на другой

5 Первые словари были созданы 5 тысяч лет назад в Шумере и представляли собой глиняные таблички, разделённые на две части. В одной части записывалось слово на шумерском языке, а в другой — аналогичное по значению слово на другом языке.

6 Современные словари построены по такому же принципу. В настоящее время существуют тысячи словарей для перевода между сотнями языков (англо-русский, немецко- французский, и т.д.).

7 Дополнительные возможности компьютерных словарей компьютерные словари многоязычны, дают возможность выбрать языки (н-р: англо-русский, испано-русский и т.д.)компьютерные словари многоязычны, дают возможность выбрать языки (н-р: англо-русский, испано-русский и т.д.) кроме общеупотребительных слов содержат десятки специализированных словарей (техника, медицина, информатика, и др.).кроме общеупотребительных слов содержат десятки специализированных словарей (техника, медицина, информатика, и др.). «быстрый набор», когда в процессе набора слова возникает список похожих слов.«быстрый набор», когда в процессе набора слова возникает список похожих слов. словари могут быть мультимедийными, т.е. прослушивание слов в исполнении дикторов.словари могут быть мультимедийными, т.е. прослушивание слов в исполнении дикторов.

8 Системы машинного перевода текстов Системы машинного перевода текстов

9 Для обмена документами между людьми и организациями, находящимися в разных странах мира и говорящих на разных языках перевод «вручную» тормозит развитие межнациональных контактов. Перевод многостраничной документации вручную требует длительного времени и высокой оплаты труда переводчиков.

10 Системы машинного перевода позволяют решить эти проблемы. Они способны переводить многостраничные документы с высокой скоростью (одна страница в секунду). Системы машинного перевода осуществляют перевод текстов, основываясь на формальном «знании» языка и использовании словарей.

11 Системы оптического распознавания документов Системы оптического распознавания документов

12 С помощью чего мы получаем изображение страницы текста в графическом файле? С помощью СКАНЕРА

13 Сначала изображение страницы разделяется на изображение отдельных символов. Затем каждый из них накладывается на шаблоны символов, и выбирается шаблон с наименьшим количеством отличных от входного изображения точек.

14 Если документ с низким качеством печати, то символ распознаётся по наличию в них определённых элементов (отрезков, колец, дуг, и т.д.)

Ссылка на основную публикацию
Протокол udp используется для
Чем отличается протокол TCP от UDP, простым языком Чем отличается протокол TCP от UDP, простым языком Чем отличается протокол TCP...
Программа для windows телевизор
Популярный проигрыватель для компьютера, который воспроизводит фильмы, аудио с множества телевизионных спутниковых каналов. Он проигрывает медиа в высоком качестве и...
Программа для айфона где находится человек
Современные телефоны iPhone – элегантные, многофункциональные и дорогостоящие устройства, которые пользуются высокой популярностью. И не только у покупателей, но и...
Протокол интернета версии 4 byfly
Главная Новости Рекомендации пользователям Настройка оборудования и ПО "Мультискрин" от Ростелеком Настройки маршрутизаторов для FTTB Технология FTTC (VDSL) Настройки ADSL...
Adblock detector