4. Машинный перевод - Системантика
.RU

4. Машинный перевод - Системантика


^ 4. Машинный перевод

Под переводом понимается смысловое преобразование текста с одного языка (естественного или искусственного) на другой. В основе любого перевода лежит моделирование речевой деятельности человека. Она состоит из двух взаимосвязанных и взаимопроникающих аспектов. Один аспект представляет знания субъекта речевой деятельности о мире, о реальности и о себе. Другой аспект представляет его знания о языке, на котором практически реализуется языковая коммуникация. В процессе общения задействуются их части, касающиеся предмета разговора. Обобщенная функциональная технология любого перевода в инвариантном к языкам виде может быть схематично представлена абстрактной блок-схемой (рис. 93).




Рис. 93. Общая блок-схема дедуктивного машинного перевода


Машинный перевод – это выполнение показанных функций с помощью вычислительной техники. Традиционно он делится на два вида: дедуктивный и индуктивный.

Дедуктивный машинный перевод базируется на модели «текст – смысл – текст», основанной на пословной лексике и грамматических правилах. Такой перевод при сравнительно небольших словарях требует моделировать сложные грамматические процессы речевой деятельности человека.

Моделью индуктивного перевода является модель «текст – текст». Он осуществляется на переводных соответствиях фраз и выражений. Переводным соответствием называют пару, образованную отрезком входного текста и отрезком выходного текста, между которыми существует отношение смысловой эквивалентности. Это могут быть отдельные слова, словосочетания, фразы и возможно более длинные контекстные выражения. Переводное соответствие можно понимать как единицу перевода, взятую в динамике трансляционного процесса, различаемую в условиях конкретного текста, в рамках данной пары языков. В таком переводе основной переводной единицей выступают фразы, которые, с одной стороны, естественны для двуязычного общения людей, но, с другой стороны, требуют больших фразеологических словарей. Следует иметь в виду, что природе естественного языка присуща универсальная соразмерность сложности грамматических правил и объемов унитермных грамматических словарей. Для перевода текстов конкретных предметных областей упрощение грамматических правил вызывает необходимость существенного увеличения объемов фразеологических словарей. Для преодоления возникающей коллизии идут по пути объединения индуктивного и дедуктивного методов, обеспечивающих сочетание пословного и фразеологического перевода. В них доминантными единицами перевода выступают фразы. Но если при фразеологическом переводе остаются не охваченные эталонной фразой непереведенные слова, что влияет на качество перевода, то возможен и пословный перевод. Для таких систем машинного перевода кроме фразеологического словаря необходим и пословный.

В качестве примера такой системы можно привести систему RETRANS, находящуюся в промышленной эксплуатации1.

Система RETRANS построена на индуктивно-дедуктивном принципе фразеологического машинного перевода с автоматическим составлением двуязычных фразеологических машинных словарей по текстам, которые являются переводами друг друга (по биллингам). Созданы русско-английский и англо-русский политематические фразеологические машинные словари объемом 2,6 миллиона словарных статей или словари на бумажных носителях объемом 80 томов по 1 000 страниц каждый. При установленной необходимости повышения точности перевода после фразеологической фильтрации по кодам система аналогичным образом, автоматически по тексту выделяет непереведенные слова, составляет пословные словари и отождествляет по ним отдельные слова переводимого текста также по кодам.

Коды выступают единым целостным машинным носителем смысла переводимого двуязычного текста, а словари при этом выполняют роль смысловых фильтров.

^ 5. Индексирование документов и запросов

Процесс перевода основного содержания документа и запроса с естественного языка на информационно-поисковый с одновременным свертыванием текста при максимальном сохранении смысла получил название индексирования. Иными словами, индексирование – это выражение центральной темы текста средствами информационно-поискового языка, процесс составления поискового образа документа и запроса.

Процесс составления поисковых образов документов состоит из двух этапов:

1) анализ содержания документа и выявление главной темы (ключевых слов);

2) выбор терминов, входящих в поисковые образы документов (замена ключевых слов терминами информационно-поискового языка).

Анализ содержания документа проводится в определенной последовательности по единой схеме. Схема способствует повышению качества и постоянства индексирования. Выявление содержащейся в документе информации проводится по следующим смысловым аспектам:

определение предмета или темы;

описание основных характеристик предмета;

установление элементов предмета и их отношений;

установление связей предмета с другими предметами;

установление области применения предмета.

Эти смысловые аспекты составляют элементы формализованной модели свернутого содержания документа. В соответствии с этими смысловыми аспектами осуществляется выбор ключевых слов.

Выбор терминов, входящих в поисковые образы документов, находится в зависимости от принятого информационно-поискового языка. Наиболее распространенными являются языки классификационного и дескрипторного типа или их комбинации.

Процесс индексирования с помощью классификации представляет собой процесс соотнесения содержания текста документа со смысловым содержанием рубрик классификатора. При этом возможна замена выделенных ключевых понятий синонимичными или нижестоящими и вышестоящими. Подобный процесс выполняется для каждого выделенного понятия. Отождествленные с ключевыми понятиями рубрики записываются в поисковый образ документа (см. рис. 94).

Методика индексирования запросов определяется типом запроса и характером информации, ожидаемой в качестве ответа. В этом смысле выделяют два типа запросов:

1) запросы, ориентированные на получение информации по определенному предмету с указанием интересующих характеристик – так называемые многоаспектные узкоспециализированные запросы;

2) запросы обобщающего или обзорного типа, ориентированные на получение информации по группе предметов или по какой-либо теме.

Методика индексирования запросов первой группы мало чем отличается от методики индексирования документов. Методика индексирования запросов второй группы состоит в разбиении запроса на подзапросы с их последующим индексированием и объединением результатов в один поисковый образ.

Аналогичны процедуры индексирования на языке дескрипторного типа.



Рис. 94. Схема индексирования на классификационных ИПЯ



4-obshie-polozheniya-41-obshaya-harakteristika-specialnosti-obrazovatelnij-standart-respubliki-belarus.html
4-obshie-polozheniya-normi-tehnologicheskogo-proektirovaniya-gorodskie-i-selskie-telefonnie-seti-rd-45-120-2000-ntp.html
4-obshie-polozheniya-t-ivnih-dokumentov-v-stroitelstve.html
4-obshie-trebovaniya-k-razrabotke-osnovnoj-professionalnoj-obrazovatelnoj.html
4-obsluzhivanie-klienta-s-ispolzovaniem-sistemi-internetbank2-instrukciya-159-ot-02-06-2010-pravila-otkritiya.html
4-obzhalovanie-dejstvij-bezdejstviya-i-reshenij-dolzhnostnih-lic.html
  • reading.bystrickaya.ru/kontrolnaya-rabota-1-terminologicheskaya-po-kursu-vvedenie-v-teoriyu-zhurnalistiki-termin-intervyu.html
  • crib.bystrickaya.ru/govoryat-chto-realizaciyu-poslaniya-prezidenta-tormozit-krizis-novosti-pervij-kanal-29-11-2008-12-00-8.html
  • ucheba.bystrickaya.ru/programma-obucheniya-discipline-f-so-pgu-18-207-dlya-studentov-ministerstvo-obrazovaniya-i-nauki-respubliki-kazahstan.html
  • spur.bystrickaya.ru/malm-ijlibaj-dinara-balashizi-kn-12-03-2015-sinibi-6-tairibi.html
  • uchitel.bystrickaya.ru/rabochaya-programma-professionalnogo-modulya-organizaciya-pitaniya-v-organizaciyah-obshestvennogo-pitaniya-2011-g.html
  • composition.bystrickaya.ru/pochvenno-landshaftnoe-proektirovanie-obshaya-trudoemkost-disciplini-sostavlyaet.html
  • otsenki.bystrickaya.ru/soglashajsya-rasskazchik.html
  • literature.bystrickaya.ru/charlz-uebster-ledbiter.html
  • tasks.bystrickaya.ru/12-obespechenie-bezopasnosti-uchebnij-plan-21-rabota-pedagogicheskogo-kollektiva-nad-edinoj-metodicheskoj-temoj-34.html
  • teacher.bystrickaya.ru/glava-3psihologicheskie-traktovki-religii-posobie-podgotovleno-na-kafedre-filosofii-sootvetstvuet-programme-disciplini.html
  • write.bystrickaya.ru/glava3zhivotnovodstvo-pervobitnih-obshin-rabovladelcheskogo-obshestva-feodalnoj-epohi.html
  • laboratornaya.bystrickaya.ru/programmi-razvitie-melioracii-selskohozyajstvennih-zemel-v-respublike-mordoviya-na-period-do-2020-goda-pravitelstvo-respubliki-mordoviya-postanovlyaet-stranica-9.html
  • predmet.bystrickaya.ru/sposobi-psihologicheskoj-zashiti-chast-3.html
  • teacher.bystrickaya.ru/glava-ix-narodnoe-vosstanie-v-indii-v-18571859-gg-predislovie-k-tretemu-izdaniyu.html
  • kanikulyi.bystrickaya.ru/ya-znayu-proizvedeniya-a-s-pushkina-i-lyublyu-ih.html
  • lesson.bystrickaya.ru/uchebno-metodicheskij-kompleks-kak-sredstvo-realizacii-innovacionnoj-modeli-uchebnih-i-proizvodstvennih-praktik-studentov-hudozhestvenno-graficheskih-fakultetov-pedvuzov.html
  • literatura.bystrickaya.ru/reformirovaniya-sistemi-finansirovaniya-uchrezhdenij-socialnogo-obsluzhivaniya-a-r-shafigullina-na-kollegii-13-fevralya-2008g.html
  • teacher.bystrickaya.ru/glava-9-kniga-pervaya-ujti-chtobi-vizhit.html
  • teacher.bystrickaya.ru/glava-3-voennie-tajni-lubyanskaya-prestupnaya-gruppirovka.html
  • thescience.bystrickaya.ru/ispanskaya-falanga-vremyon-hose-antonio-primo-de-rivera-punkt-404-stranica-9.html
  • exchangerate.bystrickaya.ru/faktori-i-psihologicheskie-mehanizmi-vospriyatiya.html
  • tetrad.bystrickaya.ru/uchebnoe-posobie-moskva-2003-tema-marketing-kak-faktor-konkurentosposobnosti-firmi-voprosi-1-marketing-i-konkurenciya-tipologiya-konkurentov-2-tipologiya-konkurentnih-situacij-stranica-14.html
  • shpargalka.bystrickaya.ru/uchebno-metodicheskij-kompleks-po-discipline-fizicheskaya-kultura-1-kurs-nazvanie-stranica-4.html
  • knigi.bystrickaya.ru/soderzhanie-voennoplennih-v-sibiri-o-f-gordeev.html
  • esse.bystrickaya.ru/rabochaya-programma-uchebnoj-disciplini-nagnetatelnie-i-rasshiritelnie-mashini-cikl.html
  • exchangerate.bystrickaya.ru/100-velikih-gorodov-miramoskva-veche2007-477s100-velikih-stranica-15.html
  • desk.bystrickaya.ru/otchet-o-provedenii-nauchnoj-sessii-po-itogam-nauchno-issledovatelskoj-raboti-mpgu-za-2011-god-na-fakultete-pedagogiki-i-psihologii-stranica-2.html
  • letter.bystrickaya.ru/metrologiya-standartizaciya-i-sertifikaciya-3.html
  • lecture.bystrickaya.ru/a-otskat-obndevet-zanteresovat-metodicheskie-ukazaniya-k-izucheniyu-kursa-dlya-studentov-nefilologicheskih.html
  • lecture.bystrickaya.ru/b-p-sheremetev-i-a-d-menshikov.html
  • tasks.bystrickaya.ru/211-tehnologiya-prikaz-783-ot-24-07-2011g-obrazovatelnaya-programma-nachalnogo-obshego-obrazovaniya-municipalnogo.html
  • education.bystrickaya.ru/3-poryadok-provedeniya-antikorrupcionnoj-ekspertizi-proektov-pravovih-aktov-vtorogo-urovnya.html
  • letter.bystrickaya.ru/obuchenie-inostrannomu-yaziku-doshkolnikov.html
  • studies.bystrickaya.ru/lekciya-6-tema-chastotnie-harakteristiki-diskretnih-sistem-konspekt-lekcij-dlya-studentov-napravleniya-550200.html
  • institute.bystrickaya.ru/glava-2-vsemirnij-potop-i-atlantida-pravda-ili-mif-v-yu-koneles-soshedshie-s-nebes-i-sotvorivshie-lyudej.html
  • © bystrickaya.ru
    Мобильный рефератник - для мобильных людей.