цены на корректуру текста в Kenaz
Преимущества редактирования и корректуры текстов в агентстве Kenaz
Хотите быть уверенными, что ваш перевод выполнен качественно и безупречно? В агентстве переводов Kenaz специалисты тщательно анализируют все материалы с точки зрения языковых правил, единообразия стилистики, точности в передаче смысла исходного текста.
Профессиональная редактура текста имеет свои особенности, в зависимости от направления.
Литературное редактирование: при переводе книги или статьи важно стремиться к легкости в восприятии текста читателем, сохранить слог автора, передать образы и общий смысл текста.
Пруфридинг спецификаций и документов: редакторская вычитка технических, юридических и других документов, насыщенных терминами и профессиональной лексикой, позволяет вовремя выявить неточности и расхождения.
Редактирование и корректура визуального контента: графические элементы презентации, релиза, рекламы и видео нуждаются в переводе и адаптации. Корректура визуальных материалов предусматривает их анализ на соответствие языковым особенностям целевой страны и последующую локализацию.
Почему вычитка текста — важный этап перевода
Переводы компании Kenaz проходят контроль качества на всех этапах. Услуги корректора и редактора помогают не только вовремя выявить и устранить ошибки орфографии и пунктуации, но и добиться единой стилистики, точности в терминологии, согласованности текстовых блоков между собой. Информация должна быть представлена последовательно и логично. Работа над композицией текста позволяет добиться согласования его частей между собой, гармоничности изложения и легкости восприятия.
Рекомендации по стилистике
Профессиональный подход в редактуре предполагает анализ текста с точки зрения единого стиля, который является оптимальным для предметной области. Разбор лексики поможет оценить корректность использования слов и выражений.
Точность и единообразие
Материалы от начала до конца должны быть приведены к единому стандарту — использование специальных символов, знаков, терминов.
Анализ текста на информативность
Отсутствие «воды» — важный показатель качества текста. Перегруженность лишними лингвистическими конструкциями, повторениями, штампами, не несущими в себе особой смысловой нагрузки, снижают информативность текста.
Контрольная вычитка
На завершающем этапе все материалы проходят проверку с учетом всех обозначенных ранее рекомендаций. Конечный продукт должен соответствовать требованиям отрасли и исходным условиям заказчика.
Формирование навыков смыслового чтения на уроках русского языка и литературы
Утверждение федеральных государственных образовательных стандартов нового поколения предусматривает изменения в структуре и содержании образовательного процесса, а также изменение требований, предъявляемых к деятельности самого учителя. Сегодня учитель ставится перед необходимостью реализовывать системно-деятельностный подход в преподавании. Предпочтение отдается методам обучения, которые помогают освоить универсальные способы деятельности: познавательные, регулятивные, личностные и коммуникативные. Необходимо создать условия для развития мышления, творческого воображения, интуиции, речи, умений объяснять и рассуждать. Все эти условия может обеспечить работа с текстом на уроках русского языка и литературы. Конечно, разнообразные методы и приемы работы с текстом педагоги применяли всегда. С начальной школы детей учили составлять план текста, пересказывать его в соответствии с планом, находить ключевые слова и т.п. Обращение к понятию смыслового чтения связано, прежде всего, с переосмыслением технологии работы с текстами. Мы говорим: дети мало читают, не понимают прочитанное, имеют маленький словарный запас, не всегда грамотно выстраивают свою речь. Мотивировать учащихся, направлять их на осмысленное и увлеченное чтение — задачи, которые может решить применение технологии смыслового чтения.
Формирование смыслового чтения — процесс сложный. Известно, что чтение складывается из технического умения читать и смыслового. К окончанию начальной школы дети успешно овладевают навыками технического чтения, способами, темпом, правильностью, выразительностью. Навыки смыслового чтения формируются и развиваются не только в среднем и старшем звене школ, но и в дальнейшем вузовском образовании. В современном мире мало овладеть только техническим чтением, так как оно только обслуживает смысловое чтение, требующее понимания содержания прочитанного.
При формировании навыков смыслового чтения существует ряд проблем: учащиеся не всегда понимают формулировку задания, т.е. не умеют вчитываться в текст, имеется узкий круг современной качественной литературы для самостоятельного чтения, учитель использует традиционные технологии обучения, низкий уровень читательской культуры родителей учащихся и т.п.
Исходя из документов, в том числе и из нового ФГОС и примерных программ по литературе, а также ориентируясь на требования к компетентностям выпускников, можно выделить следующие умения в рамках смыслового чтения:
- умение осмысливать цели чтения;
- умение выбирать вид чтения в зависимости от цели;
- умение извлекать необходимую информацию из прочитанного;
- умение различать основную и второстепенную информацию;
- умение свободно ориентироваться и различать тексты разных стилей;
- умение понимать и адекватно оценивать языковые средства в текстах разных стилей и т.
п.
К основным видам чтения относятся ознакомительное, поисковое, изучающее и вдумчивое чтения. В старшем звене на уроках русского языка и литературы мы сталкиваемся практически со всеми видами смыслового чтения.
Ученые выделяют различные способы смыслового чтения: аналитический или структурный, синтетический или интепретационный и критический или оценочный. К окончанию 2 ступени учащиеся в той или иной мере должны овладеть навыками всех названных способов. В 3 ступени перед выпускниками и педагогом стоит задача углубления сформированных компетенций как предметных, так и метапредметных. Необходимо выработать у учащихся привычку начинать чтение с заглавия текста, прочитывать предисловие, оглавление, если таковые имеются.
Как установили ученые, на успеваемость ученика влияет около 200 факторов. Фактор №1 — это навык чтения, который гораздо сильнее влияет на успеваемость, чем все вместе взятые. Исследования показывают: для того, чтобы быть компетентным, человек должен читать 120-150 слов в минуту.
Процесс чтения состоит из трех фаз.
Первая — это восприятие текста, раскрытие его содержания и смысла, своеобразная расшифровка, когда из отдельных слов, фраз, предложений складывается общее содержание. В этом случае чтение включает: просмотр, установление значений слов, нахождение соответствий, узнавание фактов, анализ сюжета и фабулы, воспроизведение и пересказ.
Вторая — это извлечение смысла, объяснение найденных фактов с помощью привлечения имеющихся знаний, интерпретация текста. Здесь происходит упорядочивание и классифицирование, объяснение и суммирование, различение, сравнение и сопоставление, группировка, анализ и обобщение, соотнесение с собственным опытом, размышление над контекстом и выводами.
Третья — это создание собственного нового смысла, то есть ― присвоение добытых новых знаний как собственных в результате размышления. Те, кто останавливается на первой фазе чтения, читают репродуктивно, механически воспроизводят содержание, пересказывают факты и фабулу. Когда-то этого было достаточно для получения образования.
Одним из путей развития читательской грамотности является стратегиальный подход к обучению смысловому чтению. Смысловое чтение — вид чтения, которое нацелено на понимание читающим смыслового содержания текста. В концепции универсальных учебных действий (Асмолов А.Г., Бурменская Г.В., Володарская И.А. и др.) выделены действия смыслового чтения, связанные:
- с осмыслением цели и выбором вида чтения в зависимости от коммуникативной задачи;
- определением основной и второстепенной информации;
- формулированием проблемы и главной идеи текста.
Для смыслового понимания недостаточно просто прочесть текст, необходимо дать оценку информации, откликнуться на содержание.
Поскольку чтение является метапредметным навыком, то составляющие его части будут в структуре всех универсальных учебных действий:
- в личностные УУД входят мотивация чтения, мотивы учения, отношение к себе и к школе;
- в регулятивные УУД — принятие учеником учебной задачи, произвольная регуляция деятельности;
- в познавательные УУД — логическое и абстрактное мышление, оперативная память, творческое воображение, концентрация внимания, объем словаря.
Как помочь ребенку овладеть этой компетенцией?
«Стратегии смыслового чтения» — различные комбинации приемов, которые используют учащиеся для восприятия графически оформленной текстовой информации, а также ее переработки в личностно-смысловые установки в соответствии с коммуникативно-познавательной задачей.
Стратегия смыслового чтения обеспечивает понимание текста за счёт овладения приемами его освоения на этапах до чтения, во время чтения и после чтения.
Технология включает в себя три этапа работы с текстомI этап. Работа с текстом до чтенияАнтиципация (предвосхищение, предугадывание предстоящего чтения). Определение смысловой, тематической, эмоциональной направленности текста, выделение его героев по названию произведения, имени автора, ключевым словам, предшествующей тексту иллюстрации с опорой на читательский опыт.
Постановка целей урока с учетом общей готовности учащихся к работе.
1.Первичное чтение текста. Самостоятельное чтение в классе или чтение — слушание, или комбинированное чтение (на выбор учителя) в соответствии с особенностями текста, возрастными и индивидуальными возможностями учащихся. Выявление первичного восприятия. Выявление совпадений первоначальных предположений учащихся с содержанием, эмоциональной окраской прочитанного текста.
Перечитывание текста. Медленное «вдумчивое» повторное чтение (всего текста или его отдельных фрагментов).
Анализ текста (приемы: диалог с автором через текст, комментированное чтение, беседа по прочитанному, выделение ключевых слов, предложений, абзацев, смысловых частей и проч.). Постановка уточняющего вопроса к каждой смысловой части.
Беседа по содержанию текста. Обобщение прочитанного. Постановка к тексту обобщающих вопросов. Обращение (в случае необходимости) к отдельным фрагментам текста.
Выразительное чтение.
III этап. Работа с текстом после чтения1.Концептуальная (смысловая) беседа по тексту. Коллективное обсуждение прочитанного, дискуссия. Соотнесение читательских интерпретаций (истолкований, оценок) произведения с авторской позицией. Выявление и формулирование основной идеи текста или совокупности его главных смыслов.
2.Знакомство с писателем. Рассказ о писателе. Беседа о личности писателя. Работа с материалами учебника, дополнительными источниками.
3.Работа с заглавием, иллюстрациями. Обсуждение смысла заглавия. Обращение учащихся к готовым иллюстрациям. Соотнесение видения художника с читательским представлением.
1.Творческие задания, опирающиеся на какую-либо сферу читательской деятельности учащихся (эмоции, воображение, осмысление содержания, художественной формы).
Заглавие и ключевые понятия как опорные элементы текста Для более полного восприятия и понимания текста серьезное внимание уделяю рассмотрению основных элементов текста, таким, как заголовок и ключевые понятия. Заголовок концентрирует основную идею, тему произведения, является ключом к его пониманию. Он позволяет осознать первоначальную перспективу, на которую нацеливается читательское понимание, и переосмыслить текст в соответствии с закодированной в нем идеей. Заголовок в высшей степени предвосхищает, обобщает, концентрирует основное содержание текста, выражает его суть, является своеобразным кодом, дешифровка которого открывает возможности «осмысленной» работы читателя с произведением.
Перед чтением любого произведения применяю приём «прогнозирования», то есть ученикам предлагаю сначала ориентировочные действия (рассмотри заглавие, иллюстрации, обрати внимание на жанр, структуру произведения). Затем исполнительные действия по выявлению образного, эмоционального и логического содержания произведения, его формы (учащиеся проводят наблюдение за текстом, поясняют, представляют в своём воображении события, героев, рассуждают, сравнивают факты, эпизоды, выражают своё эмоциональное отношение к ним, выясняют позицию автора и т. д.).
— Как называется рассказ?
— Как вы думаете, о чем будет говориться в рассказе?
— Это тема или идея?
После прочтения рассказа:
— Почему автор так назвал произведение?
Затем ведется работа над ключевыми понятиями, каковыми, прежде всего, являются термины, также рассматривается значение диалектизмов. Сначала учимся находить ключевые слова, а затем — определять их точное значение именно в данном тексте. Поскольку ключевые слова, как правило, многозначны, учимся определять, в каком значении его употребляет автор. Как мы находим в тексте ключевые слова? Объясняю детям, что ключевые слова, это те слова, которые важны и для автора и для читателя и которые автор использует особым способом. Обычное обыденное их использование автору не подходит, поэтому он уделяет этим словам много места в тексте, описывая их, уточняя, сопоставляя с другими авторами, поясняя особенности их использования в разных ситуациях. Обычно, встречая ключевое слово, ученики испытывают затруднения в его понимании из-за его неоднозначности и важности. Эти слова требуют изучения, ради них собственно и пишется текст. Поэтому мы изучаем способы выделения ключевых слов, учимся их использовать при чтении. Ведь опорными пунктами в понимании текста являются ключевые слова, которые несут в данном тексте существенную смысловую нагрузку.
В процессе понимания текста происходит разбивка материала на части, которая вместе с тем есть и группировка материала. Текст разбивается не по внешним каким-либо признакам, а по его смысловому содержанию. Разделение материала на «смысловые куски» основывается на единстве смыслового содержания каждого куска, при этом каждая часть текста объединяется в своеобразный «смысловой пункт». Смысловые пункты выполняют двоякую функцию: «они являются «носителями смысла», к ним относится содержание каждой части, и это улучшает понимание. Вместе с тем они облегчают запоминание. Выделение учениками ключевых, опорных слов, составление вопросов различной степени сложности способствует формированию умения воспроизводить текст с заданной степенью свернутости (план, пересказ, изложение, конспект).
— На какие части (смысловые пункты) можно поделить рассказ?
— Сколько таких смысловых частей в рассказе?
— О чем говорится в 1 (2,3 и т.д.) части рассказа?
— Найдите ключевые (слова, фразы, предложения, абзацы, части) текста?
У читателя создается образ содержания рассказа. Этот образ динамичен, он постоянно развивается, и восприятию этого образа помогают ключевые понятия.
Фрагмент урока. Знакомство с рассказом И.Бунина «Косцы»— Выделите ключевые слова, фразы, предложения в первой смысловой части рассказа.
(«Пели», «бесконечно давно», «не вернется уже вовеки», «косили и пели», «откликался им», «глушь России», «предвечернее время», «старая дорога», «уходила в бесконечную даль», «нет, и не было ни времени, ни деления его на годы, на века», «шли и пели, лес принимал и подхватывал песню»).
— О чем они говорят? Какой образ возникает при их прочтении?
Осмысленное чтение напрямую зависит от сформированности тезауруса.
Великому русскому педагогу К.Д.Ушинскому принадлежат слова: «Дитя, которое не привыкло вникать в смысл слова, темно понимает или вовсе не понимает его настоящего значения и не получило навыка распоряжаться им свободно в устной и письменной речи, всегда будет страдать от этого коренного недостатка при изучении всякого другого предмета». Работа со словом обогащает словарный запас ребёнка, воспитывает внимательное отношение к слову, развивает языковое чутьё, орфографический навык.
Важнейшим моментом работы с текстом является работа с незнакомыми, непонятными словами. Ребята отмечают незнакомую для себя информацию и уточняют значение отдельных слов, обращаясь к различным словарям.
Объясняя новое, непонятное, стараюсь это непонятное объяснить через известное, используя для этого уже имеющиеся у ребят знания. Сочетание знакомых и новых понятий и приводит к образованию нового понятия. Объясняю детям, что значение и смысл может рассматриваться прямо в тексте. Автор может выделить это слово через подчеркивание или шрифт, дав ему собственное конкретное определение. В этом случае полезно, особенно в старших классах, обращаться к интерпретации понятий другими авторами. Для этого также мы используем для работы словари, энциклопедии, справочную литературу.
В произведениях художественной литературы с точки зрения нравственной проблематики ключевыми являются понятия, определяющие вечные ценности: «красота», «добро», «любовь», «честь», «патриотизм» и т.д. С точки зрения литературоведения — «сюжет», «композиция», «жанр», «идея» и т.д. Таким образом, помогут выделить ключевые слова, описанные выше приемы работы с текстом: работа с заголовком, определение идеи, структуры, проблемы изучаемого текста. Внутренние заголовки и предисловия также могут быть полезны.
Следующим способом смыслового чтения является выделение ключевых (наиболее важных) предложений в тексте и определение утверждений, которые они содержат. Затем выделение ключевых абзацев, как системы предложений, объединенных общими утверждениями (аргументами) по поводу сути текстовой информации. Объясняю ребятам, что первый и последний абзац содержат основной смысл текста (утверждения) и выводы. В оставшейся части содержатся, как правило, аргументы к утверждению. Начальные предложения абзацев так же как и ключевые слова содержат основную информацию. Эти предложения помогают понять изменения в содержании текста: ставится ли новый вопрос, новая задача, разъясняется ли ранее описанное свойство явления, факты, события, подводятся ли итоги, делаются ли выводы?
Иногда авторы сами выделяют важные предложения в виде подчеркиваний, вопросов, шрифта, пунктов, глав и пр. Поэтому учу детей видеть эти авторские сигналы и не оставлять их без внимания. Еще один шаг к поиску важных предложений — это слова, из которых они состоят.
Выделенные ключевые слова приводят читателя к предложениям, заслуживающим дальнейшего внимания, то есть интерпретации. Одним из лучших способов понимания утверждений автора — передача прочитанного утверждения своими словами. При этом свои слова — это не копия оригинала, а повторении авторской мысли в другой формулировке, которая будет являться рефлексией читателя на высказанные в тексте утверждения. Если человек владеет содержанием только в виде заученных формулировок, значит, он не осознал смысл прочитанного. Для проверки понимания смысла прочитанного предлагаю обучающимся задания:
Расскажите о собственном опыте, связанном каким-либо образом с утверждением автора?
Можете ли привести пример по теме высказывания?
Проведите опыт, подтверждающий научное высказывание. Если это возможно, найдите в тексте те абзацы, которые содержат подтверждения и основные аргументы к ним. Если аргументы изложены по-другому, попробуйте построить их, используя при этом предложения из разных абзацев.
Найдите абзац, в котором содержится вывод, и подтвердите его основаниями из текста.
Переформулируйте определения, правила, выводы, переведите прочитанное на «свой» язык;
Представьте основное содержание текста в виде плана, схемы, таблицы, рисунков;
Потренируйтесь в запоминании прочитанного (пересказ, повторение определений, правил).
После чтения текста предлагаю обучающимся такое задание: заполните таблицу:
Ключевые слова | Смысловые предложения | Основной смысл текста |
— Сосчитайте количество слов, позволяющих вам изложить основной смысл текста, и сравните его с количеством слов в первоначальном варианте текста.
Неотъемлемым компонентом смыслового чтения является конструктивное обсуждение изучаемого текста. Одним из эффективных методов являются дискуссии, упражнение в мастерстве мышления и коммуникации. Бэкон сказал: «Чтение делает человека знающим, беседа — находчивым, а привычка записывать — точным». При чтении можно использовать заметки как акт мышления. При попытке осознать структуру книги делаем несколько пробных набросков по основным её частям, пока не появится целостная картина. Для выделения основных мыслей используем всевозможные схемы и диаграммы. Подчеркиваем ключевые слова и предложения по мере их появления в тексте, фиксируем противоречия, если таковые имеются в тексте и пр.
Процесс чтения завершается формированием собственного критического мнения. Объясняю детям, что критическое мнение не означает несогласие. Оно означает собственное отношение к содержанию текста, которое может, как совпадать с авторским, так и не совпадать. Обязательным условием критического отношения должно быть полное понимание текста с позиции автора. Там, где отсутствует понимание, бессмысленны и неумны будут любые утверждения и отрицания читателя.
Чтение художественной литературы имеет ряд специфических правил. Об этих правилах беседуем с ребятами, учу их находить различия научной и художественной литературы. Объясняю им, что наиболее очевидное различие касается целей. Основная цель научных книг — обучать читателей, предназначение художественных — дарить наслаждение, создавать настроение, воспроизводя то, что невозможно сообщить. Кроме того, при чтении научных книг преобладает мыслительная деятельность, а при художественной — воображение. Читая текст, мы видим сообщение, тогда как на самом деле автор создает целостную и многогранную эмоцию. В этом и состоит волшебство художественного слова. Разность целей порождает разность языка. Автор художественного произведения стремится вложить в свои слова как можно больше скрытых символов, чтобы достичь богатства и силы образов. Он видит в метафорах «строительный материал», а ученый ценит в словах точность выражений, обеспечивающую ясность и однозначность понимания. В художественной литературе много скрытого смысла, того, что остается «между строк». Причем этот смысл более обширен, чем значение всех слов текста в отдельности. А отсюда особенности чтения художественного произведения: в них зачастую трудно выделить главную мысль, найти термины, утверждения и аргументы, они не подчиняются критериям правдивости и последовательности. Кроме того, трудно вывести общие правила чтения художественной литературы. Каждый жанр имеет свои особенности, и каждый автор создает свой уникальный мир своими уникальными средствами. Несмотря на это и в чтении художественной литературы выделяем некоторые общие способы, которым должен владеть читатель:
1. Определить жанр произведения — роман, пьеса, стихи и т.д.
2. Научиться воспринимать всю книгу в ее целостности, только тогда можно изложить её суть в одном-двух предложениях, что возможно только при условии знания сюжета.
3. Понять, каким образом из детализации характеров персонажей и событий автор создает целостный образ собственного отношения к какому-либо объекту, явлению или событию, как поддерживает и нагнетает напряжение у читателя.
Следующие умения касаются интерпретирующего чтения
1. Понять особенности фабулы и героев. Единицы художественной литературы — это эпизоды и события, персонажи и их мысли, слова и чувства, сомнения и поступки. Оперируя этими элементами, писатель рассказывает свою историю. И эти элементы становятся аналогами научных текстов в художественном тексте.
2. Осознать фон, т.е. единое время и место действия. Понять эпоху, общественные (экономические, политические, правовые, моральные, научные, искусства и религии) и личностные (любовь, дружба, отцы и дети и пр.) противоречия, которые отразил автор в своем произведении. Этот подход помогает обнаружить связи и функции всех эпизодов, поступков героев, использованных художественно-изобразительных средств, понять, что утверждает автор описываемым им образом.
3. Проанализировать аргументацию автором своих утверждений. В отличие от научной литературы, где аргументами являются факты и выводы, в художественной литературе они кроются в эволюции сюжета. Аристотель говорил, что в сюжете заключена душа повествования. Преимущественно эти правила касаются романов и пьес, так как суть поэзии заключается в другом, а имен: в переживаниях автора, хотя лирические произведения также могут иметь повествования.
Знакомлю обучающихся со способами критического прочтения художественной литературы. Объясняю им, что критическое суждение в данном случае, прежде всего, носит субъективный характер. О вкусах не спорят, но критические суждения можно опровергать и оспаривать. А для этого должно оценивать книгу с позиций эстетических и литературных принципов. Чтобы составить мнение о художественном произведении предлагаю учащимся следующие вопросы:
1. Насколько это произведение целостно?
2. Насколько сложна структура частей и элементов, составляющих целое?
3. Правдоподобна ли эта история, то есть, обладает ли она художественной реалистичностью?
4. Затрагивает ли она ваши эмоции, вызывает ли переживания, будит ли ваше воображение?
5. Ощущаете ли вы жизнь во всей ее полноте, читая книгу.
Формирую у школьников способности не просто пересказывать текст, но и учу выражать свое отношение к прочитанному, давать оценку той информации, которую он получил, оценивать героев произведения. Учу школьников вступать в диалог с автором текста, спорить с ним или соглашаться с его мнением, учу строить свой, авторизованный текст. С этой целью предлагаю обучающимся участвовать в дискуссии, составлять характеристики героев, делать аннотацию любимой книги. Мои обучающиеся сочиняют стихи, загадки, пишут сказки, готовят сообщения, доклады, участвуют в читательских и научно — практических конференциях и заочных экскурсиях, готовят мультимедийные презентации.
На уроках русского языка и литературы школьники учатся задавать вопросы разного уровня сложности, делать выводы, составлять тезисы (выделять главную, существенную и второстепенную информацию). Они умеют составлять план (простой или сложный), перекодировать полученную информацию в графических схемах, выделяя и определяя все взаимные логические связи и операции между единицами информации, описывать и комментировать все свои действия, давать оценку выявленной информации.
Через книгу ребенок воспринимает различные модели поведения (умение дружить, добиваться своей цели, решать конфликты), которые могут быть эффективными в различных жизненных ситуациях. Наибольший эффект может быть достигнут, если чтение дополняется также совместным обсуждением. Это может помочь ребенку увидеть аналогии прочитанного в собственной жизни.
показывать: 10255075100200 1—10 из 458
Ларс VS человечество
прямая ссылка 25 ноября 2008 | 18:47
прямая ссылка 21 февраля 2008 | 03:57
прямая ссылка 25 октября 2011 | 09:26
прямая ссылка 06 июля 2007 | 14:46
прямая ссылка 16 апреля 2008 | 12:19
прямая ссылка 06 апреля 2007 | 19:11
При мне резали правду-матку
прямая ссылка 07 августа 2008 | 19:18
После подобных фильмов начинаешь ненавидеть людей…
прямая ссылка 02 марта 2008 | 01:28
Этот город нарисован мелом на полу
прямая ссылка 30 июня 2011 | 19:31
Препарация провинциальной жизни
прямая ссылка 25 сентября 2008 | 21:36показывать: 10255075100200 1—10 из 458 |
У истоков психолингвистики стояли следующие ученые XIX в.

(*ответ*) В. фон Гумбольдт
(*ответ*) Г. Штейнталь
(*ответ*) А.А. Потебня
А. Шляйхер
А.Х.Востоков
Уровень языковой – это
(*ответ*) одна из подсистем языка, совокупность однородных элементов с общими функциями
совокупность разнородных элементов с общим значением
группа единиц, противопоставленных в системе языка
способность единиц языка выполнять различные функции в речи
Установите соответствие:
Последовательность двух или более единиц языка (морфем, словосочетаний, предложений), организованная по законам данного языка, — Класс единиц языка, объединенных по общему признаку и противопоставленных друг другу в системе отношений по другому признаку, а также система форм одного слова – Минимальная единица речи, относящаяся к фонетическому уровню и являющаяся результатом артикуляторных действий человека, — Установите соответствие:
Минимальная единица языка, служащая для различения и распознавания значимых единиц языка – морфем, — Минимальная значимая единица речи, непосредственно составляющая слова и словоформы, — Минимальная значимая единица языка, в которой за определенной фонетической формой закреплено определенное значение, — Установите соответствие:
Слово (лексема) в одной из грамматических форм, единица речи, составляющая словосочетания и предложения, — Единица словарного состава языка в совокупности его грамматических форм (словоформ) и смысловых вариантов – Содержание слова, отображающее в сознании и закрепляющее в нем представление о предмете, свойстве, процессе, явлении, — Установите соответствие:
Единица языка, представляющая один из элементов морфологической или синтаксической парадигмы, — Отвлеченное языковое значение, присущее ряду словоформ, синтаксических конструкций и находящее в языке свое регулярное выражение, — Синтаксическая конструкция, образуемая соединением двух или более знаменательных слов на основе подчинительной синтаксической связи, — Установите соответствие:
Синтаксическая конструкция, образуемая соединением двух или более знаменательных слов на основе подчинительной синтаксической связи, — Коммуникативная единица речи, образованная по специальному грамматическому образцу и противопоставленная словоформе и словосочетанию как единица общения, — Объединенная смысловой связью последовательность единиц речи, чаще всего предложений, обладающая следующими свойствами: связность, цельность, законченность, — Установите соответствие:
Одна из функций языка, которая заключается в назначении быть средством исследования и описания языка в терминах самого языка, — Важнейшая функция языка, заключающаяся в назначении служить основным средством человеческого общения, — Важнейшая функция языка, заключающаяся в назначении служить средством познания окружающего мира, выражать деятельность сознания, —
Ответов: 1 | Категория вопроса: Гуманитарные дисциплины
Буквально все, что вам нужно знать о семантическом отбеливании
Многие люди жалуются на использование буквально таким образом, который кажется, ну, не буквальным. Это потому, что переносное использование слова («Я буквально умер от смеха»), кажется, противоречит значению латинского корня буквально , littera , что означает «буква».
«Семантическое отбеливание» — это уменьшение интенсивности слова — например, когда «очень» (от латинского «verus», «истинный») используется для выделения («не так много стоковых фотографий семантического отбеливания в действии» ).
Проблема, с которой некоторые люди сталкиваются с буквально , заключается в том, что это мягкое наречие: если мы удалим его из нашего примера и скажем: «Я умер от смеха», предложение понимается точно таким же (не буквальным) образом — как гипербола. Добавление «буквально» только добавляет акцента; это соль в тушеном мясе, потому что бремя смысла лежит на других словах («умер от смеха»). Следовательно, если добавлено «буквально» и в результате ничего не изменилось, тогда ipso facto «буквально» буквально не имеет смысла в этом конкретном предложении.
Это снижение интенсивности слова называется «семантическим обесцвечиванием», и это лингвистическое явление встречается чаще, чем вы можете себе представить: когда вы говорите «Удачного дня!» вы не имеете в виду «Проведите большой день в пространственном измерении», и когда вы говорите «Этот фильм был потрясающим», вы не обязательно имеете в виду «Этот фильм выражал трепет или ужас». И отличный , и отличный (и фантастический , потрясающий , ужасный и многие другие) имеют значения, которые со временем стали менее буквальными.Можно сказать, что проблема с некоторыми вариантами использования буквально заключается не в том, что оно частично потеряло свое значение, а в том, что в других случаях использования не утратило первоначальное значение «по буквам» или «на самом деле». Оба они широко используются сегодня.
Подобно буквально , очень и действительно сохраняют свои первоначальные значения, но добавляют другое. Очень пришло в английский язык от французского, на котором говорили норманнские захватчики, а слово «истинный» в 13 веке было verai , что в современном французском языке сжалось до vrai .Последний латинский корень — verus , что означает «истинный». Мы по-прежнему используем очень , чтобы означать «действительно» или «правдиво» («это был очень смелый поступок», «Мне очень жаль»), но он часто передает акцент, для которого истина не особенно важна и не вызывает сомнений ( «Последнее, что я упаковал», «пожалуйста», «еда не очень хорошая»). Это усилитель — слово, которое окрашивает другое, но в данном случае само по себе мало окрашено.
То же самое верно и для , на самом деле : иногда это означает «на самом деле» («они действительно близнецы»), но часто дает простой акцент («Я отлично провел время») или субъективное суждение («это действительно хорошо». играть »), который не зависит от объективной реальности или реальности. В конечном итоге первоначально означало «наконец» или «в конце» («они в конечном итоге преуспели»), что отражает его латинский корень ultimatus , означающий «последний» или «последний», но теперь также часто используется для обозначения «в конце концов» (« в итоге мы согласились на сделку »). На самом деле первоначально означало «в действии или на самом деле» («Я не знаю, что на самом деле произошло»), но имеет гораздо более слабое значение, когда используется, чтобы подчеркнуть, что утверждение истинно или удивительно («мы действительно планировали уйти рано »,« фильм был действительно неплохим »).
Иногда кажется, что буквально придерживается наречных двойных стандартов, что заставляет многих сомневаться в правомерности его использования в качестве усилителя, в то время как другие слова с аналогичными шаблонами употребления, кажется, проходят без критики. Хотя важно соблюдать осторожность при использовании языка, важно также понимать, что язык гибкий и слова могут иметь несколько разных значений.
Эффективное использование интенсификаторов означает их экономное использование.В конечном итоге выбор за вами.
Основанный на грамматике алгоритм семантического сходства для предложений естественного языка
В данной статье представлен алгоритм подобия, основанный на грамматике и семантическом корпусе предложений естественного языка. Естественный язык, в отличие от «искусственного языка», такого как языки компьютерного программирования, — это язык, используемый широкой публикой для повседневного общения.Традиционные подходы к поиску информации, такие как векторные модели, LSA, HAL, или даже подходы на основе онтологий, которые расширяются и включают сравнение сходства концепций вместо совпадения терминов / слов, не всегда могут определять идеальное соответствие, пока нет очевидной связи или концепции. перекрываются между двумя предложениями на естественном языке. В этой статье предлагается алгоритм подобия предложений, который использует онтологию корпусов и грамматические правила для преодоления решаемых проблем.Эксперименты на двух известных тестах показывают, что предложенный алгоритм имеет значительное улучшение производительности в предложениях / коротких текстах с произвольным синтаксисом и структурой.
1. Введение
Естественный язык, термин в противоположность искусственному языку, — это язык, используемый широкой публикой для повседневного общения. Искусственный язык часто характеризуется самостоятельно созданными словарями, строгой грамматикой и ограниченным идеографическим диапазоном и, следовательно, относится к лингвистической категории, к которой труднее привыкнуть, но не сложно освоить широкой публикой.Естественный язык неотделим от всей социальной культуры и постоянно меняется с течением времени; люди могут легко развить чувство этого первого языка во время взросления. Кроме того, синтаксическая и семантическая гибкость естественного языка позволяет этому типу языка быть естественным для людей. Однако из-за бесконечных исключений, изменений и указаний естественный язык также становится типом языка, который труднее всего освоить.
Обработка естественного языка (NLP) изучает, как позволить компьютеру обрабатывать и понимать язык, используемый людьми в их повседневной жизни, понимать человеческие знания и общаться с людьми на естественном языке.Приложения НЛП включают поиск информации (IR), извлечение знаний, системы вопросов и ответов (QA), категоризацию текста, машинный перевод, помощь в написании, идентификацию голоса, композицию и так далее. Развитие Интернета и массовое производство цифровых документов привело к острой необходимости в интеллектуальной обработке текста, и поэтому теория, а также навыки НЛП стали более важными.
Традиционно методы обнаружения сходства между текстами были сосредоточены на разработке моделей документов. В последние годы было создано несколько типов моделей документов, таких как логическая модель, векторная модель и статистическая вероятностная модель. Булевская модель обеспечивает охват ключевых слов с помощью пересечения и объединения множеств. Логический алгоритм склонен к неправильному использованию, и поэтому метод поиска, приближенный к естественному языку, является направлением для дальнейшего улучшения. Солтон и Леск впервые предложили поисковую систему модели векторного пространства (VSM) [1–3], которая была не только методом двоичного сравнения.Основной вклад этого метода заключался в предложении концепций частичного сравнения и подобия, чтобы система могла вычислять сходство между документом и запросом на основе различных весов терминов индекса и затем выводить результат ранжирования поиска. Что касается актуализации векторной модели, запросы и документы первых пользователей в базе данных должны быть преобразованы в векторы в том же измерении. Хотя и документы, и запросы представлены одним и тем же измерением векторного пространства, наиболее распространенной оценкой семантического сходства в многомерном пространстве является вычисление сходства между двумя векторами с использованием косинуса, значение которого должно находиться в диапазоне от 0 до 1.
В целом, преимущества модели векторного пространства включают следующее. (1) При заданных весах VSM может лучше выбирать характеристики, а эффективность поиска в значительной степени улучшается по сравнению с булевой моделью. (2) VSM предоставляет механизм частичного сравнения, который позволяет находить документы с наиболее похожим распределением. Wu et al. представить систему поиска FAQ на основе VSM. Элементы вектора состоят из сегмента категории вопроса и сегмента ключевого слова [4]. Мера сходства документов на основе фраз предложена Чимом и Денгом [5].В [5] взвешенные фазы TF-IDF в суффиксном дереве [6, 7] отображаются в многомерное пространство терминов VSM. Совсем недавно Ли и др. [8] представили новую меру вычисления подобия предложений. Их мера, учитывающая семантическую информацию и порядок слов, которая показала хорошие результаты при измерении, в основном представляет собой модель на основе VSM.
В последние годы в области приложений НЛП постепенно возникла потребность в методе семантического анализа более коротких документов или предложений [9]. Что касается приложений в интеллектуальном анализе текста, метод семантического анализа коротких текстов / предложений также может применяться в базах данных в качестве определенного стандарта оценки для поиска неоткрытых знаний [10]. Кроме того, метод семантического анализа коротких текстов / предложений может быть использован в других областях, таких как реферирование текста [11], категоризация текста [12] и машинный перевод [13]. Недавно в разрабатываемой концепции подчеркивается, что сходство между текстами — это «скрытый семантический анализ (LSA), который основан на статистических данных лексики в большом корпусе».LSA и гиперпространственный аналог языка (HAL) являются известными корпусными алгоритмами [14–16]. LSA, также известная как латентно-семантическое индексирование (LSI), представляет собой полностью автоматический математический / статистический метод, который анализирует большой корпус текста на естественном языке и представление сходства слов и отрывков текста. В LSA группа терминов, представляющих статью, была извлечена путем оценки из множества контекстов, и была построена матрица термин-документ для описания частоты встречаемости терминов в документах.
Пусть будет матрица термин-документ, где element () обычно описывает вес термина TF-IDF в документе. Затем матрица, представляющая товар, делится методом разложения по сингулярным числам (SVD) на три матрицы, включая диагональную матрицу SVD [15]. Посредством процедуры SVD можно исключить меньшие сингулярные значения, а также уменьшить размер диагональной матрицы. Размерность слагаемых, включенных в исходную матрицу, может быть уменьшена путем реконструкции SVD.Посредством процессов декомпозиции и реконструкции LSA может получить сведения о терминах, выраженных в статье. Когда LSA применяется для вычисления сходства между текстами, вектор каждого текста преобразуется в пространство уменьшенной размерности, в то время как сходство между двумя текстами получается путем вычисления двух векторов уменьшенной размерности [14]. Разница между векторной моделью и LSA заключается в том, что LSA преобразует термины и документы в скрытое семантическое пространство и устраняет некоторый шум в исходном векторном пространстве.
Одной из стандартных вероятностных моделей LSA является вероятностный скрытый семантический анализ (PLSA), который также известен как вероятностное скрытое семантическое индексирование (PLSI) [17]. PLSA использует разложение смеси для моделирования слов и документов совпадения, где вероятности получаются выпуклой комбинацией аспектов. LSA и PLSA широко применяются в системах обработки информации и других приложениях [18–24].
Другое важное исследование, основанное на корпусе, — это гиперпространственный аналог языка (HAL) [25].HAL и LSA имеют очень похожие атрибуты: они оба используют параллельные словари для извлечения значения термина. В отличие от LSA, HAL использует абзац или документ как часть документа для создания информационной матрицы термина. HAL устанавливает оконную матрицу общего термина в качестве основы и сдвигает ширину окна, не выходя за пределы исходного определения оконной матрицы. Окно просматривает весь корпус, используя термины как ширину окна терминов (обычно ширину 10 терминов), и дополнительно формирует матрицу из. Когда окно сдвигается и сканирует документы во всем корпусе, элементы в матрице могут записывать вес каждого общего термина (количество вхождений / частота). Размерный вектор термина может быть получен путем объединения строк и строк матрицы, соответствующей термину, а сходство между двумя текстами может быть вычислено с помощью приблизительного евклидова расстояния. Однако при расчете коротких текстов HAL дает менее удовлетворительные результаты, чем LSA.
В заключение, вышеупомянутые подходы вычисляют сходство на основе количества общих терминов в статьях, а не игнорируют синтаксическую структуру предложений.Если применить обычные методы для вычисления сходства между короткими текстами / предложениями напрямую, могут возникнуть некоторые недостатки. (1) Традиционные методы предполагают, что документ имеет сотни или тысячи измерений, переводя короткие тексты / предложения в очень большие размеры. пространство и чрезвычайно разреженные векторы могут привести к менее точному результату вычислений. (2) Алгоритмы, основанные на общих терминах, подходят для применения для поиска средних и более длинных текстов, которые содержат больше информации.Напротив, информация об общих терминах в коротких текстах или предложениях редка и даже недоступна. Это может привести к тому, что система будет генерировать очень низкую оценку семантического сходства, и этот результат не может быть скорректирован с помощью общей функции сглаживания. (3) Стоп-слова обычно не принимаются во внимание при индексировании обычных IR-систем. Стоп-слова не имеют особого значения при вычислении сходства между более длинными текстами. Однако они являются неизбежными частями в отношении сходства между предложениями, поскольку они предоставляют информацию о структуре предложений, которая в определенной степени влияет на объяснение значений предложений.(4) Подобные предложения могут состоять из синонимов; обильные общие термины не нужны. Текущие исследования оценивают сходство в соответствии с совпадающими терминами в текстах и игнорируют синтаксическую информацию.
Предлагаемый алгоритм семантического сходства устраняет ограничения этих существующих подходов за счет использования грамматических правил и онтологии WordNet. Набор грамматических матриц создан для представления отношений между парами предложений. Размер набора ограничен максимальным количеством выбранных грамматических ссылок.Скрытая семантика слов рассчитывается с помощью меры сходства WordNet. Остальная часть этой статьи организована следующим образом. Раздел 2 знакомит с соответствующими технологиями, принятыми в нашем алгоритме. Раздел 3 описывает предлагаемый алгоритм и основные функции. В разделе 4 приведены некоторые примеры, иллюстрирующие наш метод. Экспериментальные результаты на двух известных тестах показаны в разделе 5, и последний дает заключение.
2. Справочная информация
2.1. Онтология и WordNet
Проблема семантической осведомленности среди текстов / естественных языков все чаще указывает на технологии семантической паутины в целом и онтологию в частности в качестве решения. Онтология — это философская теория о природе бытия. Исследователи искусственного интеллекта, особенно в области получения и представления знаний, реинкарнируют термин, чтобы выразить « общее и общее понимание некоторой области, которая может передаваться между людьми и прикладными системами » [26, 27]. Типичная онтология — это таксономия, определяющая классы в определенной области и их отношения, а также набор правил вывода, обеспечивающих ее функции рассуждений [28].Онтология теперь признана в семантическом веб-сообществе как термин, который относится к общему пониманию знаний в некоторых областях, представляющих интерес [29–31], которое часто понимается как набор понятий, отношений, функций, аксиом и примеров. Гуарино провел всестороннее исследование для определения онтологии из различных высоко цитируемых работ в сообществе обмена знаниями [32–37]. Семантическая сеть — это развивающееся расширение Всемирной паутины, в которой веб-контент может быть выражен на естественных языках и в форме, понятной, интерпретируемой и используемой программными агентами.
Элементы семантической сети выражаются в формальных спецификациях, которые включают структуру описания ресурсов [38], различные форматы обмена данными (такие как RDF / XML, N3, Turtle и N-Triples) [39, 40] и такие нотации, как язык веб-онтологий [41] и схема RDF.
В последние годы WordNet [42] стал наиболее широко используемой лексической онтологией английского языка. WordNet был разработан и поддерживается Лабораторией когнитивных наук Принстонского университета в 1990-х годах.Существительные, глаголы, прилагательные и наречия сгруппированы в когнитивные синонимы, называемые «синсеты», и каждый синоним выражает отдельное понятие. Как обычный онлайн-словарь, WordNet перечисляет предметы вместе с объяснениями в алфавитном порядке. Кроме того, он также показывает семантические отношения между словами и понятиями. Последняя версия WordNet — 3.0, которая содержит более 150 000 слов и 110 000 синсетов. В WordNet лексикализованные синсеты существительных и глаголов организованы иерархически с помощью гиперонима / гипернимии и гипонима / гипонимии. Гипонимы — это концепции, которые описывают вещи более конкретно, а гиперонимы относятся к концепциям, которые описывают вещи в более общем плане. Другими словами, это гипероним if every — это разновидность, и гипоним if every — разновидность. Например, птица является гипонимом позвоночного животного , а позвоночное животное является гипернимом птицы . Иерархия понятий WordNet превратилась в полезную основу для открытия и извлечения знаний [43–49]. В этом исследовании мы используем меру сходства Ву и Палмера [50], которая стала своего рода стандартом для измерения сходства между словами в лексической онтологии.Как показано в где — глубина самого нижнего общего гиперонима () в лексической таксономии, и обозначает количество переходов от до и, соответственно.
2.2. Грамматика ссылок
Грамматика ссылок (LG) [51], разработанная Дэви Темперли, Джоном Лафферти и Дэниелом Слейтором, представляет собой синтаксический синтаксический анализатор английского языка, который строит отношения между парами слов. Для данного предложения LG создает соответствующую синтаксическую структуру, которая состоит из набора помеченных ссылок, соединяющих пары слов.Последняя версия LG также создает «составное представление» (дерево фраз в стиле банка Пенна) предложения (словосочетания с существительными, словосочетания с глаголами и т. Д.). Парсер использует словарь из более чем 6000 словоформ и охватывает широкий спектр синтаксических конструкций. LG сейчас поддерживается под эгидой проекта Abiword [52]. Основная идея LG — рассматривать слова как блоки с соединителями, которые образуют отношения, или называемые ссылками. Эти ссылки используются не только для определения части речи слов, но и для подробного описания функций этих слов в предложении.LG может объяснить отношения модификации между различными частями речи и рассматривает предложение как последовательность слов и состоит из набора помеченных связей, соединяющих пары слов. Все слова в словаре LG были определены для описания того, как они используются в предложениях, и такая система называется «лексической системой».
Лексическая система может легко построить большую грамматическую структуру, поскольку изменение определения слова влияет только на грамматику предложения, в котором это слово находится.Кроме того, выразить грамматику неправильных глаголов просто, поскольку система определяет каждый из них индивидуально. Что касается грамматики различных структур фраз, связи, которые являются гладкими и соответствуют семантической структуре, могут быть установлены для каждого слова, используя слова грамматики ссылок для анализа грамматики предложения.
Все произведенные связи между словами подчиняются трем основным правилам [51]. (1) Планарность: связи не пересекаются друг с другом. (2) Связность: ссылок достаточно, чтобы соединить все слова последовательности вместе.(3) Удовлетворение: ссылки удовлетворяют требованиям связывания каждого слова в последовательности.
В предложении « канадские официальные лица согласились провести дополнительные учения по реагированию на угрозы . », Например, есть ссылок , соединяющих существительные-модификаторы « официальный » с существительным « канадский, » « упражнение »до« ответ, »и« упражнение »до« угроза », как показано на рисунке 1. Основные слова отмечены« .n »,« .v »,« .a »для обозначения существительных, глаголов и прилагательных. Ссылка A соединяет предыстительные (атрибутивные) прилагательные с существительными. Ссылка D соединяет определители с существительными. Есть много слов, которые могут выступать в качестве определителей или словосочетаний, таких как « a » (обозначено как « Ds »), « многие » (« DMC ») и « примерно ». (« Dm »), и каждый из них соответствует подтипу типа связи D .Ссылка O соединяет переходные глаголы с прямыми или косвенными объектами, где Os является подтипом O , который соединяет существительные как единственное число.
PP связывает формы «иметь» с причастиями прошедшего времени (« согласовали »), Sp — подтип S , который связывает множественное число существительных с формами множественного числа глаголов ( S связывает подлежащие существительные с конечными глаголами. ), и так далее.
Этот простой пример показывает, что связи подразумевают определенную степень семантических корреляций в предложении.LG определяет более 100 ссылок; однако в нашем дизайне семантическое сходство извлекается из специально разработанной матрицы связей и оценивается с помощью меры сходства WordNet; таким образом, зарезервированы только соединительные элементы, содержащие неспецифические существительные и глаголы. Другие ссылки, такие как AL (который связывает несколько определителей со следующими определителями, такими как « и » и « все ») и EC (который связывает наречия и сравнительные прилагательные, например « много более ”), игнорируются.
3. Алгоритм грамматического семантического сходства
В этом разделе подробно показан предлагаемый алгоритм грамматического сходства. Этот алгоритм может быть дополнением к обычным английским системам обработки естественного языка и экспертным системам. Наш подход получает сходство из семантической и синтаксической информации, содержащейся в сравниваемых предложениях естественного языка. Предложение на естественном языке рассматривается как последовательность ссылок вместо отдельных слов, каждое из которых содержит определенное значение.В отличие от существующих подходов, использующих фиксированный набор терминов из словаря, совпадающие термины [1–3] или даже порядок слов [8], предлагаемый подход напрямую извлекает скрытую семантику из одних и тех же или похожих ссылок.
3.1. Типы ссылок
Предлагаемый алгоритм определяет схожесть двух предложений естественного языка по грамматической информации и семантическое сходство слов, содержащихся в ссылках. В таблице 1 показаны выбранные ссылки, подтипы ссылок и соответствующие описания, используемые в нашем подходе. Первый столбец — это выбранные основные типы связи LG . Во втором столбце показаны выбранные подтипы основных типов ссылок. Если были выбраны все подтипы конкретной ссылки, она обозначается «*». Пунктирная линия указывает на то, что ни один подтип не выбран или не существует. Этот метод разделен на три функции. Первая часть — это извлечение типа связывания. Алгоритм 1 принимает предложение и набор выбранных типов связывания и возвращает набор оставшихся типов связывания и соответствующую информацию для каждой ссылки.Это этап предварительной обработки; элементы возвращенного набора — это структуры, которые записывают ссылки, подтипы ссылок, а также существительные или глаголы каждой ссылки.
|
|
После предварительной обработки алгоритм 2 вычисляет показатель семантического сходства входных предложений. Алгоритм принимает два предложения и набор выбранных типов связывания и возвращает показатель семантического сходства, который формализуется до 0 ~ 1.В алгоритме 2 строки 1 и 2 вызывают алгоритм 1 для записи ссылок и информации слов предложений и в наборах и. Если, это означает, что существуют некоторые общие или похожие связи между и, которые можно рассматривать как корреляции фраз между двумя предложениями. В нашем проекте общие основные ссылки с подобными подтипами образуют матрицу с именем Grammar_Matrix ( GM ). Каждый GM подразумевает определенную степень корреляции между фразами; значение каждого члена в GM рассчитывается с помощью алгоритма Ву и Палмера.Алгоритм 3 отображает детали процесса оценки. В алгоритме 3 GM состоит из общих ссылок. Поскольку количество подтипов зависит от каждой ссылки, мы устанавливаем ссылки с меньшим количеством подтипов в качестве строк, а другие в качестве столбцов. Для каждой строки был зарезервирован максимальный термин, который составляет Grammar_Vector ( GV ), который представляет максимальное семантическое включение конкретной связи между и.
|
|
На рисунке 2 показана структура GM и G и сравниваются предложения, и они являются первыми общая ссылка и, и так далее, являются подтипами и. Каждый GM представляет собой корреляцию определенных фраз, поскольку в предложении может существовать несколько похожих подссылок, в которых соответствующий GV количественно определяет информацию и извлекает скрытую семантику между этими фразами. Алгоритм 1 вызывает функцию LG и генерирует связи, как показано на рисунках 3, 4 и 5.
3.2. Работа с примером
В этом разделе дается пример, демонстрирующий предложенный алгоритм подобия.Пусть A = « Выручка в первом квартале года упала на 15 процентов по сравнению с тем же периодом годом ранее », B = « В связи со скандалом, висящим над компанией Стюарта, выручка в первом квартале года. упала на 15 процентов по сравнению с аналогичным периодом годом ранее — », и C =« Результатом является общий пакет, который обеспечит значительный экономический рост для наших сотрудников в течение следующих четырех лет ». Этот пример взят из Microsoft Research Paraphrase Corpus (MRPC) [53], который будет представлен более подробно в следующем разделе.В этом примере мы сравниваем семантическое сходство между A-B , A-C и B-C . Алгоритм 1 сначала генерирует соответствующие связи для каждого предложения, и результаты показаны на рисунках 3–5. Всего имеется 17, 26 и 20 исходных ссылок, созданных LG . После этапа предварительной обработки оставшиеся связи (подробная структура данных здесь опущена), и, соответственно. В алгоритме 2 сравниваемая пара предложений была отправлена в матрицу грамматики (т.е., алгоритм 3) в соответствии с их общими типами связывания, и каждый тип связывания со своими подтипами образует Grammar_Matrix . Таблицы 2, 3 и 4 показывают GMs и их дословное сходство пар A-B , A-C и B-C . В таблице 2 типы соединения: Wd , S , Mp , D и J ; следовательно, в паре A-B пять GM .
Первый GM — это матрица с и, второй GM также является матрицей с и, третий GM — это матрица с и, четвертый GM — это матрица с и, и так далее.На шаге 5 алгоритма 3 мы оцениваем сходство отдельных слов с помощью онтологии WordNet и метода Wu & Palmer . Результаты также показаны в таблицах 2–4. На этом этапе оценивается вся возможная семантика между похожими ссылками, и очевидно, что слово может быть связано дважды или даже больше в общем случае. На следующем этапе каждый GM сокращается до Grammar_Vector ( GV ), сохраняя максимальное значение каждой строки. Таким образом, в паре A-B ,,,, и.В паре A-C ,,, и,, а в паре B-C . На заключительном этапе все элементы ГВ принимают количество мощности элементов для уравновешивания эффектов неоцененных подтипов. Окончательные баллы A против B = 0,987, A против C = 0,817 и B против C = 0,651 соответственно.
4.![]() 4.1. Эксперимент с тестом Ли Основываясь на понятии семантической и синтаксической информации, способствовавшей пониманию предложений естественного языка, Ли и др. [8] определили меру сходства предложений как линейную комбинацию, основанную на сходстве семантического вектора и порядка слов. Предварительный набор данных был построен Ли и др. с оценками человеческого сходства, предоставленными 32 добровольцами, которые являются носителями английского языка.В наборе данных Ли использовалось 65 пар слов, которые первоначально были предоставлены Рубенштейном и Гуденафом [60] и были заменены определениями из словаря Collins Cobuild [61]. Словарь Collins Cobuild был построен из большого корпуса, содержащего более 400 миллионов слов. Каждая пара была оценена по шкале от 0,0 до 4,0 в соответствии с их смысловым сходством. Мы использовали подмножество из 65 пар, чтобы получить более равномерное распределение по диапазону сходства. Это подмножество содержит 30 пар из исходных 65 пар, из которых 10 пар были взяты из диапазона 3 ~ 4, 10 пар из диапазона 1 ~ 3 и 10 пар из диапазона 0 ~ 1.
|