Компьютерная лингвистика: современные направления развития. Часть 2

В современном мире человек имеет дело с огромными массивами, корпусами текстов, существующими в Интернете, которые он просто не в состоянии обработать. И тут приходит на помощь, условно говоря, робот-программа. Прежде всего речь идёт о поисковых программах конечно. Эти программы уже не воспроизводят человека, они они обеспечивают конкретный вид деятельности. Идя по пути создания программ под чёткие задачи и требования человека, были созданы, например, программы машинного перевода. Первые эксперименты по машинному переводу начались в начале 50 гг. В 52-м году состоялась первая конференция по машинному переводу в МАИТИ, в 54 – знаменательный Джорджтаунский эксперимент по машинному переводу. Объяснялся такой интерес к машинному переводу просто: необходимо было отслеживать тексты по физике, математике, выходившие в СССР, тогда ещё сверхдержаве, а переводчиков с русского на английский язык не хватало. Первая такая американская система перевода называлась «ГАД» и включала порядка 250 слов и 30 синтаксических конструкций. Первый эксперимент показал, что система работает довольно успешно, то есть процент ошибок невелик. С этого времени и стали выделяться большие деньги на развитие систем машинного перевода. Эта тенденция держалась порядка 20 лет, до конца 70-ых гг, когда одна из комиссий Конгресса, исследовав состояние дел в этой области, пришла к выводу, что огромные вложения в эту область не окупились, не принесли адекватного результата. В чём же, спрашивается, было дело? А дело было в том, что качество перевода, выдаваемого машиной, не соответствовало уровню затрат на обеспечение этой машины энергией, обслуживание её людьми, постредактирование текста. И финансирование этой области было свёрнуто почти на 15 лет. Уже позднее исследования возобновили, придя к выводу, что качественный перевод мало где нужен – есть достаточно областей, где сведущий в тематике перевода человек может вполне обойтись и машинным переводом для решения своих насущных проблем. Безусловно, существуют запросы и на более сложные программы, однако их пока невозможно сделать. Машинный перевод прошёл в своём развитии несколько этапов, и первым этапом был пословный перевод, и все программы первого поколения были устроены так. И первые 4 варианта американской программы «Гад» тоже. Для простой, предметной сферы это зачастую подходит, потому что вы получаете необходимые ключевые слова и определённые схематические отношения между ними. Прочитав, вы сможете сказать, о чём идёт речь в тексте. Позже появилась идея семантического метода языка, стоящая между источником-языком и целевым языком. Этот этап развития систем машинного перевода до сих пор не завершён, так как создать такой семантический метаязык оказалось очень трудно. И для того, чтобы создавать успешные программы такого рода, необходимы фундаментальные исследования в области семантики и синтаксиса естественного языка.
Однако машинный перевод – далеко не единственный пример использования компьютерной лингвистики. Те же поисковики могут послужить ярким примером практического применения компьютерной лингвистики. Безусловным успехом сегодняшней компьютерной лингвистики можно считать и создание электронных словарей.
Есть примеры, когда программе всё-таки приходится воспроизвести человеческую деятельность: например распознавание как устной, так и письменной речи. Без этого невозможно создать программу, имитирующую человеческую деятельность. И, хотя на решение этих проблем потребовалось много лет и усилий, они решены. Например, на сегодняшний день существует несколько программ распознавания письменной речи, и они вполне удачны. Распознать речь и письменный почерк сложнее, но и эти проблемы решаются.