КПІ
ФЛ КПІ
  • Українська

Матеріали до методичного семінару

Сьогодні відбуваються стрімкі революційні зміни у лексикографії, термінографії,  зумовлені застосуванням комп’ютерних технологій для опису мовних одиниць, що сприяє організації гіпертекстового простору в лексикографічній практиці та створенню електронних словників.

Електронний словник, як явище достатньо нове і водночас вельми динамічне, нині досліджується багатьма вітчизняними  та зарубіжними науковцями (В.В. Дубічинський, М.П. Пещак, В.А. Широков, Є.А. Карпіловська, Селегей В.П., Перванов Я.А. та ін.). Увага мовознавців прикута передовсім до проблем його укладання, особливостей функціонування та  використання. Натомість попри наявні напрацювання у прикладній лінгвістиці, питання про те, яким повинен бути сучасний словник, досі залишається відкритим.
Комп’ютерна лексикографія – сукупність методів і програмних засобів обробки текстової інформації для створення словників. Вона виникла порівняно недавно, але дуже швидко розвивається. Перші плоди розвитку цієї галузі лінгвістики – вбудовані в текстові процесори орфографічні словники, а також багато інших інформаційно-програмих продуктів.
Завдання комп’ютерної лексикографії – розробити комп’ютерні алгоритми, програми, системи та технології для укладання та використання словників. Лексикографічні системи дають змогу формувати словникові статті; зберігати текстову, візуальну та звукову інформацію; здійснювати обробку словникової інформації (аналіз, пошук, фільтрування, відтворення тощо). Використання у словникових статтях аудіо- та відеоінформації вимагає потужного програмного та технічного забезпечення і спричиняє ускладнення структури баз даних та інтерфейсу користувача лексикографічних систем.
Для електронної лексикографії особливе значення має принцип гіпертексту як основного способу організації віртуального текстового простору. На думку А. Баранова, практична цінність гіпертексту полягає в тому, що “він описує тип інтерактивного середовища з можливістю переходу за посиланнями”. Посилання, якими можуть бути слова, фрази або малюнки, дозволяють користувачу вибрати той чи той текст або малюнок і виводити на екран відомості, пов’язані з ним. Нелінійний характер гіпертексту уможливлює подавання інформації у вигляді розгалуженої структури, що дозволяє значною мірою розширити рамки словникової статті.
Отже, комп’ютерна лексикографія є перспективною наукою. Швидкий темп сучасного життя постійно змінюють мову, а, отже, словники повинні оновлюватися відповідно до вимог часу.
На сьогодні є різні потрактування поняття «електронний словник». Зокрема під цим терміном мають на увазі:

  • електронну копію друкованого словника або “комп’ютерну копію традиційного словника – комп’ютерний аналог тексту традиційного словника, створений без додаткового втручання лінгвіста-дослідника”. Поняття “електронна версія” передбачає інформацію, представлену в електронному вигляді, яка працює статично і не потребує спеціальних програмних засобів для функціонування;
  • комп’ютерну версію друкованого словника. “Комп’ютерний аналог тексту традиційного словника, який має спеціальну граматику його опрацювання (правила аналізу та синтезу інформації), підготовлену лінгвістом-дослідником”. Йдеться про  інформацію, взяту з паперового словника, яку опрацьовано та подано в інтерактивному вигляді.
  • власне електронний (мультимедійний) словник, укладений на основі фактичного матеріалу і створений за допомогою комп’ютерних програм.

Електронні словники й енциклопедії розробляють сьогодні як автономні й мережеві програмні продукти. Не викликає сумніву той факт, що електронні словники надають користувачеві безліч додаткових можливостей порівняно з друкованими аналогами. Перевага такого словника полягає у:

  • зберіганні великого обсягу інформації за рахунок гіперпосилань: електронний словник передбачає вміщення до своєї структури кількох словників різних типів і жанрів (словника сполучуваності, термінології, граматичних норм та ін.). На одному компакт-диску міститься інформація, що зберігатиметься в декількох томах друкованого словника. Сучасні електронні словники не тільки значно перевершують за обсягом паперові, а й знаходять шукане слово або словосполучення за кілька секунд
  • доступності словника за рахунок ефективної системи пошуку (повнотекстовий пошук, одночасний пошук у декількох словниках, швидкість пошуку); Найголовніша перевага електронних словників – одночасний пошук не лише за назвою словникової статті, а й за всім величезним обсягом словника, що просто нереально в паперовому варіанті. Такий пошук створює багатовимірний портрет слова, при цьому увочевиднюються  не тільки конкретні приклади використання слова  і стійкі вирази, в яких воно вживається, але й мовні закони, яким підлягають правила словотворення.
  • застосуванні засобів мультимедіа для семантизації лексики: озвучування заголовних слів, уведення ілюстративного матеріалу з фотографіями, анімацією, відеофрагментами;
  • використанні словників у локальній і глобальній мережах, при цьому робота зі словниками може проводитися багатьма користувачами одночасно;
  • економії часу й матеріальних витрат для створення комп’ютерних словників.

Донедавна єдиним недоліком електронних словників було встановлення і використання їх на комп’ютері користувача. Однак цей недолік сьогодні усунуто внаслідок зростаючих темпів комп’ютеризації і появи он-лайн версій в Інтернеті. Водночас, електронні словники все-таки успадкували деякі недоліки звичайних словників. Передусім ідеться про неповноту словника та підтримання словника в актуальному стані. Перша проблема вдало розв’язується за допомогою різноманітних способів  використання комп’ютерних програм:

  • Залучення фахівців для поповнення словників
  • Надання можливості користувачам самим поповнювати і редагувати словники
  • Імпортданих із  різних словників (зокрема, і з відсканованих копій паперових словників, із використанням інструментів розпізнавання).

Наприклад, online-перекладачі та словники Google після невдалого пошуку слова або словосполучення пропонують ввести свій варіант перекладу (тлумачення) і зберегти його. Енциклопедія Wikipedia працює за тією ж схемою.
Найпопулярнішими електронними словниками в Україні є МультиЛекс, Lingvo, Контекст, Polyglossum. Кращими продуктами можна назвати «Мультилекс» та AbbyyLingvo,  оскільки вони мають найбільш повні словникові бази, зручний інтерфейс та різноманітні додаткові можливості, які спрощують вивчення іноземної мови, роботу перекладача та пересічних користувачів, котрі потребують оперативного перекладу іншомовної інформації. Серед електронних енциклопедій найбільшою популярністю користується Wikipedia. Із власне-українських розробок виокремимо  «Великий тлумачний словник сучасної української мови» на порталі slovnyk.net та Систему “Словники України”, укладену на основі сучасних академічних словників української мови за допомогою словозмінної класифікації та комп’ютерних програм, розроблених фахівцями Українського мовно-інформаційного фонду. Найкращими електронними словниками термінів є словники термінографічної серії СловоСвіт.
Теоретичною та практичною розробкою електронних словників в Україні займаються: Український мовно-інформаційний фонд НАН України, лабораторія комп’ютерної лінгвістики Київського національного університету імені Тараса Шевченка, лабораторія комп’ютерної лінгвістики Київського національного лінгвістичного університету, кафедра загального та прикладного мовознавства Харківського національного університету імені Каразіна та інші приватні структури.
Коротко проаналізуємо найпоширеніші електронні продукти в Україні.
Перекладні словники.
1. ABBYY Lingvo
Словник Лінгво добре відомий українським користувачам, він представлений на ринку вже 15 років у 3х варіантах: паперовому, електронному на СД-диску та електронному в мережі інтернет. Спочатку розробкою української частини у версії для СД-дисків займалися співробітники Лабораторії комп’ютерної лінгвістики КНЛУ, сьогодні – приватні організації. Розробкою сервісу lingvo.ru та lingvo.ua і, відповідно, електронного варіанта в мережі інтернет є російська компанія ABBYY СофтХаус. За своєю структурою і СД-диск, і сервіс Лінгво.ру практично ідентичні своїй паперовій версії: до кожного слова подано кілька перекладів і контекстні приклади використання слова. Безперечно зручністю є наявність цілого набору словників із різних тем, об’єднаних у рамках одного сервісу.
Інтернет-Версія електронного словника Лінгво здійснює переклад на російську з англійської, німецької, французької, італійської та іспанської мов і навпаки, а також містить 13 тематичних словників.
2. MultiLex
Компанія МедиаЛингва дотримується при створенні словників МультиЛекс досить простої стратегії. В основу електронних словників закладені словникові бази книжкових видань, що вже завоювали популярність і визнання серед перекладачів, викладачів іноземних мов, студентів і школярів.
Онлайн-словник МультиЛекс (online.multilex.ru) містить більш ніж 40 загальних, тематичних та тлумачних словників, що заслуговують на довіру професійних лінгвістів та перекладачів. Інтернет версія електронного словника здійснює переклад на російську з англійської, французької, німецької, італійської, португальської, іспанської та узбекської мов і навпаки. Словник може здійснювати переклади текстів будь-якої складності, використовуючи докладні та актуальні статті, що містять докладні тлумачення слів, транскрипцію та приклади вживання. Для перекладу спеціалізованої лексики до складу МультиЛексу входять тематичні онлайн-словники багатьох галузей, таких як: будівництво, економіка, банківська справа, комп`ютери, право, техніка, медицина тощо.
Електронна енциклопедія Вікіпедія.
Wikipedia («Вікіпедія») — найповніша енциклопедія у світі. Це унікальний міжнародний інтернет-проект, що складається з 253 мовних проектів Вікіпедії, яким можна скористатись на сайті www.wikipedia.org. З-поміж них найбільшу кількість має англійська Вікіпедія – 2,3 млн. статей. «Вікіпедія» стартувала 15 січня 2001 р. Проект створили вчений-філософ Ларрі Сенгер і підприємець ДжимміВейлс, котрі той час вже займалися Nupedia – інтернет-енциклопедією, яка відрізнялася від своїх попередниць тим, що була простішою та доступнішою.
Одним із ноу-хау першого проекту було залучення авторів-добровольців до створення вивірених енциклопедичних статей, які потім могли б використовуватися усіма охочими. Спочатку робота йшла повільно, тому що написання й рецензування статей виявилося складною справою, але увагу ентузіастів привернула комплексна інтернет-видавнича система Wiki, розроблена в 1995 р. програмістом УордомКаннінгемом. Вона дозволяє підтримувати інтернет-сайти, інформацію на яких можна редагувати й доповнювати в онлайновом режимі. Учасник Wiki може внести зміни на будь-яку сторінку сайту, відтак їх відразу побачать усі відвідувачі. При цьому між сторінками активно розставляються гіперпосилання, від чого довідкова функція сайту поліпшується.
На сьогодні у Вікіпедії 29 447 статей (не враховуючи зображень). Українську частину Вікіпедії активовано 4 квітня 2004. Спочатку вона містила 1000 статей. 28 березня 2008 року українська Вікіпедія вийшла на рівень 100 тисяч статей і посідає дев’ятнадцяте місце серед проектів іншими мовами. Для порівняння, англійська Вікіпедія налічує понад 2,3 млн. статей, німецька понад 700 тисяч та французька понад 600 тисяч статей, польська та японська 470 тис., російська, китайська приблизно 200 тис. За дотримуванням правил Вікіпедії спостерігають 14 адміністраторів.
Одна з головних переваг сайту – наявність функції тлумачного словника, який окрім обґрунтованого тлумачення слова дає посилання на статті, де було знайдено те чи те слово або словосполучення. Це дає можливість глибокого вивчення всіх аспектів заданого слова.
Тлумачний словник: Словник.Нет
Великий тлумачний словник сучасної української мови онлайн (slovnyk.net) містить понад 207 000 словникових статей та близько 18 000 фразеологізмів. У ньому представлено активну лексику української літературної мови, терміни, номенклатурні та складноскорочені слова, слова історичного фонду, що свого часу належали до широковживаних, найвідоміші у вжитку слова, пов’язані з релігійними та філософськими поняттями, найуживаніші архаїзми, лексичні діалектизми та найпоширеніші неологізми, що з’явилися протягом останніх років. Проект Словник.Нет  базується на другому виданні Великого тлумачного словника СУМ / Голов. ред. В.Т.Бусел. – К.: Ірпінь: ВТФ “Перун”, 2005 і розрахований на широке коло користувачів, що вивчають українську мову, послуговуються нею у повсякденному житті, цікавляться українською культурою. Словник має кілька позитивних моментів – по-перше, він активно поповнюється новими словами, які ще не ввійшли до ВТС СУМ. По-друге, містить посилання на Вікіпедію та є функція пошуку в пошукових системах. Також, якщо ви не згодні з тлумаченням слова, ви можете обговорити його на форумі сайту.
Комплексний словник української мови: «Словники України»
Український мовно-інформаційний фонд розробив програму «Словники України» на базі академічних словників, яка об’єднує п’ять словників: орфографічний, орфоепічний, синонімічний, антонімічний та фразеологічний, а також функцію словозміни. За допомогою системи «Словники України» користувач може дізнатися про написання, наголошення, вимову близько 152 тисяч слів української літературної мови, одержати повну інформацію про відмінювання цих слів у всіх граматичних значеннях (відмінках, числах, особах тощо). Також на екрані при розкриванні парадигми того чи того слова над кожним із них є наголос, що є дуже важливим для тих, хто не проживає в українському природному середовищі. Словник існує у двох версіях – на СД-диску та в мережі Інтернет.
В електронному словнику української мови можна дізнатися про синоніми та антоніми, про вживання заданого слова у цілісних виразах зі спеціальним значенням (фразеологізмах). У ньому міститься інформація про 2200 антонімічних пар, 9200 синонімічних рядів та 56 тисяч фразеологічних одиниць.
Систему «Словники України» укладено на основі сучасних академічних словників української мови за допомогою словозмінної класифікації та комп’ютерних програм, розроблених фахівцями Українського мовно-інформаційного фонду. Авторами цього електронного словника є В. Широков, І. Шевченко, О. Рабулець, О. Костишин, М. Пещак.
Словники термінів
В Україні найкращими електронними термінологічними словниками є словники Термінографічної серії СловоСвіт, що започаткована у 2004 році (головний редактор – Б.Є. Рицар). У рамках цього проекту разом виданням паперових версій термінологічних словників почалося розроблення системи для укладання комп’ютерних словників під назвою PolyDic 1.0 [4]. За допомогою цієї системи укладено та видано три комп’ютерних словники, які вийшли в світ одночасно з їхніми паперовими версіями: «Російсько-український словник будівництва й архітектури» (Термінографічна серія СловоСвіт № 8) «Російсько-український словник з інженерних технологій» (№ 9) та «Російсько-український коксохімічний словник» (№ 12). З-поміж позитивних ознак системи виокремимо:

  • простоту у використанні; зручний пошук (за першими літерами слів та за заданою маскою);
  • можливість одночасного введення декількох окремих баз з подальшим їхнім злиттям в одну, що значно пришвидшує роботу з укладання словника;
  • наявність редактора словникових статей;
  • можливість конвертувати словникові бази в текстовий формат RTF, для їх коректування та редагування;
  • можливість створювати спливні інформаційні вікна для тлумачення словникових позначок, зокрема приналежність терміна до певної галузі;
  • компактний обсяг програми та словникових баз; непотрібність встановлення додаткового програмного забезпечення.

Серед недоліків системи потрібно вказати на обмеженість кількості мов перекладних словників (дві); вбудований шрифт не підтримує Unicode і не дає змогу вводити літери з діакритичними знаками; система не підтримує мультимедійні об’єкти.
2007 р. у термінографічній серії СловоСвіт вийшов друком п’ятимовний словник інсталяційних термінів і заплановано укласти та видати ілюстрований багатомовний словник з будівництва й архітектури. Усе це зумовило розроблення нової системи для укладання багатомовних мультимедійних комп’ютерних словників PolyDic ML 3.0. Як і попередня версія, вона складається з двох модулів: один для введення та редагування словникових баз, другий − для їхнього відтворення на комп’ютерних дисках. Основні функції та засоби нової системи:

  • незалежне введення словникових баз на декількох комп’ютерах з подальшим злиттям даних в єдину базу;
  • підтримка кодової таблиці Unicode символів усіх національних алфавітів; – експортування введеної словникової інформації у формат RTF;
  • вибір вхідної мови багатомовного словника;
  • вибір мови інтерфейсу програми;
  • можливість відтворення синонімів, антонімів, абревіатур, скорочень, транскрипції, транслітерації, наголосів, морфологічної інформації, позначок (граматичних, стилістичних, спеціальних);
  • відтворення зображень, формул та графіків, звукових файлів, кліпів (для ілюстрації словникової статті);
  • сортування за вибраною вхідною мовою або за заданими розділами;
  • розгорнута та зручна система пошуку (за першими літерами слів чи за поєднанням символів у всіх текстових полях електронного словника);
  • уведення довільної кількості мов, підтримуваних операційною системою Windows (кількість мов словника програмно не обмежена, не потрібно встановлювати додаткові шрифти);
  • у систему можна заносити декілька словників та відтворювати їх спільно або окремо.

Висновки
Протягом останніх років електронні словники завдяки своїй функціональності, зручності та обсягу інформації все більше витісняють свої паперові аналоги. Саме через зростання популярності електронних словників виникла потреба у створенні нового напрямку лінгвістики – комп’ютерної лексикографії, яка вивчає  методи і програмні засоби обробки текстової інформації для укладання комп’ютерних словників. Завдання комп’ютерної лексикографії – розробити комп’ютерні алгоритми, програми, системи та технології для укладання та використання словників.
Електронний словник – комп’ютерна база даних, яка містить особливим чином закодовані словникові статті, що дозволяють здійснювати швидкий пошук потрібних слів, словосполучень часто з урахуванням морфологічних форм і з можливістю пошуку поєднань слів (прикладів вживання).
Після аналізу електронних словників можна стверджувати, що потреба в словниках подібних типів зростає, оскільки такий вид видання є дешевшим за друковану продукцію, прискорює  пошук необхідної інформації та полегшує навчальний процес. Без сумніву, розвиток електронних словників прогресує, складаючи конкуренцію традиційним виданням.
Електронні словники зручніші у користуванні і розробляються для різних цілей користувачів різних галузей знання та покликані стати новим етапом в історії лексикографії. Для масових програмних продуктів, якими є електронні словники, характерні часта зміна версій. Тому комп’ютерна лексикографія – це актуальна лексикографія, адже, виявивши чергову помилку або лакуну, є можливість виправити її відразу, а не через десятиліття.