Сводеш — До питання про підвищення точності в лексикостатистическом датуванні

М. Сводеш ДО ПИТАННЯ ПРО ПІДВИЩЕННЯ ТОЧНОСТІ В ЛЕКСИКОСТАТИСТИЧЕСКОМ ДАТУВАННІ (Нове в лінгвістиці. - Вип.

1. - М., 1960. - С. 53-87) 1. Протягом декількох останнього років ми були свідками цілого ряду порівняно вдалих експериментів, зроблених ученими для визначення кількості минулого часу методом підрахунку родинних слів у досвідчених словниках.

Розвиток цього методу являє більшу цінність для відновлення фактів передісторії, оскільки він дозволяє встановити датування доісторичних етнічних контактів, виявлених язиковим спорідненням. Використовуючи історичні дані про розселення народів, цей метод дозволяє встановити їхнє доісторичне місце розташування й шляхи міграцій у певні періоди часу в минулому. Ці дані можуть бути співвіднесені з показаннями археології, порівняльної етнографії, географії запозичених слів, з фактами географічного поширення фонетичних і морфологічних особливостей і з багатьма свідченнями іншого порядку. Таке порівняння часто дає нам ключ до правильного співвіднесення місць археологічних даних з історично відомими народами. У межах мовознавства як такого лексикостатистика висвітлює не вивчену дотепер тенденцію словника змінюватися з постійною швидкістю. Оскільки дослідження в області лексикостатистики дотепер стосувалися тільки відомостей про кількість минулого часу й у ній навмисно розглядалися тільки ті лексичні одиниці, які найменше піддані культурним впливам, природно, що виявилася вивченої тільки невелика частина всіх язикових явищ.

Бажано, щоб в остаточному підсумку була досліджена швидкість зміни різних типів і рівнів менш стійкої частини словника й щоб була створена закінчена теорія щодо тих факторів, які впливають на швидкість зміни словника. Незважаючи на багатообіцяючу роль, що, здавався б, лексикостатистический метод міг зіграти як додатковий інструмент дослідження доистории, незважаючи на те, що лексикостатистика могла б з'явитися ключем до більше поглибленого розуміння мови як суспільного явища, вона дотепер відставала. Те, що було нами позначене «константою», але могло б точніше бути названо «індексом» сохраняемости лексики, ґрунтується лише на частковому вивченні тринадцяти контрольних мов. У цій області найцінніший внесок був спочатку внесений Р. Б. Лизом, що працював разом з автором теперішньої статті, а також використовував у своїх дослідженнях дані, отримані деякими іншими вченими. Різні експерименти по застосуванню лексикостатистики до вивчення доистории й ряд досліджень, у яких робилася спроба підтвердити придатність індексу сохраняемости й перевірити дію специфічних факторів, - все це сприяло кращому розумінню як методології лексикостатистики, так і теорії, на якій вона заснована.

Однак, незважаючи на це, все-таки відчувається необхідність всебічних контрольних досліджень, куди повинні бути по можливості включені не менш ста історично засвідчених випадків. Якби існувала гарантія того, що в найближчі роки будуть проведені й успішно завершені дослідження, присвячені основним, провідним проблемам, то краще було б уникати дрібних, часток досліджень і навіть тимчасово припинити розгляд питань, пов'язаних з доисторией. Однак, оскільки зараз не існує подібної перспективи, варто продовжувати експериментувати, у надії на те, що знання, що накопичуються поступово, в остаточному підсумку вдосконалять практику й теорію лексикостатистики. Теперішня робота, у якій автор тільки стосується всіх цих питань, ставить перед собою дуже скромне завдання.

Автор не розбирає жодного ноеого контрольної мови й навіть по методологічних міркуваннях опускає деякі із що приводяться Лизом даних. Автор теперішньої статті намагається продовжити аналіз колишніх списків слів і використовувати критичні зауваження й побажання, які виходять від його колег і з'являються в пресі, а також висловлюються в обговореннях до в особистій переписці. Основна цінність цієї роботи, можливо, складається в дослідженні наявних у нашім розпоряджень засобів для ретельного вдосконалення лексикостатистического методу. 2. У методиці лексикостатистического датування використовується твердо встановлений список досвідчених елементів.

Вони виражаються в словах якого-небудь узятого за основу мови, наприклад англійського, іспанського або якого-небудь іншого, причому в список повинне включатися таке значення використовуваного елемента, що абсолютно не пов'язане із семантичними особливостями даної мови. Наприклад, tongue «мова» ставиться до слів, що позначають частині тіла, а не до слів, що позначають мову як засіб спілкування (language), і не до слів, що позначають частині воза. Для кожного елемента списку в мові, на якому переводиться даний список, повинен бути підібраний простій, загальновживаний еквівалент. Приміром, якби ми стали порівнювати англійський із французьким і іспанським, ми повинні були б вибрати langue у першому випадку й lengua у другому як еквівалент до англійського tongue; до англійського head «голова» еквівалентами з'явилися б відповідно франц. tete і исп.

cabeza. Звичайно вибирається один, виражений тільки одним словом еквівалент для кожного використовуваного елемента; елементи, що складаються більш ніж з одного слова, включаються в список тільки в тих випадках, коли немає ніякої можливості знайти відповідність серед простих слів даної мови. Списки слів двох порівнюваних мов зіставляють один з одним, а потім роблять підрахунок родинних і неспоріднених елементів. Французько-іспанська відповідність langue - lengua зараховується як плюс, a tete - cabeza - як мінус. Підраховується кількість родинних слів і перебуває відсоток родинних слів від загального числа родинних і неспоріднених пар.

Загальне число родинних слів звичайно рівняється числу елементів у досвідченому списку, за винятком тих випадків, коли не може бути підібраний еквівалент у відповідній мові або якщо, наприклад, у силу нерозробленості деяких питань в області звукових відповідностей ми не можемо встановити споріднення елементів. Найбільш загальне рівняння, по якому ми можемо обчислити час, виходячи з відсотка родинних слів, таке:t1 + t2 = log C : log R,де t1 і t2 ставляться до двох різних мов або діалектів, які розвилися зі спочатку єдиної мови. У цьому рівнянні t1 - час, виражений у тисячоріччях (або ще в якій-небудь зручній одиниці часу), які відокремлюють один з мов від періоду їхнього спільного існування в одній мові, a t2 - час самостійного існування другої мови; З - відсоток родинних елементів, знайдений при порівнянні двох досвідчених списків, а R - індекс сохраняемости, т.

е. установлений контрольним дослідженням передбачуваний відсоток лексичних одиниць, що збереглися в мовах після закінчення кожної одиниці часу. Якщо мова йде про одну лінію розвитку, тобто якщо рівняються два різні щаблі того самого мови, то один із щаблів може збігатися з періодом спільного існування; при цьому t1 буде дорівнює нулю, і, таким чином, 0 + t2 = log C : log R, або t2 = log C : log R. Найбільш простим є відношення між відсотком родинних слів і кількістю минулого часу в умовах повної або Нескороченої дивергенції, тобто коли не існує контактів між двома разошедшимися діалектами, які могли б перешкодити один іншому розвиватися своїм власним шляхом. При наявності контакту дивергенція буде протікати медленней. Щоб зробити виправлення на це, ми можемо позначити дивергенцію як st - (середня) ступінь розбіжності мов, помножена на час; у виправленому виді формула буде виглядати в такий спосіб:T = log C : s log R2,отсюдаmin T = log C : log R2.

У першому варіанті S являє собою число, що ніколи не перевищує 1 і дорівнює 1 тільки у випадку повної дивергенції; у всіх інших випадках s являє собою дріб, обернено пропорційного ступеня, у якій вплив контактів взаємодіє сдивергенцией. Значення рівняння з S складається в основному в тім, що з його допомогою можна зробити висновок про вплив контактів; обчислити s не можна, якщо ми не знаємо T. Тому дослідження треба починати з визначення часу розбіжності між усілякими парами мов у родинних групах, не забуваючи при цьому, що час розбіжності в дійсності може виявитися більше,.

чим те, що зазначено; у цьому складається значення другого» рівняння, де застосовується min T. Подальша робота носить реконструктивний характер Тут можна керуватися різними правилами, з яких наступні два є, мабуть, найважливішими. 1) Там, де є свідчення про повну територіальну ізоляцію двох мов друг від друга, дивергенція не гальмувалася впливом контактів. 2) У ряді випадків установленої дослідженням датування, що характеризує час розбіжності в групі родинних мов, найбільше число швидше за все вказує на час, що фактично минув з того моменту як всі мови, що входять у дану групу, являли собою одна єдина мова. Індекс сохраняемости, обчислений Лизом на основі тринадцяти контрольних мов, розглянутих по періодах часу від 1000 до 2200 років, дорівнює 80,48% ± 1,76% на тисячоріччя. Межі, у яких допускається помилка в підрахунку, обчислюються «як 9/10 помилки в середньому при використанні методу розгляду язикового матеріалу по коротких відрізках часу». Відсоток сохраняемости, прийнятий у більшості досліджень, дорівнює 80,5 - 81%, а R2 - сумарний індекс сохраняемости у двох родинних мовах - відповідно дорівнює 65 - 66% за 1000 років. 3. Ми маємо у своєму розпорядженні цілком достатню кількість даних, на підставі яких можна було б затверджувати, що встановлюване лексикостатистикою час розбіжності мов у відомій мері наближається до дійсного. Це підтверджується цілим рядом відповідностей,, включаючи різні історичні й установлені за допомогою археології дані, куди входить також і датування, установлене радиоуглеродним методом. Свідченням правильності лексикостатистического методу в цілому є внутрішня послідовність датування, установлюваного цим методом усередині мов однієї сім'ї або плем'я. Не претендуючи на бездоганність точного інструмента, лексикостатистика, безсумнівно, має велике значення для приблизного датування й уже зараз може бути корисним знаряддям при реконструкції доистории.

У той же час є всі підстави думати, що лексикостатистика ще не досягла, навіть не наблизилася до максимального розкриття своїх потенційних можливостей. Це пояснюється тим, що основні поняття лексикостатистики - індекс сохраняемости (спочатку названий константою) і означальний список - базуються на занадто обмеженому матеріалі Різні вчені, що вивчали даний метод, відзначають ряд. його слабких сторін, більшість яких здається поддающимся виправленню. Хоча остаточна доробка методу зараз поки ще неможлива, ми можемо усунути його окремі дрібні недоліки й удосконалювати, методику його застосування. У теперішній роботі основна увага звертається на означальний список. Робляться спроби внести в нього деякі зміни й з'ясувати кількісний вплив цих змін на точність лексикостатистического датування. Нижче буде показано, що результати в значній мірі сприятливі 4. «Елементи, придатні для досвідченого списку, повинні бути універсальними й не ставитися до яким би тони було областям культури... Більше того, вони повинні являти собою легко розпізнавані загальні поняття, до яких неважко підібрати відповідності серед простих слів більшості мов» («Лексикостат. датир.», стр. 38). Ці встановлені нами норми не завжди послідовна дотримувалися при створенні первісного досвідченого списку. Почати з того, що вже 15 з 215 елементів у списку Ліза, що приводиться в його основному дослідженні, у статті «Лексикдстатистическое датування», ми рекомендуємо опустити (ця робота була закінчена після того, як була написана стаття Ліза, але з'явилася в пресі раніше). На додаток до цих норм у процесі дослідження з'ясувалися ще деякі положення, включаючи сюди й ті негативні моменти, яких у дослідженні необхідно уникати, саме: потенційні дублети (відзначені Дугласом Тейлором), ідентичних корінь, звуконаслідування, значеннєві відтінки. Автор уже вказував на те, що «безсумнівно, можна було б скласти кращий досвідчений список, чим теперішній», але, ґрунтуючись на власному досвіді в даній області, він змушений помітити, що це досягається не так-те легко («Лексикостат. датир. », стор. 38). Перший досвідчений список у його найбільш ранньому виді після деяких виправлень і уточнень містив у собі близько 200 елементів, причому в той час автор сподівався збільшити його з метою досягнення ще більшої статистичної точності в дослідженні; однак йому вдалося підібрати тільки невелику горсточку дійсно підходящих елементів, у той час як, навпроти, виявлялися всі нові й нові елементи, які треба було виключити зі старого списку. Тому він переконався, що поліпшити список можна тільки при рішучому його скороченні в строгій відповідності із установленими нормами, маючи при цьому у виді, що якість принаймні так само важливо, як і кількість Новий список, що складається з 100 елементів, містить у собі 92 слова зі старого списку, що приводяться в табл. на стор. 78, плюс 8 нових елементів: say «сказати», moon «місяць», round «круглий», full «повний», knee «коліно», claw «пазур», horn «ріг», breast «груди». Навіть цей новий список має свої недоліки, але їх порівняно небагато, і вони незначні. 4.1. Якщо лексикостатистика повинна знайти широке застосування в науковому дослідженні, те необхідно, щоб до досвідчених елементів списку було б легко знайти відповідність у всіх або майже у всіх мовах. Тому, щоб не відступати від даного правила, ми виключаємо з нового списку елементи ice «лід», snow «сніг», freeze «замерзати», snake «змія», sea «море». Висувалося й інше речення: створити варіанти досвідченого списку для різних більших ділянок земної кулі Ця робота вимагає великої старанності у відборі місцевої лексики й у визначенні коливань в індексі сохраняемости, пов'язаних з кожним окремим списком. 4.2. Причина, що обумовлює необхідність уникати слів, що ставляться до області культури, полягає в тім, що їхня втрата або збереження перебувають у занадто тісній залежності від змін, що відбуваються в культурних областях, - звідси їхня непридатність служити показником кількості минулого часу. Спочатку ми припускали, що деякі поняття, що ставляться до культури, наприклад різні продукти й види діяльності, настільки древни й настільки широко поширені, що вільно від загальних недоліків, властивим термінам культури. Тому в першу редакцію старого списку входили такі слова: father «батько», mother «мати», husband «чоловік», wife «дружина», spear «спис», горі «мотузка», stab «втикати», sew «шити», hunt «полювати», play «грати», fight «боротися». Але ці елементи виявилися непридатними з інших причин: по-перше, вони не були універсальними,, по-друге, мали дублети, п

  
Понравилась статья? Поделиться с друзьями: