Научници произвели аутоматску “временску машину” да реконструишу древне језике

21-02-2013 10:28:00 | | Милана Додиг / sciencedaily.com / Фото: gophoto |

Стари језици чувају веома вриједне податке о култури, политици и трговини прошлих миленијума. Ипак, њихово реконструисање у намјери да нам открије трагове о историји човјечанства би могло да буде детаљан посао који захтјева много труда. У овом тренутку, научници са Универзитета Беркли у Калифорнији су израдили аутоматску „временску машину“ која ће увелико да убрза и побољша процес реконструкције стотина наслијеђених језика.

У убједљивом примјеру како „опширни подаци“ и аутоматско учење почињу да имају значајан утицај на све аспекте знања, истраживачи са Универзитета Беркли и Универзитета у Британској Колумбији су креирали рачунарски програм који може брзо да реконструише „прото-језике“, језичке претке од којих су се развили сви савремени језици. Ови најранији познати језици укључују прото-аустронезијски који је узрок кориштења језика који се говоре у Југоисточној Азији, дијеловима континенталне Азије, Аустралији и Пацифику.

„Оно што ме одушевљава у вези са овим системом је што је потребно толико много великих идеја које су лингвисти имали о историјској реконструкцији, а аутоматизује их на новој скали: више података, више ријечи, више језика, али мање времена“, каже Ден Клајн, ванредни професор компјутерских наука на Берклију и коаутор студије објављене на интернету 11. фебруара у часопису „Proceedings of the National Academy of Sciences“.

Овај рачунарски модел истраживачког тима користи вјероватноћу резоновања, која истражује логику и статистику да предвиди исход, да би реконструисао више од 600 прото-аустронезијских језика из постојеће базе података која посједује више од 140 000 ријечи понављајући их са 85% тачности коју су лингвисти постизали ручно. Истраживачи истичу да овај систем може да обави велику реконструкцију у року од неколико дана, или чак сати, док је ручна инструкција педантан посао који моће да траје годинама.

Не само да ће овај програм да убрза способност лингвиста да обнове свјетске прото-језике у великој размјери побољшавајући наше схватање древних цивилизација засновано на њиховим рјечницима, већ ће нам и дати идеје како језици могу да се промијене у годинама што долазе.

„Наш статистички модел може да се користи да одговори на питања научника о језицима кроз вријеме, не само да да закључак о прошлости, већ и да израчунају како ће се језик мијењати у будућности“, каже Том Грифитс, ванредни професор психологије, директор лабораторије за рачунарску и когнитивну науку Универзитета Беркли и још један од коаутора студије.

Ово откриће унапређује Берклијеву мисију да опширним подацима да смисао и да нову технологију користи за чување и одржање угрожених језика као критичких извора за очување културе и знања. На примјер, научници планирају да користе рачунарски модел да реконструишу домородачке сјеверноамеричке прото-језике.

Најранији људски писани записи датирају од времена прије нешто мање од 6000 година, дуго послије појаве многих прото-језика. Иако археолози могу да баце директан поглед на древне језике у писаној форми, лингвисти обично користе такозвану „компаративну методу“ да испитају прошлост. Ова метода учвршћује везе између језика, поистовјећује их са звуцима који се редовно мијењају током времена и одлучује да ли ће дијелити заједнички матерњи језик.

„Да бисмо разумијели како се језик мијења, који звуци имају већу вјероватноћу да се промијене и какви ће постати, захтијева реконструкцију и анализу велике количине облика древних ријечи и ту аутоматизоване реконструкције играју важну улогу“, каже Александар Бушар-Коте, доцент за статистику Универзитета у Британској Колумбији и вођа студија коју је започео када је био апсолвент на Универзитету Беркли.

Берклијев рачунарски модел заснован је на утврђеној лингвистичкој теорији да се ријечи развијају заједно са гранама породичног стабла, слично генеалошком стаблу, што одржава лингвистичке везе које се развијају временом, са коријењем и чворовима који представљају прото-језике, док лишће приказује савремене језике.

Користећи алгоритам познат као Марковљев ланац Монте Карло, програм разврстава скупове сродних ријечи из различитих језика које исто звуче, историјски и поријеклом, да би процијенили из којег прото-језика потиче непар једног пара. На сваком кораку складишти се хипотетичка реконструкција за сваку сродну ријеч у било којем древном језику.

„Промјене и реконструкције у звуку су уско повезане зато их наш систем користи да у више наврата поправљају једно другог“, каже Клајн. „Прво се поправљају предвиђене промјене у звуку и утврђује боља реконструкција древних форми. Онда се поправљају реконструкције и поново анализирају промјене у звуку. Ови кораци се понављају и оба предсказања се поправљају како се основна структура временом појављује.“

Превела: Милана Додиг
Извор: http://www.sciencedaily.com/releases/2013/02/130212112025.htm