Back to site
Since 2004, our University project has become the Internet's most widespread web hosting directory. Here we like to talk a lot about web development, networking and server security. It is, after all, our expertise. To make things better we've launched this science section with the free access to educational resources and important scientific material translated to different languages.

Аўстронезійской базавы слоўнікавы запас базы дадзеных

Нашы даследаванні:

Пытанні аб паходжанні чалавека маюць трывалы зачараванне (напрыклад, адкуль палінезійцы прыйшлі?). Мовы, як гены, архівы гісторыі. Яны з'яўляюцца крыніцай жыццёва важных доказаў, каб дапамагчы разгадаць таямніцы мінулага. У апошні час былі велізарныя дасягненні ў галіне вылічальных метадаў, якія выкарыстоўваюцца, каб зрабіць высновы з генетычных дадзеных.

Мовы развіваюцца ў дзіўна падобная спосабаў біялагічнага віду. Яны падзеленыя на новыя мовы, мутаваць, а часам і выміраюць. Аднак, нягледзячы на ??гэтыя паралелі лінгвісты звычайна не выкарыстоўваецца филогенетические метады, якія вырабілі рэвалюцыю ў эвалюцыйнай біялогіі ў апошнія дваццаць гадоў.

Аўстронезійской моўнай сям'і з'яўляецца адным з найбуйнейшых у свеце, і адзін з найбольш шырока разышліся, з каля 1200 моў, у раёне паміж Мадагаскар, Тайвань, Гаваі, востраў Вялікадня і Аотеароа / Новай Зеландыі. Наша даследаванне выкарыстоўвае филогенетические метады для праверкі гіпотэз аб пашырэнні аўстронезійской моўнай сям'і і ўрэгулявання частцы Ціхага акіяна. Размяшчаючы генетычныя і лінгвістычныя доказы ў агульнай метадалагічнай асновы мы спадзяемся, што зможам зрабіць больш магутныя высновы аб нашым мінулым.

Што мы зрабілі

Мы прааналізавалі асноўныя слоўніка з 400 моў у гэтай базе дадзеных, выкарыстоўваючы вылічальныя филогенетические метады для стварэння мноства "сем'і" дрэвы для моў ціхаакіянскага рэгіёну.

Вынікі ясна паказваюць, што паходжанне за ўсё аўстронезійской моўнай сям'і могуць быць датаваныя на Тайвань прыкладна 5200 гадоў таму, і пераехаў праз выспы Паўднёва-Усходняй Азіі, па-Новай Гвінеі і ў Палінэзіі.

Пакажам, што засяленне ціхаакіянскіх прайшла праз серыю пашырэння імпульсаў і паўзаў ўрэгулявання. Мы можам звязаць гэтыя імпульсы для развіцця новых тэхналогій - лепш каноэ, сельская гаспадарка, сацыяльныя метады для вырашэння паміж выспамі адлегласьці ў Палінэзіі і г.д.

Карта Ціхага акіяна і мова "радаводу", якія паказваюць на ўрэгуляванне Ціхаакіянскім аўстронезійской народаў. Паўзы адбылася да ўрэгулявання Філіпінах і да ўрэгулявання Заходняй Палінэзіі. імпульсаў Хуткае пашырэнне адбылося праз Філіпіны, уздоўж узбярэжжа Новай Гвінеі, у Мікранэзіі і Палінэзіі.

Высокае дазвол версіі фігуры (400KB)

Поўны мал Дрэва аўстронезійской мовы.

Высокае дазвол версіі фігуры (1.5MB)

Як гэта працуе?

  1. Збор дадзеных:

    Для таго, каб сапраўды праверыць гіпотэзу аб перадгісторыі, нам неабходна вялікая колькасць дадзеных. Мы сабралі гэтыя дадзеныя на працягу шасці гадоў з некалькіх крыніц:

    1: Слоўнікавыя сабраныя лінгвістаў падчас палявых работ. Асноўнымі пастаўшчыкамі былі Роберт Blust, Джон Лінч, і Малькольм Рос. Многія іншыя лінгвісты ласкава спрыяў спісы слоў для моў, яны знаёмыя з.

    2: Апублікаваны спісаў слоў і слоўнікаў, у тым ліку палінэзійскіх праекта Лексікон вялікі палец рукі (Биггс і Кларк 2000), а таксама вялікая калекцыя Мікранэзіі рэканструкцый (Бэндэр і інш 2003a, 2003b)..

    3: носьбіты мовы, якія спрыялі спісы слоў для іх мовы праз вэб-інтэрфейс

    Глядзіце аўстронезійской базавы слоўнікавы запас баз дадзеных Аўтары Старонка поўны спіс укладчыкам, і гл. нашу артыкул на базе таксама.

  2. Група запісаў у роднасных мноства:

    Каб вызначыць адносіны паміж мовамі мы выкарыстоўвалі лінгвістычнага параўнальнага метаду. Гэты метад звычайна бярэ ўзор лексікі і прыступае да рэканструкцыі сістэматычнага гуку адпаведнасцяў паміж мовамі, з тым каб выявіць гістарычна звязаны "роднаснымі" формы. Гэтыя адпаведнасці могуць быць выкарыстаны для ідэнтыфікацыі слоў (і, такім чынам, мовы), якія адбыліся ад агульнага продка.

    У прыведзенай ніжэй табліцы запісы для "рукі" паказаць агульныя "L" на "R" гук змену. Гэта выяўляецца таксама ў пазіцыі "скуру", з сістэматычным адпаведнасць паміж Гавайскіх ў "L" і Tahitian / маоры / с Рапануи "R".

    Іншы сістэматычнага адпаведнасці можна ўбачыць у запісе на "косткі" і "жанчына". Гэтыя адпаведнасці могуць быць выкарыстаны для ідэнтыфікацыі слоў (і, такім чынам, мовы), якія адбыліся ад агульнага продка. У гэтым выпадку, формы пафарбаваны ў блакітны доля агульнага продка.

    У пазіцыі "пляваць", Ёсць два роднасных наборы - першы "Ану / aanu" прысутнічае ў Самоа і Рапануи і адбываецца ад продкаў ядзернай палінэзійскіх форме * Ану, у той час як другі "tuhu / tutuha" з'яўляецца інавацый на Усходзе палінэзійскіх моў Таіці і маоры.

    Табліца палінэзійскіх моў з роднасныя словы колерам.

    Гэтыя роднасныя меркаваньні былі зроблены або ў кансультацыі з шэрагам моўных экспертаў, уключаючы Роберта Blust (прафесар лінгвістыкі Універсітэта Гаваяў ў Мано), Джэф Марка (навуковы супрацоўнік, Аўстралійскі нацыянальны універсітэт), Джон Лінч (прафесар Ціхаакіянскага Мовы і дырэктар Мовы групы Ціхага акіяна ў Універсітэце паўднёвай часткі Ціхага акіяна), Лоран Sagart (старэйшы навуковы супрацоўнік, Нацыянальны цэнтр La Recherche навуковае), Малькальм Рос (прафесар лінгвістыкі, Аўстралійскі нацыянальны універсітэт), і саміх сябе.

  3. Пераўтварэнне роднасна мностваў ў двайковай матрыцы:

    Для аналізу гэтых роднасных мностваў код іх у выглядзе двайковых знакаў Паказаныя наяўнасць або адсутнасць роднасных набор на кожным мове.

    Сэнс слова "косткі" ў лік аўстронезійской мовы, паказваючы мову, роднасны мноства, і двайковага кадавання.

  4. Аналіз дадзеных:

    Метады, якія мы выкарыстоўвалі тут вядомыя як байесовский филогенетические метады. Гэтыя інструменты, выкарыстоўваюцца сучаснай эвалюцыйнай біялогіі будаваць сямейныя дрэвы на аснове ДНК-паслядоўнасцяў.

    У рамках гэтага аналізу мэты знайсці мноства найбольш верагодных дрэў прыведзены дадзеныя і стахастычнага мадэлі лексічнай эвалюцыі. Наша мадэль дазваляе для розных хуткасьцяў змены паміж роднаснымі мностваў, дзе некаторыя элементы могуць развівацца хутчэй, чым іншыя, у розных месцах на дрэве.

  5. Знаёмствы дрэў:

    Мы можам даты дрэў мы выявілі выкарыстаннем филогенетических метадаў датавання. Дрэвы мы знайшлі ў пошук вышэй галін прапарцыйна колькасць змен па гэтай лініі. Гэтыя галіны даўжыні можа быць ператворана часу шляхам дадання пункту каліброўкі. Напрыклад, Усходняй палінезійскі падгрупе можа быць абмежаваная прыкладна да 1200 да 1300 гадоў таму на аснове зыходных раз ўрэгулявання. Аналагічным чынам, Chamic падгрупа можа быць адкалібраваць на аснове таго, што Chamic выступоўцаў былі згаданыя ў кітайскай запісу каля 1800 гадоў таму, і, верагодна, увайшлі В'етнам каля 2600 гадоў таму.

    Гэтыя каліброўкі дазваляюць метад ацэнкі, як хутка змены вымяраецца даўжыня галіны адбываюцца. Мы можам затым пераўтварыць Філіял даўжыні ў часе ацэнак "згладжвання" тэмпы змены па дрэве. Замест таго, каб прыняць пастаяннай хуткасцю ўтрыманне, гэта дазваляе пэўныя часткі дрэва, каб змены хутчэй ці павольней, чым іншыя.

Часта задаюць пытанні

  1. Якія метадалагічныя новаўвядзенні ў параўнанні з вашым даследаванні, апублікаваным у прыродзе ў 2000 годзе

    Імпульс / паўза мадэлі складае чатыры асноўныя прадказанні аб паходжанні, узросце, паслядоўнасці і тэрмінаў імпульсаў і паўзаў у аўстронезійской пашырэння. У 2000 паперы мы пратэставаны толькі прадказанне аб паслядоўнасці.

    Мы ў стане праверыць іншыя тры прагнозу ў гэтым гэтым дакуменце, паколькі з чатырох метадычныя дасягненні.

    1. У дадзенай працы мы абапіраемся на наш аналіз вельмі вялікую базу дадзеных па базавай лексікі мы пабудавалі (больш за 34000 набораў роднасных на 400 мовах). Выбаркі моў і сінонімаў ў 2000 годзе дакумент быў неаднародным. Гэта азначала, што мы не змаглі атрымаць дакладныя ацэнкі даўжыні галін і, такім чынам, не можа даты дрэў.

    2. Мы тэстуем тайваньскіх паходжання з дапамогай некаторых знешніх груп у корань дрэва. У 2000 годзе паперы толькі карані дрэва ў Тайвані (калі тайваньскія паходжання).

    3. Мы выкарыстоўваем байесовской филогенетические метады, а не скупасць падыход да пабудовы дрэў. Гэта азначае, што мы можам відавочна ўключаць нявызначанасці ў нашых ацэнках дрэвы і іх галіны даўжынёй у наш аналіз.

    4. Самае галоўнае, у гэтай працы даты дрэў. Гэта значыць, мы можам пратэставаць ключавыя прадказанні аб узросце аўстронезійской і тэрміны пашырэння імпульсаў і паўз.

  2. Ці з'яўляецца гэта лексикостатистика ?

    Колькасць Лексикостатистика разлічвае парамі роднасна меры падабенства паміж мовамі, каб звязаць іх на падгрупы. Нашы метады разліку верагоднасці кожнага роднасна набор у шэраг дрэў у пошук, каб знайсці мноства найбольш верагодных дрэў. Так як дадзеныя прааналізаваны і статыстычны аналіз прынцыпова адрозніваюцца.

    Для атрымання дадатковай інфармацыі аб тым, як филогенетические метады працы, гл старонку ў Вікіпэдыі.

  3. Вашы даты ацэнкі, заснаваныя на глоттохронологии ?

    Колькасць Нашы метады не лічыць адной сталай хуткасці змены з цягам часу. Замест гэтага мы выкарыстоўваем метад (" Penalised праўдападабенства Ацаніць Згладжванне "), што дазваляе нам на" гладкай "назіраліся тэмпы змены праз дрэвы ў той час як з улікам гістарычнай інфармацыі як" кропкі каліброўкі ". Гэта дазваляе вызначаным мовах і падгрупы для змены пры розных хуткасцях з цягам часу. Акрамя таго, паколькі мы разлічылі гэтыя ацэнкі ўзросту праз размеркаванне дрэў, у нас ёсць даверны інтэрвал вакол кожнай узроставай ацэнкі.

  4. Мовы запазычаць адзін ад аднаго - як бы гэта паўплывала на вашу вынікі?

    У нашай базе дадзеных у нас вельмі шмат запазычаных слоў вызначаны. Мы выдалілі іх з аналізу. Акрамя таго, мы пазбягалі выкарыстання моў, якія, як вядома, крэолы ці "гібрыдных" гісторый.

    Што яшчэ больш важна, нашы метады на самай справе вельмі ўстойлівыя да запазычання паміж мовамі (мы працуем на даследаванні, якія паказваюць, гэта на дадзены момант), і нават досыць высокага ўзроўню запазычанняў наўрад ці істотна прадузятым нашы вынікі.

  5. Хіба не ўсе ўжо ўпэўнены, што Wallacean паходжання мадэлі быў няправы?

    Гэта залежыць з кім Вы кажаце. Сярод лінгвістаў і археолагаў яна мае некалькі прыхільнікаў, але гэта вельмі сур'ёзна многіх генетыкаў.

  6. Што пра тэорыі Тура Хейердала аб тым, што палінезійцы прыйшлі з Паўднёвай Амерыкі?

    Існуе ніякіх доказаў, што палінезійцы ўзнікла ў Амерыцы, і самыя сучасныя даследчыкі лічаць гэта малаверагодным. Замест гэтага, генетычныя, моўныя, і археалагічныя сведчанні паказваюць на ўсе адпраўлення ў Тайвані.

  7. 400 моў, роднасных 34000 набораў..., Што з'яўляецца даволі вялікім, ці не так?

    Так і ёсць. Большасць mitchondrial працы геномікі ажыццяўляецца па дадзеных каля 16000 пар падстаў, і, як правіла, не больш за 400 відаў небудзь!

    Дзякуючы Марк Pagel і Эндру Мід нам пашчасціла мець доступ да вялікіх кластарам кампутара на цэнтр перспектыўных вылічальных сістэм і новых тэхналогій (Асэтыі) у Універсітэце Чытанні.

    Усе уверх, аналіз мы зрабілі тут узяў на паўтара месяца размяркоўваюцца на гэты кластар з 150 вузлоў.

Published (Last edited): 25-05-2011 , source: http://language.psy.auckland.ac.nz/austronesian/research.php