Nyelvi dokumentáció

Tudástár

Fejezetek:

1 2 3 5 6 7 8 9 10 11 12 13

Mi a nyelvi dokumentáció, hogyan zajlik, és miért fontos?

Az ember számára igen fontos, hogy megőrizze a legfontosabb események emlékét, illetve hogy továbbadja korának, kultúrájának, civilizációjának tudását a következő generációk részére. A századok során a tudás nemzedékről nemzedékre történő átadásának különböző módjai alakultak ki, amelyek vagy szájhagyományozáson vagy írott szövegeken alapultak. Ez utóbbinak köszönhetően lehetséges napjainkban visszakövetni és megismerni a még viszonylag távoli történelmet, illetve nyelvek történetét is. Kivételt jelentenek a nyelvek hangjai, hiszen elődeink beszédhangját lehetetlen volt megőrizni a legutóbbi időkig: az emberi hang rögzítése a 19. század második felében kezdődött el, s így igen „fiatal” a többi, évezredekre visszanyúló nyelvemlékhez képest.

Ebben a fejezetben a nyelvi dokumentálásról és az információk felhasználásával kapcsolatos kérdésekről lehet olvasni. Különösen a veszélyeztetett nyelvekkel foglalkozunk, továbbá azokkal a tényezőkkel, amelyek miatt speciális figyelmet érdemelnek.

MIÉRT KELL DOKUMENTÁLNI A VESZÉLYEZTETETT NYELVEKET?
Azért, mert így megőrizhető az utókor számára:

  • a beszélőközösség kultúrája, történelme és közös emlékezetük, illetve
  • nyelvük rendszere a további kutatások számára.

A nyelvi dokumentáció magába foglalja a gyűjtést, a feldolgozást és a nyelvi adatok tárolását is – akár szövegekről, szólistákról, beszélgetések felvételéről van szó, akár olyan videofelvételekről, amelyen mesét mondanak. Miközben a nyelvek iránt érdeklődők évszázadok óta folytattak efféle tevékenységeket, a legújabb idők technikai fejlődése, valamint a nyelvészetben és a társtudományok előrehaladása óriási változásokat hozott. Napjainkban a nyelvi dokumentáció a nyelvészet új és pezsgő ága, ahol különböző profilú és érdeklődésű kutatók dolgoznak együtt: vannak, akik messzi tájakra utaznak, hogy kevéssé ismert, veszélyeztetett nyelvekről felvételeket készítsenek, mások hatalmas multimédiás adatmennyiség tárolásának új eljárásait dolgozzák ki, ismét mások pedig a dokumentált anyagot arra használják fel, hogy újjáélesszék a veszélyeztetett nyelveket, például azzal, hogy szótárakat vagy tananyagokat állítanak össze.

A VESZÉLYEZTETETT NYELVEK DOKUMENTÁLÁSA MINT KALAND

2008-ban két, veszélyeztetett nyelvek dokumentálásával foglalkozó amerikai nyelvész filmet készített arról, hogy milyen érdekes, esetenként milyen drámai, és alkalmanként mennyire vicces tud lenni a munkájuk. Az alábbi linken tájékozódni lehet magáról a filmről, de honlapjukon más anyagok is elérhetők: http://www.pbs.org/thelinguists/
Megtekinthető a YouTube-on is: itt

A veszélyeztetett nyelvek dokumentációja különösen fontos és sürgető feladat akkor, ha legalább valamennyit meg akarunk őrizni azoknak a nyelveknek a jellemzőiről, amelyek hamarosan végleg eltűnhetnek. Tekintve, hogy a nyelvi dokumentálás nem csupán veszélyeztetett nyelvekre irányulhat, a hangfelvétel, a hangzó nyelvi adatok rögzítése vagy a korpuszépítés elméletileg minden nyelvre vonatkozóan ugyanolyan kérdéseket vet fel. Ugyanakkor a kisebb, kevésbé kutatott, és a súlyosan veszélyeztetett nyelvek dokumentálása más kihívásokat tartogat, mindenekelőtt az elérhető adatok mennyiségéből adódóan. Ha a nagyobb nyelvek valamelyikét kívánjuk dokumentálni, mint például az angolt, a kínait, a németet, a magyart, a hollandot vagy a lengyelt, már meglévő adatokra támaszkodhatunk, s könnyűszerrel találunk mintákat mind az írott, mind a beszélt változatából, amelyből a dokumentálás kiindulhat: könyveket vagy újságokat a múltból és a jelenből (közülük sok már digitalizált változatban elérhető), televíziós és rádiós hanganyagokat, amelyeket csak rögzíteni kell (vagy egyszerűen letölthetők az internetről), internetes fórumok és közösségi oldalak anyagát stb. Mivel a számítógépek, az internet, valamint a hangrögzítő eszközök széles körben elterjedtek, az ilyen adatok mennyisége gyorsan növekedik, és könnyebben hozzáférhetők is lesznek. A veszélyeztetett nyelvek helyzete egészen más. Közülük soknak nincs írásbelisége, vagy az írott adatok elérhetetlenek, olykor szórványosak is lehetnek. Előfordulhat továbbá, hogy a médiában sem jelenik meg a nyelv, esetleg a beszélői nem használnak internetet (ha pedig mégis, akkor másik nyelven teszik) stb. Ezekben az esetekben a nyelvésznek a nulláról kell indulnia, és olyan sok adatot kell gyűjtenie hangfelvételek révén, amennyire csak lehetősége van. Ideális esetben a nyelv dokumentálása különböző adatközlőktől (anyanyelvi beszélő) gyűjtött mintán alapul, akik különböző korcsoportokhoz tartoznak, más és más foglalkozást űznek, mindkét nem képviselői megtalálhatók köztük, eltérő származásúak stb. A veszélyeztetett nyelvek esetében azonban ez nem mindig lehetséges, például a beszélők alacsony száma miatt, vagy azért, mert már csak idősek használják a nyelvet.

A beszélők létszáma és az adatok mennyisége mellett ugyancsak fontos a kommunikáció a nyelvész vagy más kutató, és a nyelvet beszélő közösség között. A veszélyeztetett vagy kisebbségi nyelvek esetében a dokumentálást végzők általában nem tagjai az adott közösségnek. Nem feltétlenül beszélik folyékonyan a dokumentálandó nyelvet, és esetleg csak egy második vagy harmadik nyelven tudnak szót érteni velük. Ez pedig éppen annak a nyelvnek a természetellenes használatához vezethet, amelyet dokumentálni szeretnének. Másrészt előfordulhat, hogy a dokumentálást végzők nem ismerik megfelelően az összes szokást vagy helyes viselkedési módot, és ezért akaratlanul is megsérthetik a közösség tagjait. Így tehát mindig hasznos, ha a dokumentálást végzők között van, aki a helyi közösséghez tartozik. Ez nem pusztán a dokumentálás szempontjából fontos, hanem elvi kérdés is, hiszen a dokumentálás eredménye az ő kultúrájuk részét képezi. A kutató számára egy idős embernek a gyerekkoráról szóló elbeszélése pusztán „adat”, de az idős ember unokája számára a felvétel lehet nagyon személyes, féltve őrzött családi emlék is.

A nyelvi dokumentáció tehát gyakran hosszú folyamat, mert a dokumentálóknak – mielőtt a tulajdonképpeni munkát elkezdhetik – utazniuk kell, kapcsolatokat kell teremteniük, meg kell ismerkedniük a helyi kultúrával és szokásokkal, és lehetőség szerint a helyi közösség részévé is kell válniuk.

Nem pusztán szavak és mondatok

A fejezet elején a nyelvi dokumentációnak a szereplő előzetes meghatározásakor három elemet említettünk: a gyűjtést (rögzítés, fényképezés, írott dokumentumok felgyűjtése), feldolgozás (elemzés, rendszerezés, átírás, fordítás), valamint tárolás (archiválás). Ezeket az elemeket célszerű három egymást követő lépésnek tekinteni. Például először felvesszük a szavakat, azután lejegyezzük, lefordítjuk és elemezzük őket, majd az eredményt egy szólistaként vagy szójegyzékként (kisebb szótár) nyomtatott vagy elektronikus formában tároljuk. Ez azonban valójában három egymásba fonódó lépés, hiszen lehet átfedés közöttük, például a lejegyzést tekinthetjük gyűjtésnek és feldolgozásnak is, akár még egyfajta archiválásnak is. Sőt, gyakran érdemes előre tekinteni, és a munka kezdetén átgondolni a majdani elemzési és tárolási lehetőségeket. Például ha a kutatót a nyelv hangrendszere érdekli, akkor elsőként feltehetőleg egy kisebb mintát gyűjt, majd előzetes elemzést végez, hogy megállapíthassa az alapvető fonetikai jellemzőket, ezt követően pedig céltudatosan gyűjti a további adatokat. A fonetika iránt érdeklődőknek más elvárásai lehetnek a gyűjtendő adatokkal és az archiválás módjával kapcsolatban, mint például azoknak, akiket elsősorban a kulturális hagyományok érdekelnek. Mindazonáltal természetesen fontos különbséget tenni adatgyűjtés és elemzés között. Megfelelő rendszerezéssel a gyűjtött anyagok különféle feldolgozások számára is alkalmasak lehetnek: nyelvészet, kulturális antroplógia, történelem, vagy éppen földrajz. Az egyik kutató esetleg tipikus nyelvi (például hangtani vagy mondatszerkesztési) jellemzőket keres benne, míg egy másikat az anyagban tükröződő társadalmi viszonyok érdekelnek (mint például az adatközlő szerepe az adott közösségben), – különböző módszerrel, de azonos adatok alapján fognak dolgozni. A nyelvi dokumentáció tehát számos tudományágat szolgálhat, valamint más és más perspektívát nyithat a nyelvi dokumentáció számára. A nyelvészeknek nem csupán szavak vagy szövegek gyűjtése lehet a célja, a közösségre jellemző nyelvhasználati szokásokat és hagyományokat kell gyűjteniük, amelyek a következőkben jutnak kifejezésre:

  • nyelvi viselkedés: hétköznapi beszélgetések, a közösség tagjai közötti társas kapcsolatok, a nyelvi szokásokban és hagyományokban megfigyelhető nyelvhasználat;
  • a beszélők tudása nyelvükről: amit tudnak, illetve el tudnak magyarázni nyelvük szabályairól és szerkezetéről (Himmelmann 1998: 161-195 nyomán), továbbá amit nyelvükről gondolnak, például meg vannak-e győződve arról, hogy megőrzésre érdemes, illetve tennének-e valamit ennek érdekében, használják-e a nagyszülők, amikor unokáikhoz beszélnek)

E meghatározások értelmében tehát a nyelvi dokumentálás nem a nyelv hangjainak stb., hanem az elhangzottaknak mint kommunikációs eseményeknek a rögzítése. A kommunikációs esemény több mint a puszta beszéd, hiszen annak megértéséhez, ami éppen történik, információkra van szükségünk, például a gesztusok, arckifejezések, a tágabb kontextus ismeretére, a szituáció esetleges további részleteinek az ismeretére, illetőleg arról, ha felvétel közben valami más tevékenységet is folytattak.

Adat és metaadat

A metaadat olyan adat, amely egy másik adatot ír le: adat az adatról.

Például a fonetikus számára az adat: hangfájlból származó akusztikus adat az átírással együtt, de az azt kísérő metaadat tartalmazhat információt a beszélőről (neme, kora, származási helye és közössége, egészségi állapota, társadalmi és családi státusza), a felvétel körülményeiről (környezet, háttérzajok), technikai sajátságok (a rögzítés eszköze, szoftver, minőség) stb. Az adat és a metaadat elhatárolása a vizsgálódás céljától függ: ami metaadat a fonetikus számára, az elsődleges adat lehet a szociolingvista számára. Ha pedig ugyanazt a korpuszt egy kultúrantroplógusnak kellene elemeznie, akkor a fókusz nyilvánvalóan áttolódna a családi viszonyok és a társadalmi információk elemzésére, amelyek így adatnak, és nem pedig metaadatnak minősülnének.

Nyelvi dokumentációs módszerek

A kommunikációs viselkedés és a nyelvhasználat dokumentálása

Körülbelül a 20. század közepéig a nyelvészek úgy gondoltak a nyelv dokumentálására, mint valamely szótár vagy nyelvtan megírására irányuló munkára, illetve szövegek, különösen mesék és más elbeszélések gyűjtésére. Nagyon sok efféle dokumentációra került sor már a 18. és különösen a 19. század folyamán, amelyek eredményei még mindig igen értékesek a nyelvészek számára.

A régi és új típusú dokumentálás közötti különbséget könnyen fel lehet mérni az alábbi két példa alapján: meghallgathatsz egy 2013-ban készült hangfelvételt itt, illetve megnézheted egy 1895-ben S. Ulanowska által gyűjtött tündérmese átírását és fordítását.

Manapság már úgy érezzük, valami hiányzik ezekből a régi dokumentálásokból, valami, amit nehéz vagy éppenséggel lehetetlen volt létrehozni olyan helyeken és időkben, ahol és amikor kizárólag írásra és rajzolásra volt mód. Amint fent már volt szó erről, a nyelvi dokumentáció nemcsak a nyelvtan vagy szókincs bizonyos elemeinek leírását feltételezi: alapvető fontosságú, hogy a nyelvet természetes közegében örökítse meg, beleértve a beszélők különböző jellemzőit, valamint egymáshoz való viszonyukat és élethelyzetüket. Ha azonban egy hangfelvétel hangminőségére gondolunk, el kell ismernünk, hogy a legjobb felvételeket egyáltalán nem a nyelv természetes közegében lehet készíteni, hanem hangrögzítő stúdiókban. Ezekben a zajok kiküszöbölhetők, illetve minimálisra csökkenthetők, előre és nagy pontossággal beállíthatók a mikrofonok vagy videokamerák, típusaik kiválaszthatók annak érdekében, hogy még a legapróbb részlet is felvehető legyen. Az efféle felvételek nagyon értékesek egy nyelv hangrendszerének finom elemzésekor, és ezért a süketszobák a leggyakrabban az egyetemek fonetikai tanszékein vagy kutatóhelyek laboratóriumaiban vannak (itt tekintheted meg az ilyen helyek listáját).

studiokorulmenyek

Stúdiókörülmények: felvétel egy visszhangmentes helyiségben (süketszobában), laboratóriumi kutatók munka közben; stúdiófelszerelés (Adam Mickiewicz Egyetem, Poznań, Pszicholingvisztikai Tanszék; Agnieszka Czoska (bal, középső) és Maciej Karpiński (jobb) felvételei).

Ilyenformán a nyelvi dokumentációnak a minőségi kontroll és a természetes felvételi körülmények kívánalmai közötti legoptimálisabb megoldást kell megtalálnia. A dolgok természetéből fakadóan gyakorlatilag lehetetlen valószerű kommunikációs eseményt rögzíteni stúdió adta mesterséges környezetben. Ez különösen érvényes olyan idős beszélőkre, akik például egy súlyosan veszélyeztetett nyelv utolsó megmaradt beszélői. Másrészt viszont a stúdión kívüli hangfelvételek során mindig nehézséget jelent a jó hangminőség elérése még akkor is, ha kiváló hangfelvevők állnak rendelkezésre. Ha egy szobában ülve beszélgetünk, általában fel sem figyelünk az apró háttérzajokra, de ha a társalgásról készült hangfelvételt visszahallgatjuk, bizony észre fogjuk venni, hogy ketyegett az óra vagy búgott a hűtőszekrény.

GYAKORLAT

Ide kattintva hallgasd meg a teop nyelvű szövegek felvételeit! Milyen körülmények között készülhetett? Milyen háttérzajokat ismersz fel?

Keresd meg a teop nyelvet az interaktív térképen! Ott a többi hangfelvételt is meghallgathatod, és tájékozódhatsz a feladatban szereplő a teop nyelvről.

A beszélők – még ha nagyon barátságos környezetben zajlik is a hangfelvétel – általában ügyelnek beszédmódjukra, illetve igazítanak nyelvi viselkedésükön: beszédmódjuk megjósolhatatlanul módosulhat, például aszerint, hogy mennyire formális vagy informális a társalgás, udvariasabbá, illetőleg politikailag korrektebbé válhat – vagy éppen ellenkezőleg. Mindez megnyilvánulhat olyan fonetikai akusztikai paraméterek módosulásában, mint a tempó, az intonáció, az időzítési minták, szünet és sok más. Mindez az úgynevezett megfigyelési paradoxonnal van összefüggésben.

MEGFIGYELÉSI PARADOXON

A beszélt nyelv változatos használatára vonatkozó adatokhoz csakis módszeres megfigyelés alapján juthatunk. A szociolingvisztikai kutatások egyik célja, hogy megállapíthassuk, hogyan beszélnek az emberek, amikor nem figyelik meg őket. Tapasztalati tény ugyanis, hogy másként beszélünk akkor, amikor tudjuk, hogy megfigyelnek bennünket, s megint másként, amikor a megfigyelésről nem tudunk. Ezért a szociolingvisztika változatos módszereket dolgozott ki ennek az ellentmondásnak a kiküszöbölésére.

A nagy és jól dokumentált nyelvekben korpuszok számos változatát állították össze meglévő felvételek felhasználásával, illetve új felvételek létrehozásával. A meglévő hangfelvételekhez sorolhatók például a televíziós show-műsorok vagy a parlamentben elhangzó beszédek. Azonban ahogy ez sejthető is, a kamerák, reflektorok és mikrofonok közötti kommunkáció meglehetősen sajátos, és nem mindig alkalmas dokumentálásra vagy kutatási célokra.

Egy köztes módszer a spontán beszéd rögzítése és az adatok megtervezett lekérdezése között az az eljárás, amelynek során a dokumentálandó nyelv beszélői egyfajta forgatókönyv szerint beszélgetnek egymással. Például a Kiel város spontán nyelvhasználatát magába foglaló korpusz úgy készült, hogy a beszélgető pároknak a kezébe adtak egy-egy (egymástól különböző) időbeosztást, majd arra kérték őket, hogy – egy valósnak tűnő telefonbeszélgetést szimulálva – beszéljenek meg egy mindkettejüknek alkalmas időpontot egy találkozásra. Ennek eredményeképpen rövid, spontán dialógusok jöttek létre, amelyeknek a szókincse korlátozott és nagymértékben kiszámítható volt. Ugyancsak érdekes példa a JST/CREST adatbázis azon része, amely spontán és expresszív szövegeket tartalmaz. A gyűjtés során önkéntes beszélők kicsiny, hordozható felvevőeszközt viseltek magukon, és a saját, megszokott napirendjük során (otthon, munkában, iskolában) elhangzott megszólalásaikat rögzítették viszonylag hosszú időn át (például néhány hónapon keresztül). Az önkénteseknek módjukban állt bármikor lekapcsolni a hangrögzítő eszközt, illetve meghatározhatták, hogy van-e olyan része a felvett anyagnak, amelyet kizárnak az archiválásból és a kutatásból. A kutatók feltételezték, hogy bizonyos idő elteltével a beszélők teljesen hozzászoknak a felvevőeszközhöz, és többé nem figyelnek arra, hogy megszólalásaikat rögzítik, és így a viselkedésük spontánabbá, esetleg teljesen természetessé válik. Ennek a módszernek a hátulütője abból adódik, hogy a felvételek különböző zajszintű helyszíneken készültek, s ezért nem lehetett valóban jó hangminőséget elérni. Egy másik hátrány pedig a metaadtokkal kapcsolatos: problémás lehet követni a különféle beszélgetések minden körülményét (résztvevők kontextus stb.). Vannak továbbá szerzői jogi vagy személyiségi jogi problémák (például mindazon résztvevők védelme, akik nem egyeztek bele a kísérletbe – (lásd alább az etikai és jogi vonatkozásokról szóló részt).

ÖTLETBÖRZE

Gondolj ki olyan adatgyűjtési forgatókönyveket, amelyek jó minőségű adatokat eredményezhetnek a) gyerekektől; b) idősebbektől – anélkül, hogy a beszéd spontaneitásából sokat veszítenénk! Természetesen többféle jó megoldás létezik!

A veszélyeztetett vagy kisebbségi nyelvek esetében az adatok kiválasztása gyakran igen korlátozott, így jóformán bármilyen típusú adat értékes információk forrása lehet.

A további elemzések és leírások könnyebbé tételére az adatokkal érdemes megfontoltan bánni, mintsem „kellő átgondoltság nélkül gyűjteni az adathalmazokat, vagyis anélkül, hogy szem előtt tartanánk az elemzést vagy struktúrát” – amint Nikolaus Himmelmann fogalmaz.

Másképpen fogalmazva: ha van hozzáférésed egy veszélyeztetett nyelvhez (például a nagymamád ezt a nyelvjárást beszéli), akkor természetesen készíthetsz gyors felvételt az okostelefonoddal, majd pedig felteheted a YouTube-ra vagy más hasonló oldalra (ha az interneten szörfözöl, láthatod, hogy sok ember tesz így) – csakhogy ez nem ugyanaz, mint amikor professzionális nyelvi dokumentációt végeznek.

A beszélő tudásának dokumentálása

veszelyeztetett-nyelvek-dokumentalasa

Veszélyeztetett nyelvek dokumentálása: a terepmunka körülményei: yurakaré (balra, fotó: Sonja Gipper és Consejo Educativo del Pueblo Yurakaré) és tahuatai (jobbra, fotó: Gabriele Cablitz).

Jóllehet igen fontos a nyelvi viselkedést természetes közegében dokumentálni, ez általában még nem elég ahhoz, hogy átfogó képet kapjunk a nyelvről. Annál is kevésbé, mert a beszélők mindig sokkal többet tudnak nyelvükről, mint ami nyelvi viselkedésükből kiderül. Az, hogy egy természetes beszélgetes során a szókincs elemeiből mennyi kerül ténylegesen elő, ez a beszélgetés témájától függ. Jobbára a leggyakrabban használt szavak szerepelnek benne, a kevésbé gyakori elemek azonban esetleg több órányi rögzített beszélgetésben sem fordulnak elő. Amennyiben a dokumentáció kizárólag ilyen anyagon alapul, a szó- és kifejezéskincs nagysága és összetétele esetleges marad. Például ha arról rögzítünk beszélgetést, hogy különböző családokban hány gyerek van, illetve mennyi idősek, akkor meglehetősen sok számnév fog elhangozni. Más felvételekben viszont egyetlen számnév sem fordul elő, ellenben sok színelnevezés bukkanhat fel, és így tovább. Azok a kutatók, akik a szókincs valamely speciális része iránt érdeklődnek (például a színnevek, állat- és növénynevek, testrésznevek, elöljárószók), nem várnak arra, hogy ezek a szavak maguktól felbukkanjanak a spontán beszélgetés során, hanem az adatgyűjtés más módjához folyamodnak, például az adatok lekérdezéséhez (a lekérdezés – ang. elicitation – olyan gyűjtésmódot jelent, amelynek során a kívánt adattípust előre megtervezett módon gyűjtik fel a beszélőtől, és nem pusztán arra hagyatkoznak, ami a beszélgetésben előfordul).

A szókincs lekérdezésének bevett módja, hogy egy szólistát kell lefordíttatni a dokumentálandó nyelvre. A fordításnak mint lekérdezési módnak azonban vannak hátrányai, nem minden szó fordítható egyszerűen egyik nyelvről a másikra, valamint azok a célnyelvi (esetünkben a dokumentálandó nyelvhez tartozó) szavak, amelyek nincsenek meg a forrásnyelvben (például az angolban), nem fognak előfordulni. Így tehát mindig szerencsésebb képeket, kellékeket, tárgyakat használni a szókincs meghatározott részeinek lekérdezéséhez. Ezek alkalmazása hasznos nyelvtani szerkezetek lekérdezéséhez is, így a helyviszonyok és mozgás kifejezése (példul hogyan mondjuk azt, hogy A macska a térképen van, A macska a fára mászik, Az alma leesett a fáról). Már léteznek is speciális képsorok és más eszközök arra, hogy előhívják a szókincs vagy a nyelvtan kívánt elemeit. Az internetről ingyenesen letölthető „történetmesélő” képsorok is, amelyek jól használhatók különféle, elsősorban igei szerkezetek előhívására. Egy másik példa a terepmunkához készen felhasználható gyűjtemény, a Field Manuals, ahol olyan képeket találunk, amelyek tárgyak térbeli elhelyezkedéséhez szóanyag előhívására alkalmasak (vö. az alábbi képekkel):

targyak-terbeli-elhelyezkedese

Tárgyak térbeli elhelykedése egymáshoz képest. (Topological Relations Picture Series, Bowerman et al., 1992; a teljes gyűjtemény: fieldmanuals.mpi.nl)

A képek letöltésekor általában javaslatokat is kapunk a lekérdezés és rögzítés forgatókönyvére vonatkozóan (lásd például a példaanyagot az útvonal leírásának lekérdezésére fieldmanuals.mpi.nl/volumes/1993/route-description-elicitation/, vagy például a test kiszínezésének feladata: fieldmanuals.mpi.nl/volumes/2003-1/body-colouring-task). Figyelembe kell azonban venni, hogy nem minden kép egyértelmű, illetve, hogy néhány közülük esetleg problematikus lehet a kulturális különbségek miatt (ilyen például a muszlimok számára a tisztátalannak számító kutya, valamint az élőlények, elsősorban az ember ábrázolása a képtilalom miatt).

Arra, hogy megadott mintára összefüggő szöveget hívjunk elő, gyakori eljárás némafilm bemutatása, illetve – elsősorban gyerekekkel – képregényt vagy képeskönyvet nézetnek meg, majd pedig megkérik az adatközlőket, hogy mondják el saját szavaikkal, mit látnak. A nyelvészetben a leghíresebb ilyen film a Történet a körtéről lásd itt, amelyet már nagyon sok nyelven elmondtak. Az ilyen módon gyűjtött szövegek összevethetők egymással, és különféle nyelvtani vonatkozások elemezhetők bennük.

Azok a kutatók, akik elsősorban a nyelv hangjaival foglalkoznak, és nem az új szavak és szerkezetek gyűjtésével, megkérhetik a beszélőket, hogy olvassák fel az előre elkészített és átgondolt szólistákat vagy rövid szövegeket. E szövegekre jó példa Ezópusz egyik meséje, A északi szél és a Nap, amelyet a fonológusok és a fonetikusok gyakran használnak a nyelvek hangrendszerének illusztrálására (vö. Handbook of the International Phonetic Association lásd itt. (Chapter 2 és Chapter 4). A mese fordítása más nyelvekre problémás is lehet, mivel nem biztos, hogy minden szónak vagy szerkezetnek van direkt megfelelője a célnyelvben. Ugyancsak gondot okozhat, ha a célnyelvnek egészen egyszerűen nincs írásos formája, ami lehetetlenné teszi az olvasási feladatot.

FELADAT

Hallgasd meg az Északi szél és a Nap című Ezópusz-mesét két nyelven! Figyeld meg a hangrögzítés minőségét!

 

  • Polish – click here to listen (speaker: Ewa Sobczak, a professional actress [15])
  • Latgalian – click here to listen (speaker: Evita Kozule, a student of a linguistic faculty, recorded by K. Klessa & N. Nau)

Ha arra vagyunk kíváncsiak, hogy a beszélők mit tudnak a nyelvről, természetesen közvetlenül is kérdezősködhetünk (bár ez sosem lehet az adatgyűjtés egyedüli módja). Erre a célra hasznos lehet összegyűjteni azokat a kifejezéseket, amelyeket az adott kultúra használ, amikor a nyelvről beszél – megvan-e például az olyan angol szakszavak megfelelője, mint szó, mondat, szótag, múlt idő és így tovább – vagy más kategóriáik vannak? Ez megteremti a lehetőségét annak, hogy a nyelvről ugyanazon a nyelven beszéljünk, ne egy másikon kelljen leírnunk.

A dokumentációs gyakorlat elemei

Ahogyan azt fentebb meghatároztuk, a nyelvi dokumentáció a nyelvi adatok gyűjtését, feldolgozását és archiválását foglalja magába. Ha figyelembe vesszük, hogy a nyelvet dokumentálóknak gyakran rengeteget kell utazniuk azért, hogy adatokat gyűjtsenek, majd később azokat biztonságosan tárolják, feldolgozzák, megosszák, akkor könnyű megértenünk, hogy miért szoros a kapcsolat a nyelvi dokumentáció és a nyelvtechnológia között. Néhány évvel ezelőtt, amikor egy átlagos felvevő súlyos és tekintélyes szerkezet volt, a dokumentálás sokkal nagyobb kihívást jelentett, mint ma, amikor már a zsebünkben is elfér egy nagyon jó minőségű audio- vagy videofelvevő.

A technológiai fejlesztéseknek köszönhetően ma az adatokkal kapcsolatos munkálatok példanélküli hatékonysággal és gyorsasággal folynak. Például ma már lehetséges az, hogy a másodpercnél is rövidebb idő alatt fussunk át több millió szót azért, hogy egyetlen egy információt megtaláljunk, vagy hogy nagyon jó minőségű videó- vagy hanganyagot kis méretű és megbízható eszközön tudjunk tárolni (miközben hasonló mennyiségű adat tárolására régebben több tucatnyi, de legalábbis több száz négyzetméternyi helyiségre lett volna szükség). Sőt, ma már ezt a rengeteg adatot bármelyik pillanatban elérhetővé tehetjük a szélesebb közönség számára. Az Interneten is temérdek információt találunk. Azonban ezek a lehetőségek hatalmas kihívást is jelentenek. Például a korábbinál bonyolultabb/problematikusabb lehet az adatok rendszerezése vagy az azokban történő keresés, és a felhasználói hozzáférés szabályozása, valamint számolni kell egy sor jogi és etikai kérdéssel is (ld. a linket lent).

Előkészítő lépések

A tulajdonképpeni adatgyűjtést előkészítő lépések közé tartozhat, hogy felvegyük a kapcsolatot a beszélőkkel, megismerkedjünk a már rendelkezésre álló anyagokkal, megtervezzük a felvétel forgatókönyvét, ellenőrizzük a szoftvert és a felszerelést, kiválasszuk a fájlformátumot, vagy hogy döntsünk a fájlelnevezésekről. A beszélőkkel való kapcsolatfelvételt követően jó gyakorlat és gyakran kötelességünk is (link a jogi témákhoz/fejezethez) megkérni őket arra, hogy hivatalosan is járuljanak hozzá a felvételhez, biztosítva pozitív hozzáállásukat és részvételi hajlandóságukat. A veszélyeztetett nyelveket olyan kisebb közösségekben beszélik, ahol a család és más társadalmi kapcsolatok sokkal fontosabb szerepet játszhatnak, mint a nagyobb, szerteágazóbb közösségekben. A helyi közösség attitűdje ilyen esetekben valóban kulcsfontosságú, szabályaikat és belső törvényeiket figyelembe kell venni. – Elfogadható-e az, hogy egy idegen előzetes értesítés nélkül házakat és szakrális helyeket fotózzon, vagy hogy felvegye az ott élők beszédét? – Célszerű tehát először engedélyt kérni mindehhez. Vannak olyan közösségek, amelyek kifejezetten engedélyhez kötik, hogy róluk fényképek készülhessenek (ld. például http://www.alaska.org/detail/russian-old-believer-communities).

Mi lehet az oka annak, ha egy beszélőközösség nem akarja, hogy a kutatók a nyelv beszélőiről és otthonaikról videofelvételeket készítsenek? Miként lehetne feloldani a kutatók és a közösség közötti érdekellentét?

Egy másik hasznos lépést is megtehetünk előre: döntsünk a gyűjtött adatok rendszerezéséről, pl. gondoljuk végig, hogy hol fogjuk tárolni az adatokat, hogyan készítünk másolatokat, és hogyan nevezzük majd el a fájlokat és könyvtárakat. Ezek a tervek már az adatelemzést készítik elő, mivel később segítségünkre lesznek az adatok rendszerezésében és leírásában.

HOGYAN RENDSZEREZZÜK A FÁJLOKAT/KÖNYVTÁRAKAT?

Amikor több fájllal dolgozunk, akkor az egyik legfontosabb lépés, hogy megállapodásra jussunk a fájlok elnevezéseit illetően, lehetőleg még az adatgyűjtés megkezdése előtt. Gondoljuk végig, hogy mik szerepeljenek a fájlok és könyvtárak elnevezéseiben. Választhatunk például az alábbiak közül:

  • A létrehozás dátuma (bár a dátumot leginkább a fájl fejlécébe helyezzük, a dátumot a fájl nevébe is beírhatjuk, ha az a kényelmesebb)
  • A beszélő azonosítója
  • Az adatok típusa (beszédstílusok, regiszterek, környezet …)
  • egyéb?

Milyen sorrendbe helyezhetjük el ezeket az elemeket? Ne felejtsük el, hogy akár név szerint is csoportosíthatjuk a fájljainkat. A fájlnevekben használhatunk rövidítéseket vagy kódokat, hogy az elnevezések rövidebbek legyenek. Arra is van lehetőség, hogy a fájlokat egyedi azonosító számmal lássuk el, és hogy a tartalmat illető információt további fájlokba rögzítsük.

  • Ha az adatokat egy már létező tárhelyen helyeznénk el, így például a DOBES-ben (link), érdemes ellátogatni a honlapjukra, tájékozódni az előírásokról és azokat használni már a munka megkezdésekor (link) http://dobes.mpi.nl/deposit-your-data/.
  • A már létező fájlformátumokról és sztenderdekről ld. például Gibbon et al. (1997).

Abban az esetben, amikor nem állítunk elő új adatokat, hanem inkább a már meglévő archívumokkal foglalkozunk (például történeti adatokat digitalizálunk vagy régebbi felvételeket írunk át), fontos lépés a forrásanyaghoz kapcsolódó eredeti elnevezési eljárások és egyéb információk megtartása, ami nagyon hasznos lehet abban az esetben, ha szeretnénk visszatérni az adatok első változatához.

Felvevők és a felvétel előkészítése

Mielőtt kiválasztanánk az audiofelvevőt, a fényképezőgépet, videokamerát, egyéb felvevőket és mikrofonokat, tájékozódnunk kell a jellemzőikről, az árukról, arról, hogy megfelelnek-e az igényeinknek. Befolyásolhatja a választásunkat a felvételi forgatókönyv, a felvételi lehetőségek (audio/video), a felvétel helyszíne („felvételen” az összes felvett eseményt értjük), valamint a beszélők jellemzőit, életkorukat, nemüket, társadalmi státuszukat stb. Fontos tisztázni azt a technikai kérdést is, hogy a felszerelést állandóan használjuk-e vagy inkább terepmunkák alkalmával. Ez utóbbi esetben lényeges a felszerelés mérete, súlya, a tápegység, az elemek típusa és elérhetősége, a feltöltési lehetőségek, a sérülékenység stb. Mikrofonokat különféle eszközökhöz, például hordozható felvevőkbe illesztve is használhatunk külső eszközként, esetleg vezetékekhez csatlakoztatva.

Gondoljunk olyan tényezőkre, amelyek befolyásolhatják, hogy milyen eszközöket választunk a terepmunkánkhoz. Gondoljunk arra, hogy:

  • repülővel kell a célállomásra utazzunk
  • a feladatunk az, hogy néhány, egymástól nem túl távol lévő faluban dokumentáljuk az ott beszélt nyelvet, és a falvak között kerékpárt fogunk használni (a felszerelést abban szállítva)
  • csak korlátozott mértékben férünk hozzá az Internethez és szükség lesz arra, hogy 1) az adatokat időközben elmentsük 2) azokat néha lassú Interneten keresztül tovább küldjük

dinamikus-es-kondenzatormikrofon

Dinamikus (balra), kondenzátormikrofon (középen), kondenzátor fejmikrofon (jobbra). Fotó: Maciej Karpiński

Felépítésük szerint két mikrofontípust különböztethetünk meg: a dinamikus és a kondenzátormikrofont. A kondenzátormikrofonokat általában rádió- és televízióstúdiókban használják. Jellemzőjük, hogy nagyon érzékenyek, így például a finom háttérzajokra is. Hasonló mikrofonokat használnak a mobiltelefonokban és az olcsóbb felvevőkészülékekben is, de ezeket más technológiával gyártják és a minőségük is összehasonlíthatatlanul rosszabb, mint a drágább modellekben lévőké. Valamennyi kondenzátormikrofonhoz szükség van tápegységre, ami hátrányt jelenthet terepmunka esetén. A dinamikus mikrofonokat további tápegység nélkül is lehet használni, ami leegyszerűsíti a használatukat. A kondenzátormikrofonoknál érzékenyebbek, ami előny is lehet akkor, ha a felvételi hátterünk zajos, és nagyon hasznosak az olyan beszédfelvételeknél, amikor a beszélő közvetlenül a mikrofonba beszél. Dinamikus mikrofonokat használnak például az énekesek élő koncertjeiken és kondenzátormikrofonokat a hangstúdiókban.

Találjunk ki 2-3 felvételi helyszínt és forgatókönyvet! Gondoljunk a felvételi környezetre és a beszélők számára is! Milyen mikrofonok lehetnének a legalkalmasabbak a felvételhez?

Az adatok feldolgozása és elemzése

Az adatgyűjtést követő lépés általában az, hogy az adatokról másolat készítése, eredeti formájukban, módosítás nélkül. A másolatokat tárolhatjuk CD-n, DVD-n, blu-ray lemezen, helyi vagy távoli tárhelyen, merevlemezen vagy kisméretű hordozható médián, így például pendrive-on és memóriakártyán. Miután biztonságban tudhatjuk a másolatokat, hozzá kezdhetünk az adatok elemzéséhez és/vagy további feldolgozásához.

Az adatelemzés több feladat elvégzését foglalja magába. Az audioadatok leírása esetén a felvételek annotálására kerül sor, azaz a megnyilatkozások időben összehangolt lejegyzésére annak érdekében, hogy a lejegyzett szöveg később követhető legyen, és a felvételt úgy tudjuk meghallgatni, mint egy feliratos filmet. Ennek köszönhetően különböző beszédhangokat, szótagokat, szavakat vagy más jeltöredékeket (ld. a lenti animációt) elemezhetünk. Igény szerint, az annotáció tartalmazhat a prozódiára, a párbeszédekre, a szünetmintára, a hezitálást jelölőkre, a kiejtési hibákra, valamint a beszéd vagy beszélők sajátos vonásaira vonatkozó információkat.

annotation-pro-2

Videofelvétel többszintű annotációja (Annotation Pro).

Több annotálásra alkalmas számítógépes program létezik, ezek közül kutatási és oktatási célokra nem egy ingyenesen felhasználható. Néhányuk csak audiofájlok annotálására alkalmas, míg vannak olyanok is, amelyekkel videofájlokat is jelölhetünk (az eszközök listáját ld. a fejezet végén).

annotation pro1Videofelvétel többszintű annotációja (Annotation Pro).

Ha részletes fonetikai elemzés a cél, akkor hasznos egy spektogramot is választanunk, amely képes a hangfájlok megjelenítésére is [link] (ld. 4., a látható beszédről szóló fejezetet). A felvételeket először általában ortografikusan írjuk át (a nyelv hivatalos ábécéjét használva, ha az rendelkezésre áll), majd fonetikusan. A Nemzetközi Fonetikai Ábécé (IPA) http://www.langsci.ucl.ac.uk/ipa/ipachart.html lehetővé teszi a beszéd részletes fonetikai átírását. A számítógépes adatfeldolgozás szükségleteit az ún. Computer Readable Phonetic Alphabet (SAMPA) http://www.phon.ucl.ac.uk/home/sampa/) elégíti ki. A SAMPA többek között annak köszönheti népszerűségét, hogy nem használ a számítógépen a sztenderd latin billentyűzettől eltérő karaktereket. A nagyobb nyelvek esetében olyan eszközöket is találunk, amelyek automatizálják az annotálást és az átírást (pl. GTP – a grafémát fonémává alakító eszközök automatikusan alakítják át az ortografikus szövegeket fonetikai átírásokká, ASR – automata beszédfelismerő eszközök). A veszélyeztetett nyelvek esetében nehezebb hasonló eszközöket találni, bár nem lehetetlen.

Habár a fonetikai ábécék a legalkalmasabbak a beszéd átírására, érdemes megjegyeznünk, hogy bizonyos esetekben javasolt lehet olyan átírást vagy kvázi-fonetikai átírást használni (pl. a cirill szöveget latin betűkkel), amelyből ugyan hiányoznának bizonyos részletek, viszont a nem hozzáértők számára könnyebb lenne. Az ilyen jellegű megoldásokat általában az olyan korpuszok és szótárak számára találják ki, amelyeket a tudósok és a helyi közösség számára hoztak létre.

Veszélyeztetett nyelvek on-line archívumai

A veszélyeztetett nyelvek egyik legfontosabb archívuma a DOBES-archívum (Dokumentation Bedrohter Sprachen) http://dobes.mpi.nl/ – számos veszélyeztetett nyelv komplex dokumentálásának internetes adatbázisa. A DOBES-t a Language Archive (TLA) tartja fenn és Nijmegen-ben a Max Planck Pszicholingvisztikai Intézetben található. Ennek a kezdeményezésnek nem csak a veszélyeztetett nyelvekhez kapcsolódó adatok és metaadatok archiválása a célja, hanem a nyelvészeti archiválás, az eszközök és a dokumentálási módszerek fejlesztése is. Egy másik archívuma a veszélyeztetett nyelveknek az ELAR, (Endangered Languages Archive) http://elar.soas.ac.uk/) ami a SOAS-ban működik (School of Oriental and African Studies, London), és amely szintén a veszélyeztetett nyelvek dokumentációjának megőrzésével és kiadásával foglalkozik. Információ- és adatszolgáltatás mellett mindkét archívum égisze alatt lehetőséget biztosít saját adatok elhelyezésére és tárolására.

A nyelvi repozitóriumokban található adatokhoz való hozzáférésre vonatkozó szabályokat általában az egyes források maguk határozzák meg. Bizonyos adatok bárki számára hozzáférhetőek, míg másokkal kapcsolatban korlátozások lehetnek érvényesek. Így például, egyes adatok esetében arra kérnek majd, hogy vedd fel a kapcsolatot a szerzőkkel és kérj engedélyt, míg máskor arról is nyilatkozni kell az adatok letöltése előtt, hogy milyen célra szeretnéd felhasználni azokat. Ez nehézkesnek tűnhet, de érthetővé válik akkor, ha belegondolunk abba, hogy az adatok egy személy életének vagy örökségének egy része, és nem csupán olyan „szavak vagy mondatok”, amelyekre a kutatásunkhoz szükség van.

A DOBES egy olyan program, amely 2000 óta sok nyelvdokumentációs projektet finanszírozott már. Ezekről a projektekről itt olvashatsz többet: http://dobes.mpi.nl/projects/.

Válassz ki egy projektet, és az alábbi szempontok szerint mutasd be:

  • Mik voltak a projekt főbb célkitűzései?
  • Szerinted kik azok, akiket érdekelhetnek ezek az adatok?
  • A nyelvészek mellett még milyen kutatók vettek részt a dokumentációban?
  • A közösség tagjai hogyan vettek részt a projektben?
  • Milyen adatokat gyűjtöttek?
  • Hogyan gyűjtötték, dolgozták fel és tárolták az adatokat?

 

A nyelvi változatosságról és a veszélyeztetett nyelvekről szóló érdekes honlap a SOROSORO programé, http://www.sorosoro.org, amely az őshonos népeket támogatja, itt tájékozódhatunk az adatok gyűjtéséről, digitalizálásáról és leírásáról. Az Endangered Languages projektnek http://www.endangeredlanguages.com/ is az a célja, hogy a világ veszélyeztetett nyelveiről osszon meg információkat, adatokat. Lengyelország és szomszédos országainak nyelveivel foglalkozik a Linguistic Heritage honlapja http://inne-jezyki.amu.edu.pl, amely kifejezetten azokat a veszélyeztetett nyelveket mutatja be, amelyeket valaha a közép-kelet-európai régióban, az ún. Lengyel-Litván Unióban (Rzeczypospolita) beszéltek. Ez a terület ma több országot foglal magába, így Lengyelországot, Lettországot, Litvániát, Fehéroroszországot és Ukrajnát. A honlapot kutatók, anyanyelvi beszélők és más érdeklődők számára fejlesztették ki.

KERESÉS ADATBÁZISOKBAN

Látogass el egy nyelvi adatbázisba az interneten!

Milyen jellegű információkat adnak meg a nyelvről (beszélőkről, a kultúráról, a földrajzi jellegzetességekről, a hang- és szövegforrások fajtái)?

Nézd meg ezeket a honlapokat:

  • http://dobes.mpi.nl/projects/
  • http://www.endangeredlanguages.com/
  • http://www.sorosoro.org/
  • http://inne-jezyki.amu.edu.pl/

Ütköztél-e bármiféle problémába a keresés során? Sikerült-e esetleg más hasonló honlapokat is találnod?

Jogi és etikai problémák

A nyelvészeti források használatának és megosztásának egyik fő nehézsége a magánjellegű adatok védelme. Hasonlóképpen foglalkozni kell a beszélőközösségre jellemző kulturális, etikai, társadalmi és vallásos kérdésekkel is, valamint hivatalos engedélyt is kell kérnünk a beszélőktől az adatok használatára, és különösen azok közzétételére.

Jogi szempontból a beszélgetésben résztvevők írásbeli beleegyezése általában elegendő a felvételhez. A jogi megoldások országonként változhatnak. Például a telefonbeszélgetések rögzítése valamennyi résztvevő beleegyezése nélkül számos országban, például Lengyelországban és Németországban is illegális, míg vannak országok (pl. az USA bizonyos államai), amelyek engedélyezik a felvételt, ha az egyik fél beleegyezik. De Lettországban például erre vonatkozóan nincsenek szabályozások, és így minden felvétel szabadon felhasználható.

FELADAT

Nézz körül az interneten és válaszolj az alábbi kérdésekre a saját országodról:

  • Ad-e a jog lehetőséget a telefonbeszélgetések rögzítésére?
  • Ad-e a jog lehetőséget saját telefonbeszélgetésünk felvételére, és például annak bizonyítékként történő felhasználására a bíróságon?
  • Vannak-e korlátozások?

A gyakorlat szerint valamennyi beszélőt arra kérik, hogy egyezzen bele a felvételbe, és abba, hogy azt meghatározott célokra felhasználják, és esetleg közzé is tegyék. A beleegyezést leggyakrabban írásos formában készítik el (audiofelvételek esetében erre szóban is sor kerülhet a többi adattal együtt felvéve).

hozzajarulas

Egyes közösségekben a hozzájárulás nem kizárólag egyéni döntés, hanem sokkal inkább általános eljárás, szokások vagy hozzáállás kérdése. A dokumentálónak jó kapcsolatokat kell kialakítania a helyi közösség tagjaival, mind a tervezési fázis, mind pedig a felvétel alatt és után, amikor sor kerül az adatok elemzésére, rendszerezésére és feldolgozására. Hasonlóképpen figyelmet kell fordítani az archiválási módszerek megválasztására és az adatok megosztásának módjára is.

GONDOLATMORZSÁK

Képzeld el, hogy megismertél egy veszélyeztetett helyi nyelvváltozatot, és szeretnél részt venni annak dokumentálásában és/vagy revitalizálásában! Melyek lennének az első lépéseid?

Először gondold végig a válaszaidat, majd látogass el a következő oldalra, és nézd meg, hogy az ott látható fiatalok hogyan dokumentálnak [http://languagesindanger.eu/what-can-be-done/study-linguistics/].

Irodalomjegyzék

Bowerman, M., Pederson, E. (1992). Topological relations picture series. In Stephen C. Levinson (ed.), Space stimuli kit 1.2: November 1992, 51. Nijmegen: Max Planck Institute for Psycholinguistics.
Campbell, N. (2002). The recording of emotional speech: JST/CREST database research. Proceedings of Language Resources and Evaluation Conference (LREC), Las Palmas, Spain.
Gibbon, D., Moore, R., & Winski, R. (Eds.). (1997). Handbook of standards and resources for spoken language systems. Walter de Gruyter. Available on-line at:
http://sldr.org/SLDR_data/Disk0/preview/000836/?lang=en
Himmelmann, N. P. (1998). Documentary and descriptive linguistics. Linguistics 36:161-195. (on line e.g.: http://ifl.phil-fak.uni-koeln.de/fileadmin/linguistik/asw/pdf/Publis/1998a.pdf)
Himmelmann, N. P. (2006). Language documentation: What is it and what is it good for? In Essentials of Language Documentation, Gippert, J., Himmelmann, N. P., Mosel, U. (Eds.), Trends in Linguistics, Studies and Monographs 178:1-30. Mouton de Gruyter, Berlin New York.
Himmelmann, N. P. (2012). Linguistic Data Types and the Interface between Language Documentation and Description. In Language Documentation & Conservation Vol. 6 (2012), pp. 187-207.
Klessa, K., Wagner, A., Oleśkowicz-Popiel, M., Karpiński, M. (2013). “Paralingua – a new speech corpus for the studies of paralinguistic features”, in Vargas-Sierra, Ch. (Ed), Corpus Resources for Descriptive and Applied Studies. Current Challenges and Future Directions, Procedia – Social and Behavioral Science 95. (48-58), 2013.
Labov, W. (1972). Sociolinguistic Patterns. Philadelphia: University of Pennsylvania Press, p. 209.
Lüpke, F. (2010). Research methods in language documentation. Language Documentation and Description, 7, 55-104.
Seifart, F. (2011). Competing motivations for documenting endangered languages. In Haig, G.L.J., Nau, N., Schnell, S., Wegener, C. (Eds.) Documenting endangered languages. Trends in Linguistics, De Gruyter Mouton.

Hasznos linkek

A nyelvi dokumentációról

DOBES (Dokumentation Bedrohter Sprachen) – http://dobes.mpi.nl/
L&C Field Manuals and Stimulus Materials – http://fieldmanuals.mpi.nl/
SOAS (School of Oriental and African Studies) – http://www.soas.ac.uk/
Endangered Languages – http://www.endangeredlanguages.com/
Endangered Languages Documentation Programme (ELDP) – http://www.hrelp.org/
SOROSORO – http://www.sorosoro.org/
Poland’s Linguistic Heritage – http://inne-jezyki.amu.edu.pl

Az annotációs eszközökről

Audio- és videofájlok annotálására:

Elan – http://tla.mpi.nl/tools/tla-tools/elan/
Anvil – http://www.anvil-software.org/

Audiofájlok annotálására és részletes fonetikai elemzésére (beleértve a spektrogramokat):

Praat – http://www.praat.org/
Wavesurfer – http://sourceforge.net/projects/wavesurfer/
Annotation Pro – http://annotationpro.org/

További hasznos, a dokumentációt támogató, ingyen letölthető szoftverek:

SIL – http://www.sil.org/linguistics/linguistics-software
Exmaralda – http://www.exmaralda.org/en_index.html