A Gulág és Gupvi táborokban fogvatartott magyarok – Elérhető a Szovjetunióba elhurcoltak adatbázisa

A Gulág és Gupvi táborokban fogvatartott magyarok – Elérhető a Szovjetunióba elhurcoltak adatbázisa

A kommunizmus áldozatainak emléknapján teszi közzé a Magyar Nemzeti Levéltár a Szovjetunióba elhurcoltak adatbázisát. A 681 955 rekordot és 1 363 910 felvételt tartalmazó adatbázis egyszeri átvétele és feldolgozása példa nélküli a magyar levéltárügy történetében.

A Magyar Nemzeti Levéltár és az Orosz Állami Hadilevéltár (RGVA) 2019. április 8-án a Magyar–Orosz Kormányközi Levéltári Együttműködési Bizottság 2019. évi munkatervének megfelelően egyezményt kötött az RGVA-ban őrzött, a második világháború idején a Vörös Hadsereg által foglyul ejtett és ezt követően a Szovjetunióban fogolyként nyilvántartott magyar nemzetiségű személyek nyilvántartó kartonjainak digitalizálásáról és a digitális másolatok átadásáról a Magyar Nemzeti Levéltár őrizetébe.

Az orosz nyelvű adatbázis, illetve a digitális kollekció feldolgozása jelentős kihívások elé állította a magyar történész és levéltáros szakmát. A kartonokon szereplő személyek azonosítása jelentette a legnagyobb feladatot, mivel az adatsorokat a legtöbb esetben magyarul nem tudó szovjet katonák, vagy oroszul nem tudó foglyok töltötték ki, az adatfelvétel pedig minden esetben kézírással történt.

A Magyar Nemzeti Levéltárnak átadott iratmásolatokhoz egy orosz nyelvű, cirill betűs adatbázist is készített az orosz fél, amely a nyilvántartó kartonokon szereplő, az egyes személyekhez köthető legfontosabb információkat tartalmazta. Az adatbázis a fogolyként nyilvántartott személy vezeték- és keresztnevét, születési adatait (születési helye és időpontja), a fogságba esés helyét és idejét, a fogoly nemzetiségét, a tábor elhagyásának okát és idejét, illetve amennyiben az illető személy elhunyt a fogolytáborban, abban az esetben az elhalálozásának időpontját és annak okát is feltünteti.

A levéltár szakembereinek először egy adatbázisba kellett betölteniük a több részletben átvett adatállományokat és képfájlokat. A hivatalos állományba vételt követően a cirill-magyar betűhív átírás (transzliteráció) jelentette az első kihívást. A közel 682 ezer fogolykarton 17 adateleme összesen 11 és fél millió adatot jelent, amelynek manuális feldolgozása évekig tartott volna. Ezért a személyneveknél és a földrajzi neveknél az átírás és a fordítás nyelvi feldolgozáson alapuló gépi algoritmusok segítségével történik – az Eötvös Loránd Kutatási Hálózat Nyelvtudományi Intézetének bevonásával. 2020. végéig a fordító algoritmus számos finomításon esett át, így 2021-re a személyneveknél 90% feletti, míg a földrajzi neveknél 70%-ot meghaladó jó eredményt sikerült a programnak elérni. Az adatbázis többi adatának (mint például a tábor neve, a távozás vagy halálozás oka stb.) feldolgozását levéltárosok manuális fordítással végzik. Az így lefordítandó adatelemek száma meghaladja az ötvenezret, és ezeknek a döntő része speciális nyelvtudást, a katonai rangok változásainak, a betegségeknek, az orvosi szakkifejezéseknek az ismeretét, széles történeti és földrajzi tájékozottságot igényel. Az adatellenőrzés folyamatosan halad előre, , a nyilvános adatbázist rendszeresen frissítjük. Még az idén várható adatbázis térkép alapú vizualizációja, amely a legújabb technológiai lehetőségeket kihasználva dolgozza fel és teszi hozzáférhetővé a kartonokon szereplő foglyok útját a fogva tartásuk évei alatt.

A kommunizmus áldozatainak emléknapján a Magyar Nemzeti Levéltár első, 1.0-ás változatában adja közre a Szovjetunióba elhurcoltak című adatbázisát. A közel 682 ezer fogolykarton adatbázisában jelenleg a legfontosabb személyes adatok alapján lehet keresni a hozzátartozókra, és megtekinthetők a kartonok orosz nyelvű másolatai is. A gyűjteményt kilenc további, hadifoglyokra és elhurcoltakra vonatkozó adatbázis és lista egészíti ki, melyekben a jövőben a gépi algoritmusok össze is kötik majd a bizonyosan egy személyre vonatkozó információkat.

Az adatbázis elérhető a  https://adatbazisokonline.hu/gyujtemeny/szovjetunioba-elhurcoltak címen.

Facebook
Érintő hírportál