Carabela loyihasi: Ispaniya tarixi sirlarini ochish uchun sun'iy aql

Carabela loyihasi: Ispaniya tarixi sirlarini ochish uchun sun'iy aql

Sun'iy intellekt (AI) va Machine Learning (ML) tarixchilar xizmatida, Ispaniya tarixiga katta qiziqish uyg'otadigan hujjatlarni topadigan algoritmlar bilan bir qatorda. Buning ortida Carabela loyihasi, so'nggi ikki yil ichida Universitat Politècnica de València (UPV) tadqiqotchilari va Andalusiya tarixiy meros instituti suvosti arxeologiyasi markazi tomonidan ishlab chiqilgan loyiha.

Ushbu doirada ular ishlab chiqdilar va qo'lladilar yangi AI / ML texnikasi bu Hindistonning umumiy arxivi va Kadisning viloyat tarixiy arxividan 130000 dan ortiq rasmlarning tarkibiga kirishga imkon beradi. Loyiha BBVA Jamg'armasining Raqamli Gumanitar sohadagi ilmiy tadqiqot guruhlariga yordam dasturi tomonidan qo'llab-quvvatlandi.

"Ushbu usullar yordamida biz har qanday grafik hujjatni veb-brauzer bilan bir xil tezlikda kuzatib boramiz, aniq so'zlarni, so'z birikmalarini, so'z birikmalarini va boshqalarni aniqlaymiz." Bularning barchasi biz misollardan o'rgangan va hozirda Ispaniya tarixidagi ushbu to'plamlarni o'rganish uchun eng buyuk ittifoqdosh bo'lgan statistik modellar tufayli. Xuddi shu usullarni boshqa ko'plab tarixiy hujjatlarda ham qo'llash mumkin », - deya ta'kidlaydi Enrike Vidal, UPV ning Pattern Recognition and Human Language Technologies (PRHLT) markazi tadqiqotchisi.

Hindlarning umumiy arxivi

The Hindiston bosh arxivi fondlari XV-XIX asrlarda Amerikaning Ispaniya tarixini - AQShning janubidan Tierra-de-Fuego va Filippingacha bo'lgan tarixini o'rganish uchun ular juda qiziqish uyg'otdi.

Haqida Ispaniyaning dengiz sayohati va savdosi bilan bog'liq qo'lyozmalar, tahlilni an'anaviy OCR transkripsiyasi texnikasi bilan amalga oshirish mumkin emas - chunki ular bosma matn uchun mo'ljallangan - yoki qo'lda yozilgan materiallar uchun maxsus texnikalar bilan, chunki ushbu tarixiy matnlarga nisbatan qo'llaniladigan natijalar juda noaniq.

"Carabela bizga tarixiy hujjatlarning katta to'plamlaridagi qo'lda yozilgan matnlarning rasmlarini indeksatsiya qilishga imkon beradigan mashinalarni o'rganish texnikasi yordamida yanada ko'proq borishimizga imkon berdi, ularning saqlanish holati va yozma uslublari odamlarning hujjatlarini o'qishni deyarli imkonsiz qiladi", deydi Joan Andreu. Sanches, shuningdek, PRHLT-UPV tadqiqotchisi.

Ushbu metodlar ishlatiladigan harflarning har xil turlarini aniqlash va farqlashga qodir hujjatlar har bir davrda sanaladi va hatto sifati juda past bo'lgan tasvirlarni tahlil qiladi.

Kalit uning algoritmlari hajmi misollardan avtomatik ravishda o'rganiladigan modellarni olish.

«Bunday modellar juda qoniqarli natijalarga erishish uchun ma'lumotlarning nisbatan kam miqdorini talab qiladi. Ushbu usullar imlolar, iflosliklar yoki tasvir sifatidagi farqlar kabi hujjatlar o'zlari tomonidan yuzaga keladigan muammolarga qoniqarli javob berishga imkon beradi. ", Vidal qo'shadi.

Ushbu holatda, Archivo de Indias-dan taxminan 500 sahifa bilan o'rganish amalga oshirildiKarlos Alonso va uning suv osti arxeologiyasi markazining mutaxassislari jamoasi tomonidan tanlangan va yozilgan.

Vayronalar va Avstraliya

Caravel nurga olib keldi halokatlarga oid qo'lyozma ma'lumotlar tarkibidagi buyuk tarixiy va madaniy boylik tufayli birinchi darajadagi arxeologik merosni tashkil etadi. "Shunday qilib, Carabela ham suv ostida qolgan merosni talon-taroj qilinishiga yo'l qo'ymaydi", deb tushuntiradi Joan Andreu Sanches.

Ammo, shubhasiz, ushbu mablag'larning eng ajablantiradigan topilmalaridan biri Avstraliya bilan bog'liq bo'lgan "Tierra Austral Incognita" kabi atamalarni qidirishda sodir bo'lgan. 18-asrning boshlarida qirol Felipe V nomiga yozilgan xat.

"Iezvit Andres Serrano tomonidan yozilgan ushbu maktubda biz 1705 yildan boshlab janubiy qit'aga juda aniq murojaatlarni topdik, kapitan Jeyms Kuk o'z qirg'oqlariga 1770 yilda yetib kelishidan ancha oldin. Avstraliyaning tarixi va hozirda bizning markazimizda ishlab chiqilgan indeksatsiya va ehtimollik qidirish usullarini qo'llash orqali kashf etayotganimiz haqida kam ma'lum bo'lgan ma'lumotlar », - deb tushuntiradi Enrike Vidal.

O'QING, Oltin asr va Transkribus

Xuddi shu ish yo'nalishida PRHLT jamoasi o'rgangan va tahlil qilgan Evropaning READ loyihasida ishtirok etdi ispan adabiyotining oltin davriga oid hujjatlar, ular orasida Lope de Vega qo'lyozmalari Milliy kutubxona fondidan va birodarlar Grimmlarning Marburg davlat arxividan yozishmalar.

Shuningdek, Finlyandiyaning Milliy arxividan 150 mingga yaqin sahifa indekslangan va kelgusi loyihalarida u 1 million sahifaga yaqin indeksatsiya qilmoqchi.

Bundan tashqari, Loyiha doirasida Transkribus ishlab chiqilgan, tarixiy jihatdan katta ahamiyatga ega bo'lgan eski hujjatlar tasvirlarini izohlash imkonini beruvchi dasturiy platforma.

Transkribus birinchi navbatda ma'lumotni yaratish bo'yicha trening vositasi sifatida ishlatiladichunki qo'lda yozilgan matnni aniqlash texnikasi ma'lumotlarning avtomatik o'rganilishini talab qiladi. Yaqin kelajakda u boshqa xususiyatlarni o'z ichiga oladi, masalan, boshqa tillar uchun avtomatik modellarni tayyorlash.

READ shuningdek, UPV ta'sischi a'zosi bo'lgan va Transkribus dasturini barcha ro'yxatdan o'tgan foydalanuvchilarga taqdim etadigan Evropa kooperativini yaratish bilan yakunlandi.

Hozirda Transkribus platformasi Dunyo bo'ylab 30000 dan ortiq foydalanuvchisi bor, bu uni barcha tarixchilar uchun xalqaro ma'lumotnoma vositasiga aylantiradi.


Video: AKVAPRINT TEXNOLOGIYASI SIRLARI. SIFATLI AKVAPRINT QAYERDA GENTRA DIAMOND NEGA MASHXUR?