Në Anglinë mesjetare, lebra u hodh mes ketrave dhe njerëzve: ScienceAlert
A mundet AI ChatGPT të zhbllokojë gjuhët e teksteve të lashta misterioze?
Përafërsisht 4000 vjet më parënjë qytetërim i lashtë që jetonte në Luginën e Indus (India dhe Pakistani i sotëm) i përbërë 10 për qind e popullsisë së botës. Megjithëse mbeten pak të dhëna për këtë grup njerëzish, arkeologët zbuluan se ata ishin mjaft të avancuar për të pasur sistemin e tyre të shkrimit – i cili ende nuk është deshifruar.
I njohur si Shkrimi Industeksti misterioz ka habitur studiues, gjuhëtarë dhe madje edhe kriptografë dekada. Vetëm disa qindra simbole janë klasifikuar, pasi shkencëtarët nuk kanë zbuluar një “gur Rosetta”, ose çelës, për deshifrimin e kësaj gjuhe të panjohur. Por përparimet e fundit në inteligjencën artificiale – duke përfshirë modelet e mëdha të gjuhës si ChatGPT – mund ta ndryshojnë këtë, duke ofruar njohuri të mëtejshme në qytetërimet e lashta.
Zbulimi i skenarit të Luginës së Indus
Ndërsa qytetërimi i Luginës së Indus u zbulua zyrtarisht në vitet 1920, nuk do të ishte deri 1999 që u zbuluan pjesët e para të skenarit të tij. Vula, qeramikë dhe madje edhe eshtra ishin të gdhendura me simbole të çuditshme të shoqëruara me figura kafshësh. Këto mbishkrime të ndërlikuara e bënë zbulimin edhe më joshëse, duke i vendosur sekretet e kësaj shoqërie komplekse thjesht jashtë mundësive.
“(Skenari) do të na ndihmojë të mësojmë shumë për këtë qytetërim të lashtë, stilin e tyre të jetesës (dhe njohuritë e tyre) për botën,” thotë Satish Palaniappan, një shkencëtar i të mësuarit të makinerive të aplikuara në Microsoft. “Të gjitha këto janë informacione të mbyllura në të cilat aktualisht nuk kemi akses.”
Zhbllokimi i skenarit të Indus Valley
Palaniappan është një nga shumë studiues që përdor algoritmet e AI për të provuar dhe deshifruar skriptin. Së bashku me një koleg, ai zhvilloi një algoritmi për të identifikuar karaktere të ngjashme në tekst, duke kërkuar modele në frekuenca të veçanta të karaktereve, sipas një punimi të botuar së fundmi në revistë PLOS. Më pas studiuesit mund t’i përdorin këto frekuenca të karaktereve për të krijuar një çelës për deshifrim.
Gjuhë të tjera të vjetra, si egjiptianishtja e lashtë, u deshifruan me një çelës shumëgjuhësh: the Guri rozetë. Në atë rast, guri lidhi një fjalim tashmë të deshifruar (alfabetin grek) me një të padeshifruar (hieroglifet egjiptiane), duke i lejuar arkeologët të deshifrojnë gjuhën e panjohur.
Meqenëse gjuhës së Luginës së Indus i mungon një çelës shumëgjuhësh, kjo i detyron studiues si Palaniappan të mendojnë në mënyrë krijuese për të gjetur lidhje midis shkrimit të Indusit dhe gjuhëve të tjera.
“Me avantazhet e fundit në Përpunimin e Gjuhëve Natyrore, veçanërisht me modelet e mëdha të gjuhëve si ChatGPT-3 dhe ChatGPT-4, ne mund të përpiqemi të rregullojmë ose të ofrojmë më shumë kontekst në gjuhët që besojmë se rrjedhin nga Skriptet Indus, si Skriptet Brahmi “Dhe shikoni nëse këto modele gjeneruese mund të bëhen krijuese dhe të kuptojnë se çfarë do të thotë secili simbol dhe si përshtaten në një strukturë gjuhësore.”
Përpjekje të tjera për të zhbllokuar skriptin Indus
Në mënyrë të ngjashme, Peter Revesz, një profesor i informatikës në Universitetin e Nebraska-Lincoln, po përpiqet të lidhë shkrimin Indus me gjuhë të tjera. Ashtu si Palaniappan, Revesz, së bashku me studentin Shruti Daggumati, personazhe të grupuara brenda Skriptit të Luginës së Indus dhe i krahasoi me personazhe me pamje të ngjashme si në Shkrimet Brahmi ashtu edhe në alfabetin fenikas, të cilat i kishin rrënjët në kulturën minoane.
“Ti ndihesh si një arkeolog i përzier me një shkencëtar kompjuteri,” thotë Daggumati në një Video në Youtube rreth projektit. “Ju duhet të jeni Indiana Jones-i juaj.”
Në një punim të vitit 2018, Revesz dhe Daggumati zbuluan se shenjat e shkrimit Indus u ngjanin disa karaktereve të alfabetit fenikas me 90% siguri, sipas algoritmit AI që ata përdorën.
“Ne mund ta mendojmë atë si një version të Epokës së Bronzit të Rrugës së Mëndafshit,” tha Revesz, duke theksuar lidhjen midis dy kulturave. “Është e mundur që përdorimi i peshores, peshave dhe shkrimit të përhapet nëpër këto rrugë tregtare. Prandaj, Lugina e Indusit dhe shkrimi Linear A mund të lidhen. Unë jam duke zhvilluar algoritme të AI për të ndihmuar në hetimin e kësaj mundësie, e cila do të ishte një çelës për deshifrimin e Skriptit të Luginës së Indus.”
Deshifrimi i dorëshkrimit të Voynich
Ndryshe nga shkrimi Indus, një tekst misterioz i mesjetës së vonë i njohur si Dorëshkrim Voynich ofron një mori karakteresh për t’i analizuar arkeologët dhe gjuhëtarët. Shkruar përreth 600 vjet më parë, teksti prej 240 faqesh përbëhet nga 25 deri në 30 shkronja dhe karaktere të panjohura. Pranë gjuhës, ka 126 ilustrime shumëngjyrëshe të bimëve me pamje të huaj brenda faqeve të saj, nga të cilat 124 janë identifikuar botanikisht në bazë të strukturës së luleve, gjetheve ose rrënjëve të bimës.
Një proces i ngjashëm ende nuk është kryer për gjuhën e dorëshkrimit, e cila ka ngecur kriptografët dhe gjuhëtarët që nga zbulimi i saj në 1912.
“Deshifrimi i dorëshkrimit të Voynich mund të japë një pasqyrë historike në jetën mesjetare,” thotë Kevin Knight, një profesor i shkencave kompjuterike në Universitetin e Kalifornisë Jugore. “Por kjo nuk është ajo që i shtyn njerëzit të përpiqen ta deshifrojnë atë. E bëjnë për sfidën intelektuale. Do të ishte mirë të ishe personi i parë në 500 vjet që do të lexonte dhe kuptonte një dokument kaq misterioz.”
A mund t’i deshifrojë AI këto tekste të lashta?
Knight dhe studiues të tjerë besojnë se dorëshkrimi është shkruar si një shifër, ndoshta edhe si një anagram, gjë që e bën deshifrimin e tij edhe më shumë një enigmë. Për Knight, ky është vendi ku një algoritëm i AI mund të jetë i dobishëm.
“Nëse ju tregoj një shifër të gjatë, mund të vini re se ‘P’ ndiqet gjithmonë nga ‘D’,” thotë Knight. “Mund të merrni me mend se ‘P’ dhe ‘D’ do të thotë ‘Q’ dhe ‘U’ respektivisht sepse kështu funksionon QU në anglisht. Pasi ta dini se ‘D’ qëndron për ‘U’, mund të kërkoni modele që lidhen me ‘U’. Kompjuteri mund ta bëjë këtë arsyetim më shpejt dhe më mirë se një person.”
Megjithatë gjuha mesjetare e koduar në Dorëshkrimin e Voynich mund të jetë një version më i vjetër anglisht, frëngjisht ose latinisht, duke e bërë deshifrimin më të ndërlikuar. Knight vazhdon të përdorë algoritmet e AI për të provuar të deshifrojë dorëshkrimin Voynich, por ende po përcakton nëse mund të zgjidhet me versionet aktuale të modeleve të AI, si ChatGPT.
“Në përgjithësi, GPT është i mirë në kryerjen e detyrave të drejtpërdrejta që nuk kërkojnë prova dhe gabime me laps dhe gomë,” thotë Knight. “Për shembull: shtimi i numrave, përkthimi i një fjalie, numërimi i fjalëve, shkrimi i një paragrafi në temën X, etj. Është më pak i mirë në zgjidhjen e enigmave komplekse. Por, sigurisht, versionet e ardhshme të GPT mund të mësojnë shumë mirë se si të bëjnë gjëra të tilla.”
Dorëshkrimi i Voynich dhe Script i Luginës së Indus janë disa nga enigmat më të ndërlikuara të gjuhës. Si i tillë, shumë studiues në mbarë botën pa dyshim do të presin me ankth përparimet e AI që mund të ndihmojnë në zbulimin e mistereve pas këtyre teksteve të lashta.