Vesuvius Challenge – wprzęgnięcie sztucznej inteligencji w odkrywanie tajemnic przeszłości

23 października 2023, Szymon Ślubowski
BIT Biznes i Technologie

Technika uczenia maszynowego ujawnia greckie słowa w skanach CT zwiniętego papirusu. Rodzi to pytanie – czy sztuczna inteligencja pomoże poznać tajemnice przeszłości?

Studentowi informatyki udało się po raz pierwszy odczytać tekst z zwęglonego zawiniętego zwoju ze starożytnego rzymskiego miasta Herculaneum. Tekst był nieczytelny od wybuchu wulkanu w 79 r. n.e. – tego samego, który pogrzebał pobliskie Pompeje. Przełom może otworzyć dostęp do setek tekstów z jedynej zachowanej biblioteki z antyku grecko-rzymskiego – podaje portal Nature.

Luke Farritor z University of Nebraska–Lincoln opracował algorytm uczenia maszynowego, który wykrył greckie litery na kilku liniach zwiniętego papirusu, w tym πορϕυρας (porphyras), co oznacza „purpurowy”. Badacz wykorzystał subtelne różnice w fakturze powierzchni, aby szkolić swoją sieć neuronową by możliwe było wykrycie atramentu.

Setki zwojów zostało pogrzebanych przez Wezuwiusz w październiku 79 r. n.e., kiedy erupcja przykryła Herculaneum 20 metrami popiołu wulkanicznego. Wczesne próby otwarcia papirusów doprowadziły do powstania plątaniny fragmentów, a uczeni obawiali się, że reszta nigdy nie zostanie rozwinięta ani odczytana. Vesuvius Challenge oferuje nagrody za odczytanie fragmentów tekstu z zniszczonych zwojów. Organizatorzy ogłosili, że Farritor zdobył nagrodę za odczytanie więcej niż 10 znaków na obszarze papirusu o wielkości 4 cm².

Starożytne rzymskie zwoje

Zwoje zostały odkryte w XVIII wieku, kiedy robotnicy natknęli się na pozostałości luksusowej willi, która mogła należeć do rodziny teścia Juliusza Cezara. „Odczytanie papirusów mogłoby „zrewolucjonizować naszą wiedzę o starożytnej historii i literaturze. Większość znanych dziś tekstów klasycznych jest wynikiem wielokrotnego kopiowania przez skrybów przez wieki. W przeciwieństwie do tego biblioteka w Herculaneum zawiera dzieła nieznane z żadnych innych źródeł, bezpośrednio od autorów” – mówi Thea Sommerschield, historyk specjalizujący się w starożytnej Grecji i Rzymie na Uniwersytecie Ca’ Foscari w Wenecji.

Dotychczas badacze mogli badać tylko otwarte fragmenty. Zidentyfikowano kilka łacińskich dzieł, ale większość z nich zawiera greckie teksty dotyczące epikurejskiej szkoły filozofii. Odkryto fragmenty „O naturze”, napisane przez samego Epikura, oraz dzieła mało znanego filozofa Filodemusa, który poruszał tematy takie jak wady, muzyka, retoryka i śmierć. Sugerowano, że biblioteka mogła kiedyś należeć do niego. Dziś ponad 600 zwojów z tej kolekcji przechowywana jest w Bibliotece Narodowej w Neapolu, kilka w Wielkiej Brytanii i Francji. Większość z nich pozostaje nienaruszona i nieotwarta. A więcej papirusów badacze znaleźli na niższych piętrach willi, które jeszcze nie zostały odkopane.

Brent Seales, informatyk, który pomógł zorganizować Vesuvius Challenge wraz z zespołem spędzili lata na opracowywaniu metod „wirtualnego rozwijania” niewidocznie cienkich warstw papirusów przy użyciu tomografii komputerowej (CT) oras wizualizacji ich jako serii płaskich obrazów. W 2016 roku Seales, który pracuje na Uniwersytecie Kentucky w Lexington, poinformował o użyciu tej techniki do odczytania zwęglonego zwoju z En-Gedi w Izraelu, ujawniając fragmenty Księgi Kapłańskiej – części Starego Testamentu – napisanej w III lub IV wieku n.e. Jednak atrament na zwoju En-Gedi zawiera metal, więc łatwiej było odkryć go na skanach CT. Atrament użyty na starszych zwojach z Herculaneum był na bazie węgla drzewnego i wody. Przez co jego gęstość na skanach jest podobna do samego materiału papirusa.

Seales zdał sobie sprawę, że nawet bez różnicy w jasności skany CT mogą uchwycić drobne różnice w fakturze, które mogą odróżnić obszary papirusu pokrytego atramentem. Aby to udowodnić, wyszkolił sztuczną sieć neuronową do odczytywania liter na zdjęciach rentgenowskich rozwiniętych fragmentów zwojów z Herculaneum. Następnie w 2019 roku przewiózł dwa nienaruszone zwoje z Institut de France w Paryżu do Diamond Light Source, obiektu rentgenowskiego w pobliżu Oksfordu w Wielkiej Brytanii, aby przeskanować je w najwyższej dotąd rozdzielczości.

Sztuczna inteligencja pomaga odkryć niewidoczne

Odczytanie nienaruszonych zwojów było jednak wciąż ogromnym wyzwaniem, więc zespół udostępnił wszystkie swoje skany publicznie oraz uruchomił Vesuvius Challenge. Około 1500 zespołów zaczęło dyskutować i współpracować przez platformę Discord w celu rozwiązania zagdki. Nagrody przyznawane są fazami, a gdy każdy zaplanowany kamień milowy zostanie osiągnięty, zwycięski kod zostaje udostępniony wszystkim biorącym udział w rozszyfrowywaniu do dalszej pracy.

Równolegle zespół Sealesa pracował nad wirtualnym rozwijaniem, udostępniając obrazy spłaszczonych fragmentów do analizy przez uczestników. Kluczowy moment nastąpił, gdy jeden z konkurentów zwrócił uwagę, że na niektórych obrazach atrament był czasami widoczny gołym okiem jako subtelna faktura, która została szybko nazwana „pęknięciem”. Farritor natychmiast skupił się na pęknięciu, szukając dalszych wskazówek dotyczących liter.

Gdy otrzymał informację, że został udostępniony nowy segment, z wyjątkowo wyraźnym pęknięciem, uruchomił swój algorytm na nowym obrazie. Początkowo udało mu się odszyfrować pięć liter. Po kilku dniach dopracowania modelu odszyfrował dziesięć liter.

Słowo „purpurowy” nie zostało dotąd odczytane w otwartych zwojach z Herculaneum. Purpurowy barwnik był bardzo poszukiwany w starożytnym Rzymie i był produkowany z gruczołów ślimaków morskich, więc termin mógł odnosić się do koloru purpurowego, szat, rangi osób, które mogły sobie pozwolić na barwnik. Ale ważniejsze niż pojedyncze słowo jest odczytanie czegokolwiek, mówi Federica Nicolardi, papirolog z Uniwersytetu w Neapolu we Włoszech. Postęp ten daje potencjalnie możliwość odzyskania tekstu z całego zwoju, w tym tytułu i autora, dzięki czemu dzieła można go zidentyfikować.

Tajemnice przeszłości

Yannis Assael, pracownik naukowy w Google DeepMind w Londynie, opisuje Vesuvius Challenge jako „unikalne i inspirujące przedsięwzięcie”. Ale jest to część szerszej zmiany, zauważa, w której sztuczna inteligencja (SI) coraz częściej pomaga w badaniu starożytnych tekstów. W zeszłym roku na przykład Assael i Sommerschield udostępnili narzędzie SI o nazwie Ithaca, mające na celu pomoc uczonym w ustalaniu daty i pochodzenia niezidentyfikowanych starożytnych greckich inskrypcji oraz składanie propozycji tekstu wypełniającego wszelkie luki. Teraz otrzymuje setki zapytań tygodniowo, a podobne wysiłki są stosowane do języków od koreańskiego po akadyjski, używany w starożytnej Mezopotamii.

Seales ma nadzieję, że uczenie maszynowe otworzy to, co nazywa „niewidzialną biblioteką”. Odnosi się to do tekstów, które są fizycznie obecne, ale nikt ich nie widzi, w tym pergaminu używanego w średniowiecznych oprawach książek, palimpsestów, w których późniejsze pismo zasłania warstwę znajdującą się poniżej oraz kartonu, w którym do produkcji starożytnych egipskich trumien i masek używano strzępków starego papirusu.

Szymon Ślubowski

SUBSKRYBUJ „GAZETĘ NA NIEDZIELĘ” Oferta ograniczona: subskrypcja bezpłatna do 31.08.2024.