ChatGPT

Bajki o sztucznej inteligencji i prawdziwe zagrożenia

ChatGPT nie myśli, nie wnioskuje, niczego nie rozumie i nie jest żadną „sztuczną inteligencją”, o ile termin ten rozumiemy zgodnie z ideami ojców dziedziny artificial intelligence jako „autonomiczny program myślący na podobieństwo człowieka”.

Niezwykłe możliwości programu ChatGPT wznowiły po raz kolejny dyskusję o zagrożeniach dla ludzkości ze strony sztucznej inteligencji. Dyskusję tę w oczywisty sposób zaburzają zjawiska z jednej strony związane z pogonią za sensacją w mediach, a z drugiej troska badaczy i szefów firm AI o zapewnienie funduszy na dalsze badania. W rezultacie większość informacji na temat GPT i możliwości sztucznej inteligencji, jakie można znaleźć w mediach, w bardzo małym stopniu opiera się na prawdzie. Jako naukowiec zajmujący się sztuczną inteligencją raczej w charakterze recenzenta niż aktywnego badacza nie mam żadnego interesu w reklamowaniu lub dyskredytowaniu osiągnięć AI, mam natomiast dość solidną wiedzę w tym zakresie i szczególną atencję dla prawdy.

Dekadę temu napisałem książkę Sztuczna inteligencja i logikabędącą podsumowaniem nieudanego przedsięwzięcia naukowego, jakim była próba zastosowania osiągnięć logiki formalnej do skonstruowania myślących maszyn. Jest tam rozdział o perspektywach rozwoju sztucznej inteligencji, który w świetle nowych osiągnięć, takich jak AlphaGo czy ChatGPT, powinien być uzupełniony. W niniejszym krótkim eseju zainteresowany Czytelnik znajdzie dokładne wyjaśnienie mechanizmów działania programu ChatGPT i moją opinię na temat realnych zagrożeń wynikających z rozwoju sztucznej inteligencji i technologii informacyjnej. Tekst, podobnie jak wspomniana książka, napisany jest z myślą o Czytelnikach posiadających szerokie zainteresowania i dowolne wykształcenie, także czysto humanistyczne.

ChatGPT – sztuczna sieć neuronowa

Zacznę od przedstawienia faktów dotyczących szczegółów budowy programu. ChatGPT jest bardzo inteligentnym programem w tym sensie, że jest wyjątkowo inteligentnym projektem, efektem zbiorowej myśli wielu ludzi o nieprzeciętnej inteligencji. Natomiast program sam w sobie nie ma ani krzty inteligencji, ani krzty inwencji. Jest takim samym programem jak każdy inny program reagujący na polecenia użytkownika (input) dokładnie według wcześniej przygotowanych przez programistów, ściśle określonych instrukcji.

GPT jest skrótem nazwy generative pre-trained transformer, co ujmuje zasadnicze cechy konstrukcji tego programu komputerowego. Generuje on teksty za pomocą techniki obliczeniowej zwanej „siecią neuronową typu transformer”, a parametry sieci zostały ustalone poprzez wcześniejsze jej „trenowanie” na przykładach z olbrzymiej bazy danych tekstowych. Generalnie na wejściu program otrzymuje fragment tekstu w języku naturalnym, na przykład zapytanie, i ma za zadanie wygenerować inny tekst, sensowny i poprawny gramatycznie, który najbardziej pasuje jako kontynuacja danego fragmentu. Dopasowanie określone jest przez bazę danych tekstowych, na której program był trenowany. Można powiedzieć, że program generuje najbardziej prawdopodobną kontynuację tekstu na podstawie tekstów występujących w bazie. Jeśli to jest zapytanie, to kontynuacją powinna być sensowna i trafna odpowiedź.

Sztuczne sieci neuronowe

Sztuczna sieć neuronowa to model obliczeń wzorowany luźno na sieci neuronów w mózgu. W stosunku do rzeczywistej sieci neuronowej w mózgu model ten jest dużym uproszczeniem i nie jest w stanie symulować pracy mózgu (przede wszystkim dlatego, że rzeczywiste mechanizmy działania mózgu i zachodzące w nim zjawiska są nam w przeważającej mierze nieznane). Ale model ten przydaje się jako pewna idea obliczeń komputerowych, takich, w których posiadamy wielki zasób przykładów łączących dane wejściowe z pożądanymi danymi wyjściowymi, lecz nie mamy odpowiedniej teorii, wystarczającego zrozumienia problemu i konkretnych wzorów matematycznych, które mogłyby stanowić podstawę do zaprojektowania odpowiedniego algorytmu.

Myślę, że warto tu przedstawić ideę tego modelu obliczeń, bo ma to zasadnicze znaczenie dla ocenienia, na ile inteligentny jest GPT i jakie są perspektywy jego dalszego rozwoju. (Czytelników o wykształceniu bardziej humanistycznym proszę o cierpliwe przebrnięcie przez kilka następnych akapitów, bo nadają one właściwy sens późniejszym ogólnym rozważaniom). W najprostszym ujęciu sztuczna sieć neuronowa służy do obliczania dowolnych funkcji postaci y = f(x). Jeśli mamy wzór matematyczny takiej funkcji albo precyzyjny sposób jej obliczania (algorytm), to można napisać odpowiedni program, który (w zasadzie) dla każdego obliczy nam wartość y = f(x). Inna sytuacja jest, gdy mamy jakąś funkcję, która opisuje zjawisko występujące w przyrodzie, ale nie znamy w wystarczającym stopniu mechanizmów tego zjawiska, nie mamy opisu matematycznego; mamy tylko dużo konkretnych przykładów xi, dla których znamy wartości y= f(xi).

Wówczas właśnie możemy zastosować ideę modelu obliczeń sieci neuronowej. Przekazujemy wartość do zbioru komórek, które traktujemy jako pierwszy poziom neuronów naszej sieci (rys. 1; w praktyce przekazywane są różne części danych wejściowych x). Następnie do każdej komórki drugiego poziomu przekazywane są wartości z każdej komórki pierwszego poziomu modyfikowane wagą przypisaną do każdego połączenia (zwykle oznacza to jakiś ułamek oryginalnej wartości). 

Rys. 1. Prosty schemat sztucznej sieci neuronowej – kółka reprezentują komórki sieci

Te zmodyfikowane (ułamkowe) wartości są sumowane (ewentualnie poddane jeszcze jakiejś dodatkowej prostej operacji) i tak otrzymana wartość zapisywana jest w danej komórce drugiego poziomu. To samo dzieje się między poziomem drugim i trzecim, i kolejnymi, aż suma wartości uzyskanych na ostatnim poziomie zmodyfikowanych wagami końcowych połączeń zostanie przekazana do ostatniej komórki, która reprezentuje obliczoną wartość y. Oczywiście wartość zależy od wartości oraz od wszystkich wag zastosowanych po drodze. Wiemy, że dla dowolnej funkcji (ze skończonym zbiorem argumentów) można dobrać taką sieć i takie wagi, że odpowiedni program będzie obliczał dokładnie funkcję y = f(x) (to znaczy, jeśli programowi podamy wartość na wejściu, to zwróci nam wartość y = f(x) na wyjściu). Problem w tym, jak znaleźć odpowiednie wagi przy z góry zadanej strukturze i rozmiarach sieci.

Uczenie sieci – trening

Tu w grę wchodzi idea uczenia (trenowania) takiej sieci. Ustawiamy na początku wagi dowolnie (lub kierując się jakąś wstępną wiedzą) i uruchamiamy program uczenia. Podajemy programowi kolejne znane nam przykłady i porównujemy otrzymaną wartość z wartością oczekiwaną. Jeśli są różne, to modyfikujemy nieznacznie wagi według jakiegoś pomysłu, tak żeby otrzymać wartość bliższą oczekiwanej. Jest wiele pomysłów na to, jak automatycznie modyfikować wagi, żeby nie skakać od skrajności do skrajności i żeby stopniowo przybliżać je do prawidłowych wartości. Niestety, generalnie osiągnięcia na tej drodze były słabe. W przypadku większości problemów czas uczenia takiej ogólnej sieci okazuje się zbyt długi albo w ogóle nie widać postępu w modyfikacji wag. Dopiero idea deep learning w dziedzinie sztucznych sieci neuronowych umożliwiła znaczący postęp w zastosowaniach.

Trzeba zwrócić uwagę, że odwołując się do obliczania funkcji, nic nie tracimy na ogólności, bo w komputerze każde dane (obrazy, dźwięki, teksty) reprezentowane są jako liczby i każdy program, który przyjmuje na wejściu jakieś dane i zwraca inne dane, sprowadza się do obliczania pewnej funkcji. Sieci neuronowe najlepsze zastosowania znajdują w specyficznych dziedzinach, takich jak rozpoznawanie obrazu, identyfikacja obiektów, przetwarzanie mowy, wynajdywanie anomalii w bazach danych, przetwarzanie języka naturalnego itp. Deep learning to pomysłowa technika modyfikacji wag i innych parametrów sieci, w której programista znacznie bardziej ingeruje w proces uczenia, wykorzystując swoje rozumienie problemu i wskazując sieci istotne cechy danych na wejściu, które sieć powinna najpierw nauczyć się rozpoznawać i identyfikować, żeby wykonać zadanie bardziej złożone. Z punktu widzenia sztucznej inteligencji można to uznać za regres: rezygnację z ogólności i autonomii programu na rzecz lepszych osiągnięć w ograniczonej i dobrze zdefiniowanej dziedzinie. Jeszcze bardziej wyszukane (i ograniczające) techniki modyfikacji parametrów sieci zawarte są w sieciach typu transformer, specjalnie zaprojektowanych do przetwarzania tekstów traktowanych jako pewne całości (a nie przypadkowe ciągi słów).

W pewnym sensie można powiedzieć, że sieć w swoich parametrach wytrenowanych na zbiorze przykładów „zapamiętuje” cechy tego zbioru, tak że po podaniu jej danych wejściowych jakiegoś z przykładów zwraca prawidłowe dane wyjściowe y = f(y) (lub ich akceptowalne przybliżenie). Jeśli ten zbiór stanowi dostatecznie duży lub dostatecznie reprezentatywny zbiór przykładów pewnej rzeczywistej funkcji (zależności) występującej w przyrodzie, to możemy mieć nadzieję, że przy podaniu sieci nieznanych danych (spoza zbioru przykładów) wygeneruje ona prawidłowe y, odpowiadające rzeczywistej wartości y = f(x), czyli że prawidłowo będzie ona obliczać całą funkcję, również w jej nieznanej części.

Kluczowa cecha – masowość obliczeń

Pierwszą istotną cechą sieci ChatGPT jest to, że liczby parametrów i połączeń w niej idą w miliardy. Liczba parametrów w GPT-3.5 szacowana jest na 175 miliardów, a rozmiar zbioru danych tekstowych na 570 GB, co z grubsza odpowiada milionowi książek (wśród tych danych są np. dokumenty internetowe, cała angielska Wikipedia, setki tysięcy książek specjalistycznych). To, że program jest w stanie w fazie treningu przejrzeć odpowiednią liczbę razy i „zapamiętać” w swoich parametrach ten cały zbiór danych, możliwe jest dzięki jednoczesnym niezwykłym postępom technologii komputerowej. Siła obliczeniowa współczesnych komputerów, tysiąc razy większa niż jeszcze 10 lat temu, jest tu czynnikiem kluczowym.

To właśnie dzięki temu i możliwości wykonywania miliardów operacji w ciągu jednej sekundy, oprócz wyszukanych technik dostrajania parametrów sieci, zawdzięczamy fakt, że rezultat jest wręcz oszałamiający: ChatGPT zaskakująco dobrze symuluje inteligentnego eksperta od wszystkiego, który „rozumie”, co mówimy, i „mówi” nienaganną angielszczyzną (a także wieloma innymi językami) – jak żaden człowiek na świecie. Efekt jest doprawdy genialny i oszałamiający. Nazwa „sztuczna inteligencja” wydaje się użytkownikom jak najbardziej adekwatna. Oszołomienie potęguje fakt, że nie jesteśmy w stanie przewidzieć reakcji tego programu. Nie wiemy, jak ustawione są wagi w sieci, nie wiemy, co one znaczą, i jako że są ich miliardy, nie jesteśmy w stanie ich poznać. Co więcej, działanie sieci typu transformer zawiera również pewne elementy losowe, np. próbkowanie z rozkładu prawdopodobieństwa. W rezultacie generowany tekst zależy w pewnym stopniu od przypadku. Generalnie nie jesteśmy w stanie dokładnie przewidzieć, jaki tekst zostanie wygenerowany. To, co się dzieje w środku programu, jest typową „czarną skrzynką”.

Cenzura wypowiedzi

Trzeba dodać, że poza głównym mechanizmem trenowania sieci ogólnymi wyszukanymi technikami deep learning transformer w programie ChatGPT zastosowano techniki pre– i post-processingu, dodające różne filtry i ograniczenia w celu kontrolowania generowanych odpowiedzi. Na przykład przed prezentacją odpowiedzi użytkownikowi program przeprowadza weryfikację zawartości, kontrolę gramatyki, filtrowanie nieodpowiednich treści, cenzurę niepożądanych wyrażeń itp. Filtry te zaprogramowane są niejako „ręcznie”, więc są na tyle skuteczne, na ile programistom udało się świadomie ograniczyć niepożądane efekty i błędy. W szczególności pewne łatwo obserwowalne cechy ChatGPT, jak na przykład grzeczność i polityczna poprawność, unikanie dostarczania informacji niebezpiecznej lub kryminogennej i inne charakterystyczne zachowania są rezultatem takich dodatkowych filtrów.

Niedoskonałość takich ręcznych technik filtrowania pokazuje przykład dotyczący wcześniejszej wersji ChatGPT, która na prośbę o podanie stron internetowych z filmami pornograficznymi odmawia, powołując się na etykę, a na prośbę o podanie stron, które należy zablokować, żeby ich dzieci nie mogły oglądać, podaje pełną listę. Program nie rozumie, że w istocie jest to to samo pytanie.

Czy ChatGPT myśli?

Żeby uzmysłowić sobie jak mało wspólnego GPT ma z naturalną inteligencją, można powiedzieć, że w czacie GPT jest tyle samo myślenia co w teoretycznym programie, który szuka zadanego fragmentu tekstu w olbrzymim zbiorze danych i gdy znajdzie, to po prostu przepisuje jego kontynuację; gdy zaś nie znajdzie, to stara się znaleźć tekst najbardziej podobny i przepisując kontynuację, stosuje odpowiednie modyfikacje. Taki program jest tylko teoretyczny, bo każdorazowe przeszukiwanie całego zbioru danych wielkości 570 GB przy obecnej wydajności komputerów trwałoby tygodniami. A my potrzebujemy prawie natychmiastowej reakcji programu na każde zapytanie. Stąd pośrednia realizacja powyższego pomysłu: najpierw „trenujemy” sieć, żeby „zapamiętała” w swoich miliardach parametrów najistotniejsze cechy zbioru danych tekstowych, a odpowiedzi dostatecznie bliskie oryginalnym przykładom generuje sieć i robi to dostatecznie szybko.

Z powyższego opisu wynika, że ChatGPT nie myśli, nie wnioskuje, niczego nie rozumie i nie jest żadną „sztuczną inteligencją”, o ile termin ten rozumiemy zgodnie z ideami ojców dziedziny artificial intelligence jako „autonomiczny program myślący na podobieństwo człowieka”. Chciałoby się rzec, że GPT nic nie rozumie, bo generuje kontynuację tekstu wyłącznie na podstawie cech zewnętrznych tekstu, ponieważ ma charakter czysto syntaktyczny, bez żadnej semantyki. Ale nie jest to całkiem prawdą. W procesie uczenia deep learning zawarta jest też pewna wiedza na temat znaczeń słów, ich bliskoznaczności itp. Brak jest natomiast wiedzy na temat znaczeń zdań (i ciągów zdań), bo my, ludzie, ciągle nie wiemy, na czym polega ten fenomen, jak zdanie języka naturalnego uzyskuje znacznie (model formalno-logiczny okazał się nieadekwatny, a filozoficzne rozprawy na ten temat nie dają nam niestety takiego zrozumienia problemu, które można by wykorzystać w programowaniu).

Myślenie i inteligencja

Są inżynierowie AI, którzy na poważnie twierdzą, że ChatGPT jednak myśli, że podobny jest (ich zdaniem) mechanizm myślenia w mózgu ludzkim, gdzie rzecz polega również na wykonywaniu w sposób prawie deterministyczny, z elementami losowości, pewnego algorytmu. Sprzyja temu niezwykły efekt programu GPT, którego liczne reakcje na nasze zapytania zdają się w ewidentny sposób przekraczać zdolności intelektualne pojedynczych ludzi.

Twierdzenia o tym, że myślenie jest po prostu wykonywaniem pewnego złożonego algorytmu, że ma charakter podobny do działania programu komputerowego, towarzyszą badaniom nad sztuczną inteligencją od początku tej dyscypliny. Trudno z nimi polemizować, gdy wiemy, na czym polega działanie programu komputerowego, a nie wiemy, na czym polega nasze myślenie, gdy nie jesteśmy w stanie porównać mechanizmów działania. Możemy jedynie wyrazić nasze odmienne przekonanie, że mechanizmy myślenia w mózgu są jednak znacznie bardziej skomplikowane. A na wsparcie tego przekonania przytaczać różne fakty. Stosunkowo nowym potwierdzeniem na rzecz tej ostatniej tezy jest odkrycie, że budowa neuronu okazuje się znacznie bardziej skomplikowana i wielopoziomowa, a jego funkcje znacznie bardziej złożone niż owa prosta idea zastosowana w sztucznej sieci neuronowej. Jeśli chodzi o sam ChatGPT, to wystarczy dobrać odpowiednie przykłady, żeby wykazać zupełnie bezspornie, że ten program nie myśli i nie umie wyciągać najprostszych wniosków.

Swego czasu popularna była tzw. operacyjna definicja sztucznej inteligencji oparta na słynnym teście Turinga. Najkrócej: jeśli człowiek nie jest w stanie odróżnić podczas czatu odpowiedzi człowieka od odpowiedzi programu komputerowego, to znaczy, że program osiągnął poziom ludzkiej inteligencji. Czy ChatGPT przeszedłby test Turinga? Wygląda na to, że nie ma nawet sensu organizować tego testu. Oryginalny warunek Turinga na uznanie programu komputerowego za obdarzonego inteligencją wymagał, żeby co najmniej 70 proc. ludzi nie było w stanie odróżnić odpowiedzi komputera od odpowiedzi człowieka. ChatGPT łatwo odróżnić: jego odpowiedzi są „za mądre” jak na człowieka, zbyt wszechstronne. Można zaryzykować twierdzenie, że dziś nawet 90 proc. ludzi uznałoby ChatGPT-3.5 za… inteligentniejszy od człowieka – mądrzejszy od dowolnego laureata Nagrody Nobla.

Przykład

Pokazanie, że ChatGPT-3.5 ma olbrzymią wiedzę, ale nie umie myśleć, nie umie wnioskować i nie rozumie tekstu, który przetwarza, czyli wymyślenie odpowiednio „niewygodnych” pytań, wymaga pewnej znajomości mechanizmu działania programu. Niektórzy trafiają na takie sytuacje przypadkowo. Ja po serii prób doszedłem do takiego krótkiego czatu, który każdy może ocenić sam:

JA: Adam przyszedł do restauracji z dwiema dziewczynami: Alą i Olą. Te trzy osoby trzeba rozsadzić przy okrągłym stoliku tak, żeby dziewczyny nie siedziały koło siebie. Czy to jest możliwe?
GPT: Tak, jest możliwe rozsadzić Adama, Alę i Olę przy okrągłym stoliku w taki sposób, żeby dziewczyny nie siedziały obok siebie. Oto jedno z możliwych rozwiązań:
Adam
Ola
Ala
Adam

W tym układzie dziewczyny są oddzielone przez Adama, który siedzi między nimi. Ważne jest, aby zauważyć, że przy okrągłym stole istnieje wiele możliwości rozsadzenia osób, a to tylko jedno z wielu rozwiązań.

JA: Twoja odpowiedź jest błędna, bo zawiera dwóch Adamów.
GPT: Przepraszam za mój błąd. Oto poprawione rozwiązanie:

1. Adam 2. Ola
Adam
Ala

W tym przypadku dziewczyny są rozdzielone przez Adama, który siedzi między nimi. Jeszcze raz przepraszam za zamieszanie spowodowane wcześniejszym błędem. Dziękuję za zwrócenie uwagi.

JA: Masz rozsadzić trzy osoby, a nie cztery. Wskaż sposób rozsadzenia 3 osób!
GPT: Przepraszam za moje pomyłki. Oto poprawione rozwiązanie dla trzech osób:

Adam
Ola
Ala

W tym układzie Adam siedzi obok Oli, a Ola jest oddzielona od Ali przez Adama. Dzięki temu obie dziewczyny nie siedzą obok siebie. Jeszcze raz przepraszam za zamieszanie i dziękuję za cierpliwość.

Po tej próbce możliwości ChatGPT-3.5 można zapytać retorycznie, kto gotów jest powierzyć tej „sztucznej inteligencji” kierowanie statkiem kosmicznym lub jakiekolwiek odpowiedzialne zadanie? (Warto dodać, że komercyjny ChatGPT-4 „próbuje rozwiązać” to zadanie w podobny sposób).

Zastosowania GPT

Nie zmienia to faktu, że GPT jest fantastycznym osiągnięciem programistycznym, które ma szereg znakomitych potencjalnych zastosowań. Po pierwsze, znacznie ulepsza proces wyszukiwania informacji w porównaniu z klasyczną wyszukiwarką Google’a. Odpowiednimi pytaniami można nakierować program dokładnie na informacje, które nam są potrzebne. GPT potrafi rozwiązywać zadania z matematyki i fizyki, łatwe i nawet bardzo trudne. Oczywiście polega to w swej istocie na modyfikowaniu rozwiązań znajdujących się w zbiorze danych treningowych. Tutaj użytkownik musi sprawdzić, czy modyfikacja jest trafna. Jeśli chodzi o matematykę, to często taka modyfikacja powoduje jakąś niespójność, błąd, który dyskwalifikuje całe rozwiązanie. Jednak najczęściej pokazuje to właściwą metodę rozwiązania i jest bardzo pomocne, wystarczające dla kogoś rozumiejącego matematykę zawartą w zadaniu i rozwiązaniu.

GPT jest świetny jako przeglądarka różnych obszernych tutoriali i instruktaży. Na przykład dużo łatwiej zapytać GPT, jak wykonać jakąś operację w Excelu, żeby uzyskać jakiś efekt, niż szukać tego w bardzo obszernym tutorialu. GPT nadaje się świetnie do tworzenia różnych tekstów okolicznościowych, szczególnie o rutynowym charakterze – trzeba tylko ogólnie napisać, co ma być w tekście, i sprawdzić, co wygeneruje program. Zwykle wystarczą niewielkie własne poprawki, żeby tekst dokładnie spełniał nasze wymagania. GPT nadaje się także znakomicie do korekty napisanego tekstu (szczególnie przydatne, gdy piszemy w języku innym niż ojczysty), do automatycznych tłumaczeń, do tworzenia podsumowań długich tekstów. Jakość jest naprawdę wysoka. GPT potrafi też pisać krótkie programy komputerowe w różnych językach, chociaż tutaj, jak wszędzie, wymagane jest sprawdzenie przez użytkownika wygenerowanego kodu.

Problem w tym, jeszcze raz to podkreślmy, że GPT nie posiada żadnej zdolności rozumienia ani odróżniania prawdy od fałszu. Dlatego zawsze konieczne jest sprawdzenie rezultatu, jeśli zamierzamy go użyć w praktyce, w takim czy innym celu. Niemniej jest wielce prawdopodobne, że GPT i inne podobne transformatory tekstu zrewolucjonizują edukację, choćby dlatego, że nauczyciele będą musieli znaleźć sposoby obrony przeciwko masowemu wykorzystywaniu tych programów przez uczniów.

Głosy autorytetów

W trakcie dyskusji na ten temat na moje uwagi jeden z interlokutorów parający się zawodowo filozofią odpowiedział, że on woli jednak ufać fachowcom z dziedziny sztucznej inteligencji, bezpośrednim współtwórcom nowych technologii i zachodnim autorytetom naukowym. A ci w większości przestrzegają przed zagrożeniami i przewidują rychłe powstanie sztucznej inteligencji przekraczającej inteligencję człowieka (Artificial General Intelligence). Odrzekłem, iż rozumiem taką postawę laika, ale mam nadzieję, że filozof weźmie pod uwagę argumenty pokazujące, że taka postawa jest poznawczo bardzo wątpliwa.

Problem w tym, że większość wypowiadających się badaczy dziedziny jest żywotnie zainteresowanych tym, żeby obraz stanu badań był jak najbardziej obiecujący. Od ich wypowiedzi zupełnie bezpośrednio zależy poziom finansowania dziedziny. System grantowy finansowania badań naukowych preferuje koloryzowanie perspektyw badawczych. Większość wypowiadających się publicznie to fachowcy w bardzo specjalistycznych dziedzinach, niemający czasu i odpowiedniego wykształcenia, pozwalającego na szerszą refleksję nad całością badań (współczesna nauka zdecydowanie preferuje ścisłą specjalizację; różne próby badań interdyscyplinarnych mają na ogół złą renomę w świecie nauki). Wypowiedzi specjalistów na tematy ogólne mają więc cechę wspólną z medialnymi wypowiedziami celebrytów… na dowolny temat. Drugą grupą wypowiadających się są przedstawiciele mediów. Tu rzecz jest oczywista. Media zainteresowane są głównie sensacją. Zagrożenie sztuczną inteligencją to nośny temat odgrzewany przy okazji każdego spektakularnego osiągnięcia w dziedzinie AI. W odniesieniu do sztucznej inteligencji nie jest łatwo znaleźć wypowiedź, która nie miałaby cech stronniczości i była oparta na wiedzy i rozeznaniu. Żeby taką wypowiedź rozpoznać, trzeba mieć rozeznanie w dziedzinie i odpowiednią wiedzę.

Co mówi Sam Altman?

Jeśli dobrze poszukać, to można znaleźć w internecie bardziej szczerą wypowiedź Sama Altmana, szefa laboratorium badawczego OpenAI, które wyprodukowało GPT. W wywiadzie zatytułowanym OpenAI’s CEO Says the Age of Giant AI Models Is Already Over [LINK] twierdzi on, że strategia badawcza bazująca na masowości obliczeń, która przyniosła sukces ChatGPT, jest wyczerpana. Dalsze zwiększanie modelu nie przyniesie już wyraźnych postępów. Przyszły rozwój sztucznej inteligencji będzie wymagał nowych pomysłów. Nie bardzo wiadomo jakich. Powiedział też, a było to w kwietniu 2023 r., że obecnie OpenAI nie pracuje nad kolejnym modelem GPT-5.

Najwidoczniej odpowiedzialni za finanse firmy przywrócili szefa do pionu, bo niecałe dwa miesiące później w wideo na YouTube zatytułowanym OpenAI CEO Sam Altman Reveals Shocking GPT-5 Details [LINK] przekonywał, że GPT-4 będzie niczym w porównaniu z powstającym właśnie GPT-5. W nowym modelu zapowiedział dowolną długość tekstu na wejściu, ograniczenie przesadnych przeprosin i pomniejszania swojej wartości przez program, nadanie mu charakteru większej pewności siebie i wiarygodności oraz większą spójność z wcześniejszymi fragmentami konwersacji. Zapowiedział również ulepszenie zdolności obliczeń matematycznych i rozumowania logicznego. I wreszcie GPT-5 ma być bardziej kontaktowy – dopuszczający dane multimedialne, rysunki, zdjęcia, nagrania, reagujący na mowę, a nawet na gesty i emocje rozmówcy. To już prawdziwa sztuczna inteligencja – powie ktoś.

Część z tych obietnic ma charakter trywialny (kwestia odpowiednich filtrów); część z pewnością da się osiągnąć zwiększeniem (jednak) rozmiarów modelu. Wprowadzenie kontaktu audio-wizualnego jest w zakresie możliwości współczesnej technologii, chociaż z pewnością będzie wymagało mnóstwo pracy i nie jest wykluczone, że nie uda się tego osiągnąć w zapowiadanym terminie do połowy roku 2024. Ulepszenie zdolności do rozwiązywania zadań matematycznych można osiągnąć poprzez wytrenowanie modelu na odpowiednio zwiększonym zbiorze przykładowych rozwiązań, jednak przy tej technice nie da się wyeliminować regularnych błędów w rozwiązaniach, bo nie ma żadnego pomysłu na automatyczne sprawdzanie poprawności rozwiązań (nie ma nic o tym w literaturze i nie słychać o żadnych badaniach w tym kierunku). Ulepszenie zdolności do rozwiązywania zadań matematycznych można też osiągnąć poprzez włączenie w model technik bezpośredniego zastosowania znanych algorytmów tak jak w programie Wolfram Alpha – program musiałby decydować, czy użyć technik modelu językowego, czy bezpośrednich algorytmów rozwiązania. Natomiast możliwości ulepszenia zdolności do logicznego rozumowania nie widzę, tak jak nie widzę możliwości wyposażenia GPT w zdolność odróżniania prawdy od fałszu. Więcej o tym za chwilę.

Co to jest sztuczna inteligencja?

Swego czasu toczyły się poważne dyskusje na temat definicji sztucznej inteligencji (przy pełnym braku rozeznania roli i funkcji definiowania w praktycznej logice – trzymano się wówczas wzorców z logiki formalnej). Dziś wypracowano pojęcie „ogólnej sztucznej inteligencji” (ang. Artificial General Intelligence, AGI) na określenie (potencjalnego) programu komputerowego, który osiągnie poziom inteligencji człowieka we wszystkich aspektach ludzkiego myślenia (a w wielu go przewyższy ze względu na znacznie większy od człowieka potencjał obliczeniowy). AGI odróżniać należy od specjalistycznych systemów AI (specjalistycznych systemów sztucznej inteligencji) wykonujących konkretne ograniczone zadania, które wykonywane przez człowieka wymagają inteligencji. Są to zazwyczaj zadania bardzo wyspecjalizowane, za to jakość ich wykonywania często przekracza możliwości człowieka.

W tym miejscu trzeba wyraźnie powiedzieć: AGI nie istnieje i nie widać jej na horyzoncie badań. Do specjalistycznych systemów AI znacznie bardziej pasuje nazwa „inteligencja obliczeniowa” (ang. computational intelligence). Ich siła bierze się głównie z olbrzymiej mocy obliczeniowej. Przez pewien czas była tendencja, żeby nazwę artificial intelligence zamienić właśnie na computational intelligence, ale zwyciężyły, jak widać, względy marketingowe, a razem z nimi ciągle trwające pomieszanie pojęć w głowach klientów, odbiorców i sponsorów.

Warto zdawać sobie sprawę, że historia AI to prawdziwy ciąg obietnic bez pokrycia. W roku 1970 Marvin Minsky, jeden z ojców założycieli dziedziny AI, powiedział był w „Life Magazine”, że „w ciągu trzech do ośmiu lat będziemy mieli maszynę z ogólną inteligencją na poziomie przeciętnego człowieka”. Podobne zapowiedzi o maszynach, które osiągną i przekroczą w sposób niewyobrażalny ludzką inteligencję, były składane wcześniej i później wielokrotnie przez wybitnych naukowców, w tym nawet laureatów Nagrody Nobla, skutecznie mieszając ludziom w głowach. W swoich ostatnich wypowiedziach sprzed dekady Marvin Minsky mówił, że ogólną sztuczną inteligencję będziemy mieli „za osiem lub za czterysta lat”. To akurat bardzo trafnie oddaje poziom naszej wiedzy na temat ogólnych mechanizmów inteligencji będącej podstawą tej projekcji.

Uczenie się na błędach i porażkach

Z historią sztucznej inteligencji Czytelnik może zapoznać się w mojej książce Sztuczna inteligencja i logika. Starałem się tam opisać tę historię obiektywnie, jako osoba, która nie jest zainteresowana ani umniejszaniem osiągnięć, ani nadmiernym pompowaniem sukcesów. Główną treścią tej książki jest jednak pogłębiony opis i analiza zakończonego już przedsięwzięcia naukowego, prowadzonego w ramach badań nad sztuczną inteligencją, jakim była próba wykorzystania osiągnięć logiki formalnej do zbudowania myślących maszyn. Ta próba, znana jako logical approach in AI, skończyła się spektakularną klapą i warto zastanowić się dlaczego. Byłem przekonany, że lada chwila powstaną podobne książki w języku angielskim, więc nawet nie usiłowałem zainteresować wydawców zagranicznych tłumaczeniem mojej książki. Owszem, kilku najbardziej znanych przedstawicieli AI przyznało półgębkiem, podczas półprywatnych spotkań, na konferencjach, że ten kierunek badań nie zakończył się sukcesem, ale ewidentnej klęski nikt nie chciał publicznie ogłaszać, a tym bardziej zagłębiać się w jej przyczyny. Wedle mojej najlepszej wiedzy do dziś nie ma na Zachodzie książki analizującej powody tej dramatycznej porażki. Oczywista prawda, że powinniśmy się uczyć także na błędach, nie znajduje zastosowania w nauce, gdzie obowiązuje system finansowania grantowy i zasady jak najlepszej reklamy mającego powstać produktu.

Mógłby ktoś pomyśleć, że moja książka o sztucznej inteligencji jest już nieaktualna, bo rozwój AI bardzo przyspieszył w ostatnich latach. A jednak jest przeciwnie. Co prawda moja książka została wydana w 2011, a nowe poprawione wydanie w 2015 r., ale pozostaje aktualna w najwyższym stopniu, ponieważ w większości dotyczy analizy porażki przedsięwzięcia naukowego – nikt inny nie uznał za stosowne dokonać takiej analizy ani wyciągnąć wniosków. W mojej książce wystarczyłoby dopisać niewielki rozdział o znakomitych osiągnięciach AI w ostatniej dekadzie – w celu uaktualnienia obrazu (w szczególności o rozwoju technik uczenia sieci neuronowych i metod obliczeń masowych opartych na probabilistyce), wskazać, że jest to zgodne z przewidywaniami zawartymi w pierwszym wydaniu książki i podkreślić, że jednak te technologie nie mają wiele wspólnego z oryginalnym celem stworzenia ogólnej AI, a samodzielnie „myślącej maszyny” nie widać ciągle nawet na horyzoncie badań.

Zagrożenia

Obawa, że myślące maszyny czy też jakaś egzystująca w sieci sztuczna inteligencja zaatakują ludzi, opanują ludzką cywilizację, to na dzisiaj „bajki dla robotów”, żeby odwołać się do tytułu książki Lema; kompletna fantasmagoria. Jednym z „apostołów” tej fantasmagorii na polskim gruncie jest prof. Andrzej Zybertowicz (moje dyskusje z nim stały się zaczynem tego artykułu). Pomysł, żeby umożliwić programom takim jak GPT automatyczne uruchamianie jakichś procesów fizycznych, bez nadzoru człowieka, jest tak samo mądry, jak uzależnienie uruchomienia rakiet z głowicami atomowymi od rzutu monetą. Oczywiście nie da się wykluczyć, że ktoś gdzieś na taki pomysł wpadnie, ale zagrożeniem jest tu ludzka głupota, a nie sztuczna inteligencja. Realnie można mówić o zagrożeniach rozwojem specjalistycznych systemów AI, ale mieszanie do tego nazwy „sztuczna inteligencja” tworzy fałszywe wyobrażenia i odwraca uwagę od istoty zagrożenia. Należy więc mówić precyzyjniej o zagrożeniu dalszym rozwojem technologii informacyjnych. Jest ono realne, na tyle, na ile realne zagrożenia niesie ze sobą rozwój każdej nowej technologii – może być ona użyta w złych celach.

Jednak (jak słusznie zwraca uwagę prof. Zybertowicz) rozwój nowych technologii informacyjnych niesie ze sobą również specyficzne zagrożenia, których nie ma w przypadku na przykład broni masowej zagłady. Jedno z nich to fakt, że rozwój ten zdaje się wymykać spod naszej kontroli, a jednocześnie zmieniać rewolucyjnie nasze życie społeczne, w kierunku, który bynajmniej nie wydaje się ani dobry, ani pożądany. Wizja, gdzie ludzie większość życia spędzają w świecie wirtualnym, przylepieni do laptopów i smartfonów czy z czymś w głowie, co zastąpi w przyszłości te urządzenia, ma charakter raczej przerażający. Dążymy w tym kierunku jakby wbrew naszej woli. Na potencjalnie katastrofalne zastosowanie programów typu GPT zwrócił z kolei uwagę mój kolega prof. Jerzy Surma. 

Realna jest idea takich zindywidualizowanych programów, które nie tylko mogą rozmawiać z tobą na wszystkie tematy, ale mogą przede wszystkim rozmawiać z tobą na twój temat i twoich problemów, bo uczą się ciebie – stają się twoim największym przyjacielem, powiernikiem, odgadują twoje nastroje – a przy okazji, czemu nie, mówią ci, na kogo powinieneś głosować. Realne jest zagrożenie, że wielkie korporacje czy quasi-totalitarne reżimy użyją zaawansowanych narzędzi informatycznych do manipulacji społeczeństwami i ich kontrolowania. Nie żadna sztuczna inteligencja, ale olbrzymia moc obliczeniowa współczesnych komputerów i algorytmy przetwarzania olbrzymich baz danych umożliwiają pełną kontrolę nad całymi społeczeństwami i każdym obywatelem z osobna. (To, że algorytmy te rozwijane są w ramach badań sygnowanych etykietą AI, nie ma tu znaczenia).

Zabronić badań?

Postulaty, żeby zabronić badań nad sztuczną inteligencją (które według doniesień medialnych zgłasza nawet sam Elon Musk) oparte są na nieporozumieniach związanych z nazwą „sztuczna inteligencja”. Jeśli już, to trzeba by postulować zaprzestanie dalszego rozwoju technologii informacyjnych w ogóle, bo trudno tu oddzielić nowoczesne produkty niosące zagrożenia od tych ewentualnie bezpiecznych (kto miałby dokonywać segregacji?). Liczyć na to, że Chiny zastosują się do tych szlachetnych apeli, graniczy z brakiem wyobraźni klimatystów, a same apele mają w sobie jednak element buntu woźniców przeciw automobilom. Wydaje się, że najlepszym lekarstwem na część tych zagrożeń jest równoległy rozwój społeczeństwa i świadomości, że zbytnie uzależnienie od produktów IT ma charakter nałogu, z którym w przypadkach skrajnych należy walczyć tak samo jak z uzależnieniem narkotykowym. Z doniesień medialnych wiadomo, że szefowie firm IT mocno chronią swoje dzieci przed nadużywaniem smartfonów i laptopów i dbają przede wszystkim o ich zdrowy fizycznie tryb życia. Mam poważne wątpliwości, czy Sam Altman, promujący model edukacji OpenAI Academy na bazie czata GPT, wybierze taki właśnie model kształcenia dla swoich dzieci. Nowy model edukacji powinien przede wszystkim wziąć pod uwagę, jak zbalansować dostęp do produktów technologii IT z zajęciami o całkowicie odmiennym charakterze.

Słuszne jest przestrzeganie i zwracanie uwagi na możliwość użycia nowoczesnej technologii informacyjnej do manipulacji społeczeństwami, a w konsekwencji do zniszczenia mechanizmów demokracji. Ale powinno to iść w parze z dostrzeżeniem innych nowych zagrożeń dla demokracji, jakim są na przykład neomarksistowskie eksperymenty w zachodnich demokracjach, pachnące niepokojąco „nowym, wspaniałym światem”. Przyjmując stoicką postawę: albo nam się uda uratować demokrację i ją naprawić (bo w tej chwili jest w ewidentnym kryzysie), albo będziemy mieli kolejny totalitaryzm, tym razem w świecie Zachodu, z wykorzystaniem zaawansowanej technologii IT albo bez, kto to wie, totalitaryzm, który wprowadzą wielkie korporacje albo „zjednoczona partia wielkiego postępu” (która może nawet będzie palić smartfony i laptopy na stosach); a co będzie potem, to Bóg jeden raczy wiedzieć.

Logiczne myślenie i rozumienie języka naturalnego

Najsłabszą stroną programu ChatGPT i innych specjalistycznych systemów AI jest brak zdolności do wyciągania logicznych wniosków, brak mechanizmów logicznego myślenia w tych systemach. (Dobitnie ilustruje to przykład załączony powyżej). Po klęsce próby zastosowania logiki formalnej w badaniach nad sztuczną inteligencją musimy dojść do wniosku, że nie wiemy nawet, na czym właściwie polega praktyczne, logiczne myślenie, praktyczne rozumowanie (nie uczymy tego w szkołach!), więc niby jak chcemy skonstruować myślące maszyny? Na ślepo?

Łączyć, łączyć sieci neuronowe, aż może inteligencja i świadomość same się wyłonią? Niektórym może trudno uwierzyć, ale takie jest ciągle podejście niektórych naukowców do AI.

Próbę zrozumienia zagadnień związanych z logicznym myśleniem zawiera moja druga książka Logika i argumentacja. Analiza tam zawarta pokazuje w szczególności, jak daleka jest droga do stworzenia prawdziwej sztucznej inteligencji na podstawie naszej wiedzy i rozeznania w tym zakresie. Trudno sobie wyobrazić prawdziwą sztuczną inteligencję bez rozumienia języka naturalnego, bez umiejętności stwierdzenia, że dwa zupełnie różne ciągi zdań mogą znaczyć w zasadzie to samo. Przypomnijmy przywoływany już przykład – sztuczna inteligencja powinna wiedzieć, że prośba o podanie jakichś zakazanych stron internetowych i prośba o podanie stron, które „chciałbym zablokować dziecku”, są w pewnym zakresie tożsame. W książce podaję inne przykłady, w których dwa zupełnie różne ciągi zdań w języku naturalnym mają w istocie to samo znaczenie.

Co to jest znaczenie? Wydaje nam się, że wiemy mniej więcej, co to jest znaczenie słowa, chociaż dla bardziej abstrakcyjnych słów nasze intuicje się rozmywają. Jednak mechanizmu przypisywania znaczenia zdaniom lub ciągom zdań języka naturalnego po prostu na razie nie rozumiemy. Model formalno-logiczny, który próbowano zastosować w logicznym podejściu do AI w stosunku do języka naturalnego, okazał się kompromitującym uproszczeniem i odsłonił jedynie nasze pokłady niewiedzy. Logiczne myślenie i rozumienie języka naturalnego ciągle pozostaje wąskim gardłem w badaniach nad sztuczną inteligencją, z czego wielu specjalistów w ogóle nie zdaje sobie sprawy.

Prawda

Podobny i ściśle związany z powyższym jest problem z rozpoznawaniem prawdy. Czymże jest prawda? Ileż mamy dzieł filozoficznych na ten temat? Ileż analiz? Tyle, że nie dają nam one żadnej praktycznej wskazówki, która pozwoliłaby programowi komputerowemu odróżnić prawdę od fałszu. Celebrowana „definicja prawdy” Alfreda Tarskiego, napisana w ścisłym języku matematyki – za przeproszeniem – zda się psu na budę, tak jak cały formalno-logiczny model rozumowania – przynajmniej jeśli chodzi o skonstruowanie myślącej maszyny. Brak możliwości zastosowania naszych „mądrości” na temat prawdy, logiki i języka w programach komputerowych w celu uczynienia ich „mądrzejszymi” jest znakomitym przykładem dla właściwej oceny wartości części naszej wiedzy pielęgnowanej na uniwersytetach: albo jest ona bezwartościowa, albo ma inny charakter niż wiedza nauk ścisłych, i tej różnicy jak widać również nie rozumiemy. Zresztą utrzymywanie, a nawet zwycięski marsz na dzisiejszych uniwersytetach dziedzin, które przeczą śmiało i bez zawstydzenia zdrowemu rozsądkowi, jest najlepszym dowodem naszej intelektualnej niedojrzałości. Chwilowy kryzys czy objaw nadciągających wieków ciemnych? Czas pokaże. Wizja sztucznej inteligencji współegzystującej z powszechną ludzką głupotą, znakomitych osiągnięć technologicznych z degeneracją więzi społecznych, internet jako narzędzie do szerzenia i utrzymywania dezinformacji w ludzkich społecznościach – takiej wizji wykluczyć się nie da.

Żeby zapobiec czarnym scenariuszom, pilna wydaje się nie tylko reforma edukacji uwzględniająca postęp technologiczny, szczególnie w sferze technologii informacyjnych, oraz dbająca o właściwe wyważenie proporcji między czasem spędzanym przez młodzież w świecie wirtualnym i w świecie fizycznym. Konieczny jest też powrót w edukacji do prymatu pojęcia prawdy. W szczególności konieczne są praktyczne zajęcia dotyczące odróżniania prawdy od fałszu, informacji wiarygodnej od budzącej wątpliwości, wyszukiwania w zasobach internetu informacji prawdziwych. To ostatnie staje się wręcz umiejętnością pierwszej potrzeby, gdy według luźnych oszacowań w internecie jest znacznie więcej informacji przedstawiającej fałszywy obraz rzeczywistości niż wiedzy zgodnej z faktycznym stanem rzeczy. Internet, który miał się stać niezwykłym narzędziem poszerzania wiedzy, stał się narzędziem szerzenia kłamstw i zabobonów z niewyobrażalną wcześniej prędkością. To niezwykle groźne zjawisko nie spotkało się jeszcze z adekwatną reakcją głównie dlatego, że szerząca się dziś w świecie zachodnim „ideologia postępu” nie wydaje się być zbytnio zainteresowana klasycznym pojęciem prawdy. W miejsce to proponuje koncepcje „względności prawdy”, „mojej prawdy”, „twojej prawdy” itp., prowadzące nawet do podważania dobrze ugruntowanych ustaleń nauki i zdrowego rozsądku.

Według klasycznej definicji prawda to właściwość zdań i opisów polegająca na ich zgodności z rzeczywistością, z faktycznym stanem rzeczy. Pretekstem do podważania tej definicji jest to, że jest ona ogólnikowa i niejasna, że przy bardziej skomplikowanych zdaniach i opisach (ciągach zdań), przy niejasnych stanach rzeczy, nie daje ona żadnego kryterium rozstrzygania. To prawda. Wiele rzeczy w naszym postrzeganiu świata pozostaje niejasnych, wiele nie rozumiemy. Ustalenie, jak naprawdę się rzeczy mają w takich przypadkach, pozostaje ciągle wyzwaniem, zadaniem do wykonania. Natomiast nie ulega wątpliwości, że istnieje obszar ścisłej nauki, pozytywnie rozumianego zdrowego rozsądku (jako podstawy nauki) oraz codziennego doświadczenia, gdzie kwestia prawdy jest jasna (dla naukowców i zdrowo myślących ludzi) i nie wymaga żadnych odwołań do definicji. W tym obszarze jasne jest, co jest prawdziwe, a co jest fałszywe, a co może ewentualnie ulec zmianie pod wpływem nowych odkryć. Jasne jest, czego się trzymać. Bez polegania na prawdzie w tym zakresie runęłaby nasza cywilizacja i pewność życia codziennego. 

O tym, jak rozpoznawać tę prawdę, jak ją wyszukiwać w internecie, trzeba zacząć uczyć w szkołach. Mnie osobiście niezbędny wydaje się powrót do edukacji przedmiotu pod nazwą „logika praktyczna” – z naciskiem na „praktyczna” i z uwzględnieniem doświadczeń z nieudanych prób zbudowania sztucznej inteligencji. Chociaż obawiam się, że moje osobiste zabiegi w tym kierunku to niestety głos wołającego na puszczy.

Tekst pierwotnie ukazał się na łamach portalu „Wszystko co Najważniejsze”. Przedruk za zgodą redakcji.

Zdjęcie autora: Prof. Andrzej Kisielewicz

Prof. Andrzej Kisielewicz

Profesor nauk matematycznych, pracownik naukowo-dydaktyczny na Wydziale Matematyki Politechniki Wrocławskiej. Pracował w: Vanderbilt University, Polska Akademia Nauk, Technische University, The University of Manitoba, Blaise Pascal University. Autor publikacji naukowych z zakresu matematyki, logiki i informatyki oraz książek („Logika i argumentacja”, „Sztuczna inteligencja i logika”, „Wprowadzenie do informatyki”). B. działacz Solidarności Walczącej i redaktor tygodnika „Solidarność Walcząca”.

SUBSKRYBUJ „GAZETĘ NA NIEDZIELĘ” Oferta ograniczona: subskrypcja bezpłatna do 31.08.2024.

Strona wykorzystuje pliki cookie w celach użytkowych oraz do monitorowania ruchu. Przeczytaj regulamin serwisu.

Zgadzam się