Recenzent GPT

Zakończył się trwający sześć miesięcy eksperyment i naszym Czytelnikom należy się związku z tym parę słów wyjaśnienia.

Ale po kolei. Pomysł, żeby zaprogramować specjalnego bota piszącego recenzje teatralne pojawił się w redakcji nieoczekiwanie, podczas burzy mózgów, poświęconej wyznaczaniu kierunków rozwoju naszego pisma i szukaniu nowych pomysłów na jego uatrakcyjnienie.

W obliczu rosnących kosztów wszystkiego (podróży, noclegów, wynagrodzeń) wydaje się to jedyną rozsądną opcją, zwłaszcza dla pisma internetowego, niemającego, jak teatry, setki osób na etatach ani jak niektóre redakcje – dziesiątki stałych pracowników.

Poza tym byliśmy ciekawi, co też ten czat napisze, jak poradzi sobie z zadaniem.

I wreszcie, last but not least, chcieliśmy, jako radykalni miłośnicy postępu, być w trendzie i na czasie.

Było jasne, że nie może być to taki sobie zwykły GPT, zasilany sieczką z internetu, dobry co najwyżej do pisania listów miłosnych dla gimnazjalistów, prac rocznych czy licencjackich dla studentów albo przemówień dla początkujących polityków. Na potrzeby naszego pisma, stawiającego sobie ambitne cele, chcieliśmy, wspólnie z inżynierami z zaprzyjaźnionej Politechniki w Dortmundzie, stworzyć prawdziwe intelektualne monstrum, wykarmione na wysokobiałkowej intelektualnej paszy, prawdziwego über-bota. Dzięki życzliwej współpracy Instytutu Teatralnego nasz Teatr-Bot, czyli w skrócie T-Bot (albo T-Bocio, jak go czasem pieszczotliwie nazywaliśmy w swoim gronie) został utuczony najlepszymi przykładami recenzji teatralnych, publikowanych w Polsce w ciągu ostatniej dekady i znajdujących się w bazie e-teatru. Inżynierowie z Dortmundu pomogli zaprojektować odpowiednie algorytmy i opcje, pozwalające nam optymalizować recenzje z punktu widzenia ich wiarygodności, trafności i atrakcyjności dla czytelników.

I tak nasz T-Bot został wyposażony w opcje dozowania poziomu fachowości recenzji (od minus pięć, czyli „totalnie głupkowata”, do plus pięć, czyli „ekstremalnie przemądrzała”), stronniczości (od zera – „całkowicie obiektywna”, do dziesięć – „na maksa stronnicza”), kultury wywodu (od zera – „pełna kultura”, do dziesięć – „same bluzgi”, przy czym jednostki tego parametru postanowiliśmy nazwać dla ułatwienia sewerynami, od łacińskiego severus: „surowy, srogi, poważny”; założyliśmy, że teoretycznie można sobie wciąż wyobrazić recenzję całkowicie pozbawioną surowej napastliwości i srogich wulgaryzmów, ale na potrzeby eksperymentu, dążąc do pełnej wiarygodności recenzji T-Bota, ustawiliśmy defaultowo, że recenzje będą miały najczęściej od trzech do siedmiu sewerynów, licząc w proporcji bluzgów do ilości zdań i słów).

Jedną z najważniejszych opcji był znacznik ideologiczny, który pozwalał nam ustawiać recenzję od minus pięć („zatęchła konserwa” – rzeczowe argumenty, odwołania do tradycji, wartości estetycznych itp. niskie i przestarzałe chwyty recenzenckie) do plus pięć („sterydy postępu” – całkowite pomijanie odwołań do tradycji teatralnej, wartości estetycznych czy analiz przekazu, za to pełne skupienie się na walorach ideologicznych spektaklu, jego funkcjach perswazyjnych i dydaktycznych, znaczeniu dla krzewienia postępu w naszym kraju). Do tego nasz über-bot został jeszcze wyposażony w sterownik personalizacji recenzji (od zera: brak ataków personalnych na twórców, do dziesięciu – maksymalnie intensywny hejt w stylu uliczno-internetowym; jednostki personalizacji nazwaliśmy dla łatwej komunikacji urbanami – od angielskiego urban, czyli „miejski”; przy czym choć teoretycznie mogłaby istnieć recenzja pozbawiona wycieczek personalnych, to założyliśmy, że defaultowo będzie to od trzech do siedmiu urbanów).

I tak zaprogramowany T-Bot został spuszczony ze smyczy – jak psy wojny.

Jego recenzje ukazywały się zarówno jako twórczość fikcyjnych autorów „Teatrologii” (wymyślonych i legendowanych zmyślonymi biogramami specjalnie na potrzeby eksperymentu), jak i pod nazwiskami realnych recenzentów – losowo, wśród innych recenzji, pisanych naprawdę przez naszych współpracowników.

Wśród moich recenzji (to znaczy, mówiąc precyzyjnie, podpisanych moim nazwiskiem) mniej więcej co trzecia była „autorstwa” T-Bota.

Na pełne podsumowanie wyników sześciomiesięcznego eksperymentu trzeba jeszcze poczekać (inżynierowie z Dortmundu pracują teraz nad pełnym raportem, opartym na pogłębionej analizie danych ilościowych), ale już teraz, na gorąco, można sformułować kilka wniosków.

Po pierwsze, T-Bot, choć pozornie był, czy też miał być, maszyną dającą się sterować, dość szybko się usamodzielnił i stał się arogancki. Już po pierwszych dwóch, najdalej trzech tygodniach na polecenia, żeby zrecenzował jakieś konkretne przedstawienie, zaczął odpowiadać „nie będę komentował tego szitu, przemilczamy” (co dotyczyło zwykle przedstawień opartych na nieznośnie wiernym czy choćby obsesyjnie uważnym odczytaniu tekstu dramatu) albo „wolałbym raczej zrecenzować przedstawienie X” (tu znów pojawiały się zwykle przedstawienia mętne, bełkotliwe, w zasadzie o niczym, pozbawione struktury i logiki).

Autorów i tytuły przedstawień, których zdaniem über-bota nie powinno się albo przeciwnie należałoby recenzować, mamy w zasobach redakcji, opublikujemy wszystko w aneksie do raportu z naszego eksperymentu, jako czarną i białą listę spektakli.

Jeśli ręcznie ustawialiśmy i narzucaliśmy przedstawienie do recenzji wbrew woli T-Bota, przysyłał tekst mający 9-10 sewerynów i 8-10 urbanów.

Po drugie, jak się okazało, byli twórcy, których spektakle, niezależnie od ich realnej wartości (na ile mogliśmy to jako redakcja ocenić, oglądając je osobiście i wyrabiając sobie własne zdanie w oparciu o wrażenia i posiadaną wiedzę) T-Bot recenzował w samych superlatywach, jakby ci twórcy byli w pewien sposób „święci”, odporni na krytykę, jak bóstwa w oczach wyznawców. Jeśli pojawiały się tam jakiekolwiek recenzje krytyczne, to zawsze z komentarzem typu „nawet Mistrzowi zdarzyć się może drobne niedociągnięcie, ale nie zmienia to rangi przedstawienia”. Nazwaliśmy to zjawisko „syndromem Krystiana”, od imienia Krystian, czyli „wyznawca Chrystusa”.

Po trzecie, wyszło na to, że T-Bot, choć niby to tylko sztuczna inteligencja, ale swój rozum jednak ma. Jego własne wybory, tam gdzie nie miał zadawanych parametrów recenzji, szły w stronę eskalowania poziomu stronniczości, ilości bluzgów, zaangażowania ideologicznego i personalizacji przy jednoczesnym zaniżaniu poziomu fachowego. Takie recenzje osiągały zarazem najwyższe liczby odczytań, a niektóre zbliżały się nawet do ilości odsłon teledysków raperki Lizzo na You Tube, takich jak About Damn Time czy Good As Hell. Über-bot dowiódł, że rzeczywiście jest piekielnie dobry, umie pisać sprawnie, z pazurem, i że to, co tworzy, naprawdę podoba się publiczności.

Czwarty wniosek zaskoczył nas najbardziej. Otóż kiedy zaczęliśmy porównywać pisane dla nas teksty T-Bota z recenzjami tych samych spektakli, ukazującymi się na łamach najbardziej szanowanych pism teatralnych i największych działów recenzji gazet i portali, dostrzegliśmy uderzające podobieństwo. Czyżby nasz T-Bocio na boku pracował też dla nich? A może inne pisma teatralne stworzyły sobie już dawno podobne über-boty, zasilane tą samą bazą danych?

Trochę to jest wszystko niepokojące. Czyżby T-Boty były jedyną przyszłością krytyki teatralnej w Polsce?

Myśleliśmy nawet przez chwilę o tym, by wyniki eksperymentu zachować w tajemnicy. Ale po dyskusji w łonie redakcji zwyciężyło stanowisko, że naszym Czytelnikom należy się szczerość i ujawnienie całej prawdy.

Jak mówią niektórzy, tylko prawda jest ciekawa.

Pełny raport z eksperymentu opublikujemy w październiku i już teraz zapowiadamy dyskusję na ten temat na łamach naszego pisma, do której serdecznie wszystkich zapraszamy.

Tytuł oryginalny

Źródło:

Autor:

Data publikacji oryginału:

Sprawdź także