Pytania te wydawały się niemal zbędne trzy dekady temu, gdy Internet zaczynał wchodzić do powszechnego użytku, a na awangardowe literackie eksperymenty z komputerem mógł sobie pozwolić każdy właściciel peceta podłączonego do sieci. Warto było pisać i publikować z wykorzystaniem języka nowych mediów choćby dlatego, że były one nowością. Dziś, gdy cyfrowość przenika każdy aspekt życia i kultury, a media cyfrowe nie są już „nowymi mediami”, odpowiedź na pytanie, dlaczego — i jak — opowiadać cyfrowo, nie jest już tak oczywista. Druk wcale nie umarł, a książka wciąż pozostaje najważniejszą walutą kapitału kulturowego. Dlaczego więc, jeśli jestem młodym, aspirującym autorem, miałbym się silić na interaktywne dodatki do głównego dzieła? Wydawca zadba o to, dystrybuując e-booka! Może zawierać on więcej ilustracji, dodatkowe materiały audio i wideo, a aparat przypisowy, jeśli na nim nam zależy, może być profesjonalnie zautomatyzowany.
Czy jednak chodzi tu o ilość? Pierwsze wydanie „Starości aksolotla” Jacka Dukaja, które ukazało się wyłącznie jako e-book, a o którym wydawca późniejszego papierowego wydania stwierdził, że „dojrzało do druku”, pokazuje, że opowieść w medium cyfrowym musi mieć coś więcej niż tylko multimedialne fajerwerki, abyśmy potraktowali ją poważnie. Tym „czymś” jest umiejętne powiązanie cyfrowej formy, programistycznego i polisemiotycznego arsenału z semantyką narracyjną.
Tezą mojej książki jest, że literatura elektroniczna, od jej pionierskich przejawów w postaci powieści hipertekstowych po najnowsze formy na smartfony i przy współudziale sztucznej inteligencji, jest obszarem, na którym pojawiają się szczególne, poszerzone figury stylistyczne i retoryczne. Ich rolą jest wyrażanie tego samego tematu, wątku, czy wybranego szczegółu świata przedstawionego na różnych poziomach utworu, angażując przy tym elementy kodu, interfejsu i działania czytelnika. To właśnie te figury, a zwłaszcza różne odmiany syllepsy, takie jak interakcyjna metalepsa oraz — proponowana w książce jako nowa figura — hiperlepsa, czynią z utworu cyfrowego jakościowo odmienny sposób opowiadania.
Figury te, które swoje początki mają już w „Popołudniu, pewnej historii” Michaela Joyce’a, nazywam figurami obecności, ponieważ dzięki nim, często za sprawą gestu wykonanego przez czytelnika, świat opowieści przenika do świata odbiorcy, a odbiorca zaznacza swoją obecność w świecie przedstawionym. Nie dzieje się to za sprawą kosztownej szaty graficznej czy gadżetów, takich jak kody QR pozwalające drukować modele 3D fikcyjnych postaci, jak u Dukaja, ale dzięki zręcznemu powiązaniu semantyki z semiotyką, komputerowego osprzętowania i kodu z elementami fabuły. W książce przyglądam się historii hiperleptycznych zabiegów i ich roli w analizie, interpretacji oraz wartościowaniu literatury cyfrowej: od skromnych efektów ekranowych w klasycznych powieściach hipertekstowych po aplikacje na smartfony, takie jak „Zombies, Run!” Naomi Alderman czy „Breathe” Kate Pullinger, które angażują ciało czytelnika, jego otoczenie oraz dane biometryczne.
Książka „Figury obecności” ukazała się dzięki dotacji Ministerstwa Nauki (grant „Doskonała nauka”). W swojej obecnej formie publikacja wiele zawdzięcza moim recenzentkom: prof. Ewie Szczęsnej i prof. Annie Łebkowskiej, wyśmienitym redaktorom i korektorom z Universitas, prężnym i zawsze pomocnym pracownicom Działu Nauki Wyższej Szkoły Informatyki i Zarządzania w Rzeszowie, profesorowi Andrzejowi Hejmejowi, redaktorowi serii „Projekty Komparatystyki” wydawnictwa Universitas oraz Dene Grigar i pracownikom jej ELL Labu na Washington State University w Vancouver, w USA. Wszystkim tym osobom i instytucjom serdecznie dziękuję.
Informatycy przestają być członkami orkiestry, stają się dyrygentami – donoszą z różnych stron przedstawiciele dziedzin wszelakich. Innymi słowy, indywidualni programiści nie muszą już pisać kodu, za to zachęca się ich, by podchodzili do swoich zadań tak, jakby kierowali programistyczną orkiestrą złożoną z asystentów, takich jak ChatGPT, z których każdy to potencjalnie osobny model sieci neuronowej wytrenowany na wyspecjalizowanym odcinku wiedzy informatycznej. Pojawia się jednak problem. Aby dyrygować skutecznie informatyk musi poszerzyć swoje kwalifikacje o umiejętności dotąd nie kojarzone z pisaniem kodu: o sztukę pisania promptów i sprawne posługiwanie się arsenałem językowym. Jak zlecić napisanie porcji kodu tak, by sztuczna inteligencja nie szła na skróty, unikała banału i nie halucynowała? Czy dzisiejsze systemy dialogowe są rzeczywiście sprawnym językowo członkiem informatycznej orkiestry? Zdaje się, że jednak nie. Dzisiejsza sztuczna inteligencja językowa ma problem ze swoim głównym tworzywem, kontekstem i medium – z językiem.
Takie wnioski płyną z dyskusji o językowych umiejętnościach ChatGPT, którą toczą pisarze, krytycy i czytelnicy Times Literary Supplement. Językową nieporadność dużych modeli językowych – według TLS – widać w jaskrawy sposób na kilku frontach.
Po pierwsze, ChatGPT bywa rozpoznawalnie staroświecki. "Przez ponad trzydzieści lat mojego nauczania w Berkley w esejach licencjackich moich studentów nie pojawiło się ani razu słowo "zgłębiać" (ang. delve), aż do dziś – pisze Eric Naiman, profesor literatury rosyjskiej, którego studenci w ostatnich dwóch latach korzystają z pomocy ChatGPT w pisaniu wypracowań o Dostojewskim. Oto zatem, z jednej strony, Dostojewski "zgłębia" problematykę destrukcyjnych sił ludzkiego umysłu lub ekonomicznych zmagań jednostki, a z drugiej ten czy inny esej studencki ma na celu "zagłębienie się" w etyczne i egzystencjalne problemy dziewiętnastowiecznej Rosji. Sama twórczość autora Braci Karamazow, jak dorzuca Naiman, od zawsze była określana jako "złożona" bądź "zawiła", ale nigdy "zniuansowana" i "wieloaspektowa" – kolejne ulubione słowa i zarazem znaki rozpoznawcze zbyt rozgadanej, mało precyzyjnej, szablonowej treści, którą bez umiejętnego promptu otrzymamy od ChatGPT.
Po drugie, ChatGPT jest – po wojskowemu wręcz – szablonowy. Niemal każda wygenerowana wypowiedź ciągła, pisana płynną prozą, jest tak naprawdę przebraną w paragrafy listą rzeczy, którą maszyna chce dla nas wypełnić i wyczerpać. Na końcu takiej listy najczęściej pojawia się banalne uogólnienie w stylu "a potem żyli długo i szczęśliwie". Mary Beard, czołowa publiczna intelektualistka Wielkiej Brytanii, z zawodu profesor literatury antycznej, zapytała ChatGPT o rolę Cycerona i jego mów (słynna "O tempora! O mores!") w wydarzeniach wokół spisku Katyliny. ChatGPT przyjął niezwykle uproszczoną, pozbawioną niuansów pro-cycerońską wypowiedź, która zostaje podsumowana zdaniem na poziomie ośmioklasisty: „Rola Cycerona w udaremnieniu spisku podniosła jego status jako męża stanu i mówcy, czyniąc go jedną z najbardziej znanych postaci Rzymu”. Beard przypomina, że nie tak długo po zdemaskowaniu Katyliny Juliusz Cezar zmusza Cycerona do opuszczenia Rzymu. Odmowa czerpania ze źródeł, niechęć do ukazywania dwóch stron medalu, tendencja do prezentowania budujących wniosków i zakończeń czyni z językowej sztucznej inteligencji zasób wiedzy dużo uboższy od Wikipedii – podsumowuje Beard.
Po trzecie, ChatGPT potrafi dość zuchwale kłamać i wymigiwać się od trudniejszych zadań. Mary Beard na pytanie o swój własny biogram otrzymała mieszaninę prawdy (edukacja, część dorobku) z nieprawdą (dyplom, imiona rodziców). Jeden z czytelników TLS, Brian Reffin Smith, wystawił model na jeszcze inną, językową próbę, którą po polsku i z użyciem aktualnego modelu ChatGPT 4.5 pozwolę sobie zrekonstruować i przytoczyć:
MP: Czy wiesz, co to jest lipogram?
ChatGPT: Oczywiście! Lipogram to tekst, który został napisany z wyłączeniem określonej litery lub określonych liter. To zabawna i czasem trudna sztuka pisania, która wymaga od autora kreatywnego podejścia do unikania używania pewnych liter.
MP: Skomponuj jednozdaniowy lipogram o przygodach kota, w którym brakuje litery "o":
ChatGPT: Kot sprytnie żeglował po dachach, podążając za zmiennym światłem gwiazd.
MP: Czy w powyższym lipogramie słowa "kot", "po" i "podążając" nie zawierają litery "o"?
ChatGPT: Przepraszam za pomyłkę! Oczywiście, "kot", "po" i "podążając" zawierają literę "o". Pozwól, że poprawię to:
Głodny felis skakał z dachu na gałęzie, tropiąc myszy w ciszy nocnej.
Dlaczego w jednym, krótkim lipogramie, w którym miało brakować "o" litera pojawia się aż trzykrotnie, a programom dopiero po upomnieniu używa kociego synonimu, choć nowy lipogram zawiera trzy kolejne "o"? Nieznane są ścieżki językowej sztucznej inteligencji. Trudno zaprzeczyć, że jest ona obecnie najpotężniejszym przykładem komputerowej czarnej skrzynki, o której działaniu użytkownik wie tyle, co nic. Duże modele językowe wciąż przypominają szkolnego lizusa, który pragnie zadowolić swojego nauczyciela kosztem rzetelnej i zwięzłej odpowiedzi, zakładając, że byle jaka odpowiedź jest lepsza, niż żadna. Dla programisty-dyrygenta – na dowolnym etapie projektu – oznaczać to może poważny zgrzyt, a nawet groźbę zawalenia się podłogi pod całą orkiestrą.
Na szczęście, to właśnie niedoskonałości systemów takich jak ChatGPT, pomagają zabezpieczyć się przed katastrofą. Dobrego asystenta poznamy po jego wytworach! Czego unikać, na co stawiać nacisk i co warto wielokrotnie powtarzać w interakcji z modelem – sztuka promptu, umiejętność jak najbardziej językowa, będzie musiała tym wyzwaniom sprostać. Programista, aby być dyrygentem informatycznej orkiestry, która odnosi sukces, powinien tę sztukę opanować.
Ten felieton jest wersją wpisu na blogu naukowym WSiZ
Większość niepowodzeń, o których ludzie mówią w interakcjach z ChatGPT, można rozwiązać poprzez lepsze formułowanie poleceń. Mimo że formułowanie poleceń nie zawsze jest konieczne, oto prosty skrót, który pomoże ci kształtować swoje wejścia, aby uzyskać pożądane wyjścia.
PROMPTS (polecenia)
Personality (osobowość)
Rubric (rubryka)
Objective (cel)
Models (modele)
Particulars (szczegóły)
Task (zadanie)
Setting (kontekst)
Osobowość: lub Rola. Jeśli chcesz czegoś więcej niż generycznego pisania, daj ChatGPT osobowość, którą będzie mógł używać jako wzór do wyrażania się. Ten wybór wskaże również słownictwo, ton i postawę. Dobrze jest również nadać mu rolę: Jesteś nauczycielem pisania. Jesteś kochającą matką trzech uroczych kotów. Jesteś zirytowanym klientem, który właśnie został przeładowany.
Rubryka: Jak wygląda udany wynik? Pisanie może być lepsze i gorsze, ale ChatGPT nie wie, co cenisz. Podobnie jak nauczyciel pisania, powiedz mu, co to jest dobre pisanie, a także co jest złym pisaniem.
Cel: Każdy akt komunikacji, każde wypowiedzenie ma jakiś cel. Jakiego celu próbujesz osiągnąć za pomocą tego tekstu?
Modele: Mimo że LLM (Large Language Models – Duże Modele Językowe) były modelowane na dużych ilościach języka (stąd "duże" w ich nazwie), mogły nie być szkolone na typie tekstu, którego pragniesz. Potrzebujesz, aby wygenerował raport TP? Pokaż mu więc kilka, zwłaszcza dobrych.
Szczegóły: To są twoje dane wejściowe. Jeśli nie chcesz, aby LLM wymyślał rzeczy — lub halucynował — musisz dostarczyć mu treści, których chcesz użyć. Podaj mu fakty, cytaty, dane itp. Większość LLM nie jest połączona z zestawami danych i jest niewiarygodna, nawet gdy są.
Zadanie: Większość ludzi zaczyna od zadania i ty też powinieneś. Ale umieściłem to niżej na liście, aby pomóc ci skupić się na innych aspektach pisania, o których możesz nie myśleć.
Kontekst: LLM zwykle zaczynają od zera przy każdej sesji, więc musisz stworzyć dla nich świat komunikacji. Kto jest odbiorcą? Jaka jest sytuacja, w której piszesz ten prompt?
Chociaż w sztuce formułowania poleceń jest dużo więcej i można dokonywać większych dostosowań, na przykład wprowadzając więcej danych szkoleniowych lub zmieniając temperatury, metoda PROMPTS powinna pomóc uzyskać lepsze wyniki.
Tylko dla nauczycieli:
Nauczanie metody PROMPTS to okazja do dyskusji ze studentami o tym, co wchodzi w skład każdego aktu komunikacji. Tak więc moc tego ćwiczenia może nie tkwić w tekście wyprodukowanym przez LLM, lecz zamiast tego w rozmowach, jakie może wywołać na temat natury pisania lub komunikacji.
Stworzyliśmy skrót PROMPTS na moim kursie pisania z pomocą maszyn w USC tego lata, z małą pomocą od samego ChatGPT.
Serią ilustracji stworzonych przy pomocy silników AI podzielił się w mediach społecznościowych poeta Jason Nelson. Nie byłoby w tym nic dziwnego, gdyby po pierwsze chodziło o zwykłe owoce naszych kreatywnych potyczek z sztuczną inteligencją, a po drugie gdyby tożsamość autorska pracy nie przechylała się w tym przypadku – wyjątkowo – w kierunku stylu i tożsamości człowieka, a nie maszyny. Paradoksalnie kluczem do “uczłowieczenia” prac okazuje się ta sama ilościowa metoda, która przyczyniła się do sukcesów modeli GPT , nazywanymi nie bez powodu modelami uczenia maszynowego o “o dużej skali”, a zatem czerpiącym z tysięcy terabajtów językowej i wizualnej ekspresji publikowanej w internecie i gromadzonej w przeróżnych sieciowych archiwach i repozytoriach. Otóż każdą z ilustracji stworzonych przy współudziale GPT Nelson stworzył nie za pomocą pojedynczego zapytania i pojedynczej odpowiedzi, ale za pomocą kilkudziesięciu prompów i setek “generatywnych ramek”. Ta ilościowa metoda skutkuje kolażową, kompozytową ilustracją o dużej rozdzielczości (10k). Następnie autor sięga po metody jakościowe, przerabiając otrzymany surowy materiał w obrębie wyłaniającego się graficznego kolażu przy pomocy dziesiątek “punktów wymazywania i ponownego rysowania”. Efektem takich metod jest choćby poniższy Ultra-Large Digital Narrative Image No.4:
Celem całej serii, jak wyjaśnia Nelson, było stawienie wyzwania “zgrzytliwej akceptacji” i “pełzającej pogardy” wyrażanej przez artystyczną społeczność wobec wytworów sztucznej inteligencji. Wydaje się, że cel ten został osiągnięty. Ilustracje, którymi Nelson się podzielił, choć noszą widoczne ślady działania modeli sieci neuronowych, której “gust”, jak udowadniają złośliwi krytycy, nieustannie ciąży ku estetyce okładek albumów psychodelicznego rocka z lat 70., posiadają też ewidentne oznaki stylu własnego Nelsona. Wystarczy porównać je z wyróżnioną niedawno poetycką grą Nelsona The Many Occasions of Moving (2022), czy nawet z jego ręcznie zrobioną, drewnianą skrzynką reprezentującą analogowy interfejs poetyckiej wyobraźni nadesłany na festiwal Pixel (2016), aby dostrzec wiele stylistycznych i konceptualnych kontynuacji…. :
Wykorzystane umiejętnie, modele sztucznej inteligencji zdają się wyraźnie służyć artyście, a nie mu zagrażać. Traktowanie GPT jako czegoś na wzór czeladnika mistrza w dawnych warsztatach malarskich wydaje się ważnym krokiem do zbalansowanego podejścia do potencjalnych zagrożeń. Nelson to podkreśla: “to jestem ja plus SI… te obrazki są bardziej skomplikowane niż prosty prompt i skutkująca nim grafika, dużo bardziej skomplikowane. Ale oczywiście SI odwalą tu kawał dobrej roboty”. Debata rozpoczęta przez prowokatorów takich jak Boris Eldagsen, który za pracę stworzoną przez SI otrzymał nagrodę w konkursie Sony World Photography Award, szybko się nie zakończy. Niemniej jednak, im więcej będzie przypadków, kiedy to artysta zyskuje raczej niż traci na postępie technologii SI, tym wyraźniejszy będzie jej wynik.
Kolejne ciekawe zmiany przynoszą nowe wersje programu Twine. Ostatnio w silniku Harlowe pojawiły się nowe makra określane mianem storylets. Zainspirowane proceduralnymi dialogami z gry Façade, wykorzystywane w Fallen London i w innych grach Emily Short, a niedawno wprowadzone do popularnego silnika Harlowe w Twine, storylets obiecują projektowanie nieliniowych narracji w sposób atrakcyjniejszy i dla autora i dla czytelnika (gracza). Emily Short definiuje storylets jako “niewielkie kawałki treści narracyjnej (wydarzenia, fragmenty) posiadające warunki wstępne, które określają, kiedy dana treść jest "odtwarzana", oraz efekty końcowe, które następują po "odtwarzaniu" danej treści.
Dotychczasowe omówienia kategorii storylets, oraz sama dokumentacja Twine, nie mówią zbyt wiele o korzeniach tej figury, a szkoda. Na poziomie skryptu pojedynczego segmentu opowieści, „warunki wstępne” oraz ich efekty można odnaleźć już w najwcześniejszych grach tekstowych (jeśli masz klucz, otwierasz drzwi do następnej lokacji) oraz w pionierskich hipertekstach jak popołudnie. pewna historia (jeśli nie wiesz kim jest Lolly, nie przejdziesz do jej gabinetu). Na poziomie grupy segmentów i dynamicznie wytwarzanych relacyjnych sekwencji storylets wywieść można z narracji budowanych na zasadzie talii kart, gdzie poszczególne segmenty rozdawane są jak w grze karcianej, a rozdanie z grupy obwarowane jest jakąś regułą (logiczną, frekwencyjną). Metody talli kart, jako element tzw. hipertekstu rzeźbiarskiego (sculptural hypertext) są wbudowane w najnowszą edycję Storyspace 3 i ich sztandarową demonstracją pozostaje powieść Those Trojan Girls Marka Bernsteina. Storyspace i Twine, każdy program na swój sposób, oferują też rozbudowany arsenał wymogów, warunków i działań, jakie przypisać można do pojedynczego linku, segmentu, otagowanej sekwencji.
Na kursach sztuki pisania, groznawstwa czy mediów cyfrowych, kategoria storylets może okazać się przydatna w zilustrowaniu wariantywności, która zamiast linków budowana jest przez semantyczne reguły odnoszące się do stanu zaawansowania narracji, postępów bohaterów itp. Proces twórczy, w przypadku zastosowaniu storylets, może znacząco różnić się od standardowego rozrysowywania drzewek fabuły. Autorzy, którzy doskonale wiedzą, co chcą pisać mogą preferować storylets zamiast linków, każdą scenę mogą bowiem poprzedzić określeniem warunków na jakich przejście z niej do innych się odbywa. Twine pozwala na określenie warunków już na początku segmentu, następnie, po napisaniu jego treści, praca autora się w zasadzie kończy. Stworzone muszą być jednak segmenty, do których warunki się odnoszą. Jeśli treści jest wystarczająco dużo to przebieg lektury / rozgrywki sortuje się sam, tworząc w locie dozwolone połączenia między segmentami. W dokumentacji Harlowe widnieje taki przykład:
(
storylet: when $season is "winter" and $married is false and visits is 0)
Jeśli powyższe makro zamieścimy na początku pasażu, to Twine, wykorzystując wbudowaną w storylet funkcję wyszukującą “lambda” pozwoli czytelnikowi przejść do kolejnego “otwartego”, a zatem spełniającego trzy powyższe warunki (jest zima, bohater nie jest w związku małżeńskim, a obecnego fragmentu jeszcze nie odwiedzono) segmentu oznaczonego jako storylet. Sortowanie takich segmentów, sprawdzanie, które są dostępne, a które nie, odbywa się w tle. Autor musi jedynie określić sposób w jaki sortowanie zostanie uruchomione (np. za pomocą makra “link-goto”). Użyte musi być też dodatkowe makro (open-storylets:)
:
(
for: each _p, ...(open-storylets:)'s 1stTo5th)[(link-goto: _p's name) - ]
Powyższy kod iteruje po liście branych pod uwagę segmentów i wybiera z pierwszego, który jest dostępny (otwarty). Po dodaniu w tym samym pasażu tak uzbrojonego makra (open-storylets:) nasz oparty na storylets system zaczyna działać. Lektura w locie i dynamicznie dostosowuje się do wyborów czytelnika bądź do “zewnętrznej” sytuacji w świecie przedstawionym. Czy tego rodzaju system warunkowego wyświetlania się treści, oddalający się zarówno od struktur linkowych jak i prostych warunków opartych na makrach (if:)
(else:)
, do którego potrzebne są lambdy, zagnieżdżone makra, iteracje po tablicach danych, może stanowić wiążącą alternatywę dla autorów? Czas pokaże.
Mija 20 lat od ukazania się Ulicy Sienkiewicza w Kielcach Radosława Nowakowskiego. Wielu z nas, przynajmniej pod kątem badawczym, wychowało się na tej niecodziennej, wyjątkowej, nie dającej się wyczerpać książce. Uczy nas ona do dziś, że interakcja, sprawczość i zanurzenie nie są wynalazkiem tekstów elektronicznych, ale istnieją w tradycji od zawsze. Późna epoka druku, której przejawem są między innym tanie technologie drukarskie dostępne dla przeciętnego zjadacza chleba (czytaj - artysty), pokazała, jak daleko można się posunąć w medium druku i przywrócić mu magię nie odbiegającą od tej, z która obnosi się medium cyfrowe.
Miałem niedawno okazję odwiedzić Radosława Nowakowskiego w jego domu-pracowni w Dąbrowie Dolnej. Pisarz pracuje nad specjalnym, jubileuszowym wydaniem Ulicy Sienkiewicza…. Jak przystało na Nowakowskiego, jubileusze wydanie będzie czymś naprawdę specjalnym. Otóż autor podjął się nowego sczytania głównej ulicy Kielc w dwadzieścia lat po oryginalnych, pierwotnych sesjach.
Jubileuszowa Ulicy Sienkiewicza… będzie zatem tą samą ulicą, ale 20 lat później. Nie mogę się doczekać, by odnaleźć na niej swoje ulubione miejsca, jak na przykład ukraińskie delikatesy….. Póki co, przed Nowakowskim sporo pracy, gdyż jubileuszowe wydanie będzie miało oczywiście świeży tekst, a także - nowy protokół lektury. Oficjalna i uroczysta premiera już w czerwcu. Zdaje się, że władze miasta potraktują to wydarzenie z należytą czcią i oddaniem. Radku, powodzenia!
Przyjazne linki:
Anglojęzyczne