Да ли ће интернет у наредним деценијама постати бесконачна и бескорисна библиотека

Писци научне фантастике су понудили неке од могућих праваца у којима ће се развијати интернет у наредним деценијама. А Борхес му је још пре 83 године прорекао мрачну будућност.

У свом роману Јесен из 2019. године, писац научне фантастике Нил Стивенсон замислио је блиску будућност у којој интернет још увек постоји. Али постао је толико загађена погрешним информацијама, дезинформацијама и рекламама да је у великој мери неупотребљив.

Ликови у Стивенсоновом роману овај проблем решавају тако што се претплате на „уредничке стримове“ – вести и информације које је изабрао човек и које се могу сматрати поузданим. Проблем је у томе што само богати себи могу да приуште такве услуге, остављајући већину човечанства да конзумира неквалитетан, непроверен онлајн садржај.

У извесној мери, ово се већ догодило, сматра Роџер Круз, професор психологије на Универзитету у Мемфису. Многе новинске куће, као што су Њујорк тајмс и Вол Стрит џурнал, наплаћују читање свог онлајн садржаја. У међувремену, дезинформације се шире на платформама друштвених медија као што су Икс и Тик-ток.

Стивенсон се истакао као прогностичар у више наврата – предвидео је настанак метаверзума у свом роману Лавина из 1992. година, а кључни елемент заплета његовог Дијамантског доба (1995) је интерактивни почетник који функционише слично као чет-бот.

На први поглед, чини се да чет-ботови нуде решење у борби против епидемије дезинформација. Објављивањем чињеничног садржаја, чет-ботови би могли да обезбеде алтернативне изворе висококвалитетних информација које не морају да се плате.

Иронично, међутим, резултати ових чет-ботова могу представљати највећу опасност за будућност веба – ону коју је деценијама раније наговестио аргентински писац Хорхе Луис Борхес.

Успон чет-ботова

Данас се значајан део интернета још увек састоји од чињенично утемељеног и наизглед истинитог садржаја, као што су чланци и књиге који су рецензирани, засновани на чињеницама или на неки начин проверени.

Програмери великих језичких модела, или ЛЛМ-ова (large language models) – механизама који покрећу ботове као што су ChatGPT, Копилот и Џемини – искористили су овај ресурс.

Међутим, да би испунили своју магију, у ове моделе морају да се унесу огромне количине висококвалитетног текста за потребе обуке. Огромна количина материјала је већ преузета из онлајн извора и достављена новим ЛЛМ-овима.

Проблем је у томе што је веб, колико год био огроман, ограничен ресурс. Висококвалитетни текстови који већ нисису преузети постају све већа реткост, што води ка ономе што је Њујорк тајмс назвао „почетком кризе садржаја”.

Ово је приморало компаније као што је „ОпенАИ“ да склопе споразуме са издавачима како би набавили још више сировог материјала за своје незасите ботове. Али према једном предвиђању, недостатак додатних висококвалитетних података за обуку могао би да наступи већ 2026.године.

Како резултати које производе чет-ботови завршавају на мрежи, ови текстови друге генерације – заједно са измишљеним информацијама званим „халуцинације“, као и очигледне грешке, као што су предлози да ставите лепак на вашу пицу – додатно ће загадити веб.

А ако се чет-бот дружи са погрешном врстом људи на мрежи, може покупити њихове неприхватљиве ставове. „Мајкрософт“ је ово открио на тежи начин 2016. године, када је морао да искључи Теја, бота који је почео да понавља расистички и сексистички садржај.

Временом би сви ови проблеми могли учинити онлајн садржај још мање поузданим и мање корисним него што је данас. Поред тога, ЛЛМ који се „пуне храном са ниским садржајем калорија“ могу произвести још проблематичније резултате који такође завршавају на вебу.

Бесконачна – и бескорисна – библиотека

Није тешко замислити повратну спрегу која резултира континуираним процесом деградације док се ботови хране сопственим несавршеним резултатима.

Рад из јула 2024. објављен у часопису Нејчер истраживао је последице обуке модела вештачке интелигенције на рекурзивно генерисане податке. Показало се да „неповратни дефекти“ могу довести до „колапса модела“ за системе који су обучени на овај начин – слично као што ће копија слике и копија те копије, и копија те копије изгубити верност оригиналне слике.

Колико лоше ово може да буде?

Борхесова кратка прича Вавилонска библиотека из 1941, педесет година пре него што је компјутерски научник Тим Бернерс-Ли створио архитектуру за веб, доноси аналогни еквивалент.

У својој причи од 3.000 речи, Хорхе Луис Борхес замишља свет који се састоји од огромног и вероватно бесконачног броја хексагоналних соба. Полице за књиге у свакој просторији садрже уједначене томове који морају, према интуицији њених становника, да садрже сваку могућу пермутацију слова у азбуци.

У почетку, ово схватање изазива радост: по дефиницији, морају постојати књиге које детаљно описују будућност човечанства и смисао живота.

Становници трагају за таквим књигама, да би открили да огромна већина не садржи ништа осим бесмислених комбинација слова. Истина је тамо – али и свака замислива лаж. И све то је уграђено у незамисливо огромну количину бесмислица.

Чак и после векова тражења, пронађено је само неколико значајних фрагмената. Чак и тада, не постоји начин да се утврди да ли су ови кохерентни текстови истина или лаж. Нада се претвара у очај.

Хоће ли интернет постати толико загађен да само богати могу приуштити тачне и поуздане информације? Или ће бесконачан број чет-ботова произвести толико загађених речи да проналажење тачних информација на мрежи постаје као тражење игле у пласту сена?

Интернет се често описује као једно од највећих достигнућа човечанства. Али као и сваки други ресурс, важно је озбиљно размислити о томе како се одржава и како се њиме управља – да се не бисмо суочили са дистопијском визијом коју је замислио Борхес.