„Кроћење горопади“ вештачке интелигенције, игра мачке и миша о плагирању текста
Компанија OpenAI лансирала је алат како би покушала да направи разлику између текста који је писан људском руком и текста генерисаног вештачком интелигенцијом — попут оног који су произвели модели Chat GPT и GPT 3 те компаније. Класификатор није нарочито прецизан, стопа успеха му је око 26 одсто, тврде из компаније и додају да би, када се користи у тандему са другим алатима, могао да буде користан у спречавању злоупотреба.
Портпарол компаније OpenAI изјавио је да је циљ класификатора да помогне у оспоравању лажних тврдњи да је текст који је генерисала вештачка интелигенција написао човек.
"Међутим, и даље има бројна ограничења – тако да би требало да се користи као допуна другим методама одређивања извора текста уместо да буде примарни алат за доношење одлука", рекао је портпарол компаније.
Почетну верзију класификатора, додаје, стављају на располагање да би добили повратне информације о томе да ли су такви алати корисни. Каже и да се надају се да ће у будућности делити побољшане методе.
Како расте интересовање око вештачке интелигенције која генерише текст, критичари су позвали креаторе алата да предузму кораке да ублаже њихове потенцијално штетне ефекте.
Неки од највећих школских округа у САД забранили су Chat GPT на својим мрежама и уређајима, плашећи се утицаја на учење и тачност садржаја који производи. Сајт какав је Stack Overflow, нека врста форума за програмере, забранио је корисницима да деле садржај који генерише ChatGPT, јер, како наводе, превише олакшава корисницима да преплаве теме дискусија сумњивим одговорима.
Како модел функционише
OpenAI класификатор је као и ChatGPT, језички модел вештачке интелигенције обучен на огромним количинама текста доступног са интернета. Али, за разлику од ChatGPT-а, он је фино подешен да предвиди колико је вероватно да је део текста генерисала вештачка интелигенција, и то било који модел вештачке интелигенције који генерише текст.
Конкретније, OpenAI је обучио текстуални класификатор за текст на основу 34 система за генерисање текста из пет различитих организација, укључујући и сам OpenAI.
Tекст је упарен са сличним текстoвима са Википедије, веб-сајтова извученим из линкова дељених на Редиту и скупом „људских демонстрација“ прикупљених за OpenAI систем за генерисање текста.
Класификатор неће радити, ипак, на било ком тексту. Потребно је најмање 1.000 карактера, односно око 150 до 250 речи. Такође, не открива плагијат. И OpenAI каже да је већа вероватноћа да ће погрешити у тексту који су написала деца или на језику који није енглески.
У зависности од нивоа поузданости, класификатор ће означити текст са „веома мало вероватно“ да је генерисан вештачком интелигенцијом (мање од 10 одсто шансе), „мало вероватно“ (између 10 и 45 одсто шансе), „нејасно да ли га је генерисала вештачка интелигенције“ (шанса од 45 до 90 одсто), „могуће“ да га је генерисао АI (шанса од 90 до 98 одсто) или „вероватно“ да га је генерисала вештачка интелигенције (шанса за то је преко 98 одсто).
То, међутим, неће зауставити намере да се „вара“, али је питање да ли ће то моћи и други алати.
Игра мачке и миша
Појавило се нешто попут „кућне радиности“ како би се задовољила потражња за детекторима текста који је генерисала вештачка интелигенција.
ChatZero, који је развио студент са Универзитета Принстон, користи критеријуме укључујући „замршеност“ (сложеност текста) и варијације реченица не би ли открио да ли је текст написала вештачка интелигенција.
У једноставној претртази на Гуглу добиће се десетине других апликација које тврде да су у стању да одвоје „жито“ генерисано вештачком интелигенцијом од „кукоља“ које је створио човек.
Вероватно је да ће то у неком тренутку постати игра мачке и миша. Како се вештачка интелигенција која генерише текст буде побољшавала, тако ће се побољшавати и алати за откривање ко је писао текст.
И како OpenAI наводи, иако би класификатори могли помоћи у одређеним околностима, они никада неће бити једини поуздани доказ у одлучивању да ли је текст генерисала вештачка интелигенција.
Коментари