недеља, 26.01.2025, 05:45 -> 08:27
Извор: РТС, Nature, CNBC, South China Morning Post, X
Аутор: Горан Белановић
štampajKineski šamar Americi i ChatGPT-ju dok je Tramp polagao zakletvu – šta je DeepSeek
Novi tehnološki skok u Kini šokirao je vodeće istraživače veštačke inteligencije u SAD, pošto je „ChatGPT" neočekivano dobio kineskog rivala. „DeepSeek", do skoro anonimna kompanija, objavila je jezički model koji je, prema preliminarnim testiranjima, bolji ili na nivou najboljih američkih četbotova. Glavni adut modela „DeepSeek-R1" je cena, trideseti deo onoga što traži ChatGPT. Kako je startap iz Hangdžoua, uprkos sankcijama na uvoz američkih čipova, uzdrmao Silicijumsku dolinu?
Dok je prvi čovek kalifornijskog tehnološkog giganta „OpenAI" Sem Altman bio zauzet inauguracijom novog predsednika Donalda Trampa, iz Kine je stigao udar u borbi SAD i Kine za globalnu prevlast u polju veštačke inteligencije.
„DeepSeek", startap iz Hangdžoua, objavio je veliki jezički model veštačke inteligencije pod nazivom „DeepSeek-R1", koji oduševljava naučnike kao pristupačna alternativa najnovijim četbotovima, poput „ChatGPT-jevog" modela o1.
Priznanje dolazi i od konkurencije. Izvršni direktor „Majkrosofta" Satja Nadela smatra da je novi model „DeepSeek-a" impresivan kako u pogledu efikasnog otvorenog koda koji su napravili, tako i u pogledu vremena zaključivanja i izuzetne računarske efikasnosti.
„DeepSeek-R1" je, prema dosadašnjim testiranjima, bolji ili na nivou najboljih američkih četbotova.
Neočekivani rezultati testiranja
Preliminarni testovi pokazuju da je učinak „DeepSeek-R1" na određenim zadacima iz hemije, matematike i programiranja na nivou modela "o1", koji je, takođe, oduševio istraživače kada ga je „OpenAI" predstavio u septembru.
„Ovo je neverovatno i potpuno neočekivano", napisao je na Iksu Elvis Saravija, istraživač veštačke inteligencije i suosnivač britanske konsultantske firme "DAIR.AI".
Teško je reći da li testiranja zaista prikazuju sposobnost modela da rasuđuje ili samo da prolazi testove.
Ali, pošto je „DeepSeek-R1" model otvorenog koda (open source), njegov „lanac razmišljanja" dostupan je istraživačima, a naučnici ga testiraju i mogu da proučavaju njegov algoritam.
Objavljen pod licencom MIT, model se može slobodno koristiti, ali se ipak ne smatra u potpunosti otvorenim, jer podaci za njegovu obuku nisu dostupni.
Cena – trideseti deo onoga što naplaćuje "OpenAI"
„DeepSeek" nije objavio koliko je novca bilo potrebno za treniranje modela R1, ali korisnicima naplaćuje trideseti deo cene za o1.
„Eksperiment koji košta više od 300 funti (oko 370 dolara) sa ‘o1‘, košta manje od 10 dolara sa R1", navodi Mario Kren iz nemačkog Instituta „Maks Plank".
„Zapravo, modele koji rasuđuju možete kreirati za daleko, daleko manje novca. Ne trebaju vam ogromne sume da unapred trenirate model. Tako da mislim da se pravila igre menjaju", objašnjava Ali Godsi, suosnivač i izvršni direktor kompanije „Databricks".
Inače, „DeepSeek" tvrdi da je svoj prethodni model V3, koji je predstavljen u decembru, završio za samo dva meseca i manje od šest miliona dolara, dok su „Gugl" i „OpenAI" za sličnu tehnologiju potrošili godine i stotine miliona dolara.
Osnivač „DeepSeek-a" sa kineskim premijerom na dan Trampove inauguracije
Prema izveštajima medija u Kini, „DeepSeek" je nastao iz kineskog hedž fonda „High Flyer Quant", koji upravlja sa oko osam milijardi dolara imovine.
Uprkos naglom proboju na tehnološkoj sceni, o kompaniji se malo zna, kao i o njenom osnivaču, Lijangu Venfengu (40).
Lijang Venfeng je postao novo lice IT industrije u Kini na simpozijumu kojim je predsedavao premijer Li Ćijang u Pekingu 20. januara.
Izlazak iz anonimnosti sa prethodnim modelom
Kompanija je iz relativne anonimnosti izašla prošlog meseca, kada je predstavila model pod nazivom V3, koji je nadmašio glavne rivale, iako je razvijen sa ograničenim budžetom.
Stručnjaci procenjuju da je iznajmljivanje hardvera potrebnog za trening koštalo oko šest miliona dolara, u poređenju sa više od 60 miliona za „Metin" model „Llama 3.1 405B", koji je koristio 11 puta više resursa za obradu podataka.
Sve su to postigli uprkos strogim ograničenjima na nabavku čipova, koje je vlada SAD nametnula Kini.
Kako je kompanija prebrodila američke sankcije na čipove
Deo interesovanja za „DeepSeek" proizilazi iz činjenice da je uspeo da napravi model R1 uprkos američkim sankcijama, koja ograničavaju kineske firme u pristupu najboljim računarskim čipovima dizajniranim za obradu veštačke inteligencije, poput grafičkih procesora H100 kompanije „Envidija" (NVIDIA).
Ograničena računarska snaga naterala je firmu na inovacije u algoritmima, kaže Venda Li, istraživač veštačke inteligencije sa Univerziteta u Edinburgu.
Koristili su hardver koji su imali na raspolaganju, ali su ga iskoristili daleko efikasnije.
Pretnja američkoj dominaciji u VI, bivši direktor „Gugla" promenio mišljenje
Dva dana posle predstavljanja „DeepSeek-R1", Donald Tramp je najavio ulaganje od 500 milijardi dolara u infrastrukturu veštačke inteligencije.
Međutim, napredak Kine u razvoju veštačke inteligencije ukazuje da se vođstvo koje su SAD nekada imale značajno smanjilo.
U ranoj 2024. godini, bivši izvršni direktor „Gugla", Erik Šmit, ocenio je da je Kina dve do tri godine iza SAD u razvoju veštačke inteligencije.
Ali sada Šmit ima drugačiji stav. „Ranije sam mislio da smo par godina ispred Kine, ali Kina je u poslednjih šest meseci dostigla izuzetan napredak. Činjenica je da nekoliko kineskih programa, jedan od njih je, na primer, DeepSeek, izgleda kao da su dostigli naš nivo", rekao je Šmit.
Kada je „OpenAI" predstavio "ChatGPT" u novembru 2022. godine, bio je bez konkurencije.
Sada se kompanija suočava ne samo sa žestokom domaćom konkurencijom od „Guglovog" Džeminija, „Antropikovog" Kloda i Metinog modela „Llama", već i sa kineskim modelima.
Kineski „DeepSeek" predstavlja seizmički pomak u globalnoj konkurenciji u oblasti veštačke inteligencije.
Njegov uspeh naglašava značaj efikasnosti i inovacija, kao i rastući uticaj modela otvorenog koda.
Коментари