Кинески шамар Америци и ChatGPT-ју док је Трамп полагао заклетву – шта је DeepSeek

Нови технолошки скок у Кини шокирао је водеће истраживаче вештачке интелигенције у САД, пошто је „ChatGPT" неочекивано добио кинеског ривала. „DeepSeek", до скоро анонимна компанија, објавила је језички модел који је, према прелиминарним тестирањима, бољи или на нивоу најбољих америчких четботова. Главни адут модела „DeepSeek-R1" је цена, тридесети део онога што тражи ChatGPT. Како је стартап из Хангџоуа, упркос санкцијама на увоз америчких чипова, уздрмао Силицијумску долину?

Док је први човек калифорнијског технолошког гиганта „OpenAI" Сем Алтман био заузет инаугурацијом новог председника Доналда Трампа, из Кине је стигао удар у борби САД и Кине за глобалну превласт у пољу вештачке интелигенције.

„DeepSeek", стартап из Хангџоуа, објавио је велики језички модел вештачке интелигенције под називом „DeepSeek-R1", који одушевљава научнике као приступачна алтернатива најновијим четботовима, попут „ChatGPT-јевог" модела o1.

Признање долази и од конкуренције. Извршни директор „Мајкрософта" Сатја Надела сматра да је нови модел „DeepSeek-а" импресиван како у погледу ефикасног отвореног кода који су направили, тако и у погледу времена закључивања и изузетне рачунарске ефикасности.

„DeepSeek-R1" је, према досадашњим тестирањима, бољи или на нивоу најбољих америчких четботова.

Неочекивани резултати тестирања

Прелиминарни тестови показују да је учинак „DeepSeek-R1" на одређеним задацима из хемије, математике и програмирања на нивоу модела "o1", који је, такође, одушевио истраживаче када га је „OpenAI" представио у септембру.

„Ово је невероватно и потпуно неочекивано", написао је на Иксу Елвис Саравија, истраживач вештачке интелигенције и суоснивач британске консултантске фирме "DAIR.AI".

Тешко је рећи да ли тестирања заиста приказују способност модела да расуђује или само да пролази тестове.

Али, пошто је „DeepSeek-R1" модел отвореног кода (open source), његов „ланaц размишљања" доступан је истраживачима, а научници га тестирају и могу да проучавају његов алгоритам.

Објављен под лиценцом MИT, модел се може слободно користити, али се ипак не сматра у потпуности отвореним, јер подаци за његову обуку нису доступни.

Цена – тридесети део онога што наплаћује "OpenAI"

„DeepSeek" није објавио колико је новца било потребно за тренирање модела R1, али корисницима наплаћује тридесети део цене за o1.

„Експеримент који кошта више од 300 фунти (око 370 долара) са ‘o1‘, кошта мање од 10 долара са R1", наводи Марио Крен из немачког Института „Макс Планк".

„Заправо, моделе који расуђују можете креирати за далеко, далеко мање новца. Не требају вам огромне суме да унапред тренирате модел. Тако да мислим да се правила игре мењају", објашњава Али Годси, суоснивач и извршни директор компаније „Databricks".

Иначе, „DeepSeek" тврди да је свој претходни модел V3, који је представљен у децембру, завршио за само два месеца и мање од шест милиона долара, док су „Гугл" и „OpenAI" за сличну технологију потрошили године и стотине милиона долара.

Оснивач „DeepSeek-а" са кинеским премијером на дан Трампове инаугурације

Према извештајима медија у Кини, „DeepSeek" је настао из кинеског хеџ фонда „High Flyer Quant", који управља са око осам милијарди долара имовине.

Упркос наглом пробоју на технолошкој сцени, о компанији се мало зна, као и о њеном оснивачу, Лијангу Венфенгу (40).

Лијанг Венфенг је постао ново лице ИТ индустрије у Кини на симпозијуму којим је председавао премијер Ли Ћијанг у Пекингу 20. јануара.

Излазак из анонимности са претходним моделом

Компанија је из релативне анонимности изашла прошлог месеца, када је представила модел под називом V3, који је надмашио главне ривале, иако је развијен са ограниченим буџетом.

Стручњаци процењују да је изнајмљивање хардвера потребног за тренинг коштало око шест милиона долара, у поређењу са више од 60 милиона за „Метин" модел „Llama 3.1 405B", који је користио 11 пута више ресурса за обраду података.

Све су то постигли упркос строгим ограничењима на набавку чипова, које је влада САД наметнула Кини.

Како је компанија пребродила америчке санкције на чипове

Део интересовања за „DeepSeek" произилази из чињенице да је успео да направи модел R1 упркос америчким санкцијама, која ограничавају кинеске фирме у приступу најбољим рачунарским чиповима дизајнираним за обраду вештачке интелигенције, попут графичких процесора H100 компаније „Енвидија" (NVIDIA).

Ограничена рачунарска снага натерала је фирму на иновације у алгоритмима, каже Венда Ли, истраживач вештачке интелигенције са Универзитета у Единбургу.

Користили су хардвер који су имали на располагању, али су га искористили далеко ефикасније.

Претња америчкој доминацији у ВИ, бивши директор „Гугла" променио мишљење

Два дана после представљања „DeepSeek-R1", Доналд Трамп је најавио улагање од 500 милијарди долара у инфраструктуру вештачке интелигенције.

Међутим, напредак Кине у развоју вештачке интелигенције указује да се вођство које су САД некада имале значајно смањило.

У раној 2024. години, бивши извршни директор „Гугла", Ерик Шмит, оценио је да је Кина две до три године иза САД у развоју вештачке интелигенције.

Али сада Шмит има другачији став. „Раније сам мислио да смо пар година испред Кине, али Кина је у последњих шест месеци достигла изузетан напредак. Чињеница је да неколико кинеских програма, један од њих је, на пример, DeepSeek, изгледа као да су достигли наш ниво", рекао је Шмит.

Када је „OpenAI" представио "ChatGPT" у новембру 2022. године, био је без конкуренције.

Сада се компанија суочава не само са жестоком домаћом конкуренцијом од „Гугловог" Џеминија, „Антропиковог" Клода и Метиног модела „Llamа", већ и са кинеским моделима.

Кинески „DeepSeek" представља сеизмички помак у глобалној конкуренцији у области вештачке интелигенције.

Његов успех наглашава значај ефикасности и иновација, као и растући утицај модела отвореног кода.

Читај ми!