IT vesti

Reddit tuži Anthropic zbog neovlašćenog korišćenja podataka za obuku AI modela

Reddit je pokrenuo tužbu protiv Anthropic-a, optužujući ga za neovlašćeno korišćenje korisničkog sadržaja za obuku AI modela, uključujući postove, komentare i diskusije sa platforme. Tužba navodi kršenje autorskih i ugovornih prava, zaobilaženje API ograničenja i pristup podacima iz zatvorenih zajednica. Ovaj slučaj dolazi nakon što je Reddit sklopio višemilionski ugovor sa Google-om za licenciranje sadržaja. Ishod procesa mogao bi postaviti presedan za vlasništvo nad korisnički generisanim sadržajem i buduću regulativu AI modela. Ako Reddit pobedi, AI kompanije bi mogle biti primorane da sklapaju komercijalne ugovore sa platformama, što bi značajno promenilo pristup treniranju velikih jezičkih modela.

 Tužba zbog korišćenja podataka za obuku AI modela

U jeku rastuće zabrinutosti oko korišćenja podataka sa interneta za treniranje veštačke inteligencije, Reddit je pokrenuo tužbu protiv kompanije Anthropic, navodeći da su njihovi podaci korišćeni bez dozvole i bez naknade, što predstavlja ozbiljno kršenje autorskih i ugovornih prava.


Šta je zapravo sporno?

Reddit, popularna platforma za diskusiju sa milijardama postova i komentara, tvrdi da je Anthropic koristio sadržaj sa Reddit-a za obuku svojih AI modela (verovatno Claude modela), a da pritom nije imao licencu, odobrenje ili ugovor.

Prema navodima iz tužbe, Anthropic je preuzeo ogromne količine korisničkog sadržaja sa Reddita, uključujući diskusije, odgovore i originalne objave korisnika – koje su zaštićene Redditovim pravilima korišćenja.


Zašto je ovo važno?

Reddit je nedavno objavio da monetizuje pristup svom API-ju, zahtevajući od velikih AI firmi da plaćaju za korišćenje sadržaja iz svoje baze. Dogovor sa Google-om (vredan oko 60 miliona dolara godišnje) već je sklopljen, dok se ovaj potez protiv Anthropic-a tumači kao odbrana tog modela poslovanja.

U tužbi se navodi da je Anthropic:

  • Prekršio autorska prava korisnika i platforme,

  • Zaobišao restrikcije iz Reddit API-ja,

  • Koristio podatke iz zajednica koje nisu javno dostupne u sirovom obliku.


 Šira slika – podaci vs AI

Ovo nije prvi slučaj ove vrste. Ranije su The New York Times, Getty Images, pa čak i autori knjiga tužili razne AI kompanije zbog korišćenja zaštićenog materijala bez saglasnosti.

Redditova tužba može postaviti presedan u vezi sa korisnički generisanim sadržajem – da li su komentari i postovi javni, ili ipak pripadaju platformi i njenim korisnicima?


 Izjave i odgovori

Anthropic se do trenutka pisanja ovog teksta nije zvanično oglasio, ali kompanija je u više navrata tvrdila da koristi podatke sa „javnog interneta“ u skladu sa zakonima. Reddit sa druge strane ističe da čak i javno dostupni podaci podležu ugovornim i tehničkim ograničenjima.


 Šta dalje?

Ishod ovog procesa može značajno uticati na pravnu regulativu AI modela – posebno u pogledu treniranja velikih jezičkih modela (LLM). Ako Reddit pobedi, to bi moglo otvoriti vrata brojnim drugim platformama koje će tražiti nadoknadu za upotrebu svog sadržaja.

Takođe, AI kompanije bi mogle biti primorane da sklapaju komercijalne ugovore sa izvorima podataka, što bi drastično promenilo dinamiku razvoja veštačke inteligencije.


 Zaključak

Ova tužba je još jedan znak da „besplatni podaci sa interneta“ više nisu jednostavna stvar. Granica između javnog sadržaja i vlasničkog materijala postaje sve važnija – i za AI i za korisnike interneta širom sveta.

 Dodatno čitanje i izvori

Ukoliko želite da saznate više o ovoj temi, preporučujemo sledeće relevantne izvore i zvanične objave:

Nebojsa Kostić

Rođen 1976. Bavim se računarima I it poslovima više od 20 godina..Osnivač TechFokusa i tehnološki novinar sa preko 20 godina iskustva. Specijalizovan je za hardver, retro računare i tržišne analize.

Nebojsa Kostić has 438 posts and counting. See all posts by Nebojsa Kostić

Оставите одговор

Ваша адреса е-поште неће бити објављена. Неопходна поља су означена *