Reddit tuži Anthropic zbog neovlašćenog korišćenja podataka za obuku AI modela
Tužba zbog korišćenja podataka za obuku AI modela
U jeku rastuće zabrinutosti oko korišćenja podataka sa interneta za treniranje veštačke inteligencije, Reddit je pokrenuo tužbu protiv kompanije Anthropic, navodeći da su njihovi podaci korišćeni bez dozvole i bez naknade, što predstavlja ozbiljno kršenje autorskih i ugovornih prava.
Šta je zapravo sporno?
Reddit, popularna platforma za diskusiju sa milijardama postova i komentara, tvrdi da je Anthropic koristio sadržaj sa Reddit-a za obuku svojih AI modela (verovatno Claude modela), a da pritom nije imao licencu, odobrenje ili ugovor.
Prema navodima iz tužbe, Anthropic je preuzeo ogromne količine korisničkog sadržaja sa Reddita, uključujući diskusije, odgovore i originalne objave korisnika – koje su zaštićene Redditovim pravilima korišćenja.
Zašto je ovo važno?
Reddit je nedavno objavio da monetizuje pristup svom API-ju, zahtevajući od velikih AI firmi da plaćaju za korišćenje sadržaja iz svoje baze. Dogovor sa Google-om (vredan oko 60 miliona dolara godišnje) već je sklopljen, dok se ovaj potez protiv Anthropic-a tumači kao odbrana tog modela poslovanja.
U tužbi se navodi da je Anthropic:
Prekršio autorska prava korisnika i platforme,
Zaobišao restrikcije iz Reddit API-ja,
Koristio podatke iz zajednica koje nisu javno dostupne u sirovom obliku.
Šira slika – podaci vs AI
Ovo nije prvi slučaj ove vrste. Ranije su The New York Times, Getty Images, pa čak i autori knjiga tužili razne AI kompanije zbog korišćenja zaštićenog materijala bez saglasnosti.
Redditova tužba može postaviti presedan u vezi sa korisnički generisanim sadržajem – da li su komentari i postovi javni, ili ipak pripadaju platformi i njenim korisnicima?
Izjave i odgovori
Anthropic se do trenutka pisanja ovog teksta nije zvanično oglasio, ali kompanija je u više navrata tvrdila da koristi podatke sa „javnog interneta“ u skladu sa zakonima. Reddit sa druge strane ističe da čak i javno dostupni podaci podležu ugovornim i tehničkim ograničenjima.
Šta dalje?
Ishod ovog procesa može značajno uticati na pravnu regulativu AI modela – posebno u pogledu treniranja velikih jezičkih modela (LLM). Ako Reddit pobedi, to bi moglo otvoriti vrata brojnim drugim platformama koje će tražiti nadoknadu za upotrebu svog sadržaja.
Takođe, AI kompanije bi mogle biti primorane da sklapaju komercijalne ugovore sa izvorima podataka, što bi drastično promenilo dinamiku razvoja veštačke inteligencije.
Zaključak
Ova tužba je još jedan znak da „besplatni podaci sa interneta“ više nisu jednostavna stvar. Granica između javnog sadržaja i vlasničkog materijala postaje sve važnija – i za AI i za korisnike interneta širom sveta.
Dodatno čitanje i izvori
Ukoliko želite da saznate više o ovoj temi, preporučujemo sledeće relevantne izvore i zvanične objave:
Reddit’s Official Content Policy – zvanična pravila o korišćenju sadržaja sa Reddita.
Anthropic – zvanični sajt – informacije o kompaniji i njenim AI modelima (Claude).
The Verge: Reddit sues AI company Anthropic – detaljan izveštaj o tužbi (unesi tačan datum kada bude poznat).
NYT vs OpenAI lawsuit summary – Ars Technica – paralelni slučaj koji osvetljava pravne aspekte treniranja AI modela.
Google i Reddit ugovor – TechCrunch – tekst o sporazumu vrednom 60 miliona dolara.
European AI Act – zvanični pregled – buduća regulativa EU o AI treniranju i transparentnosti.

