Amerykańscy twórcy zareagowali na bezprawne wykorzystanie ich twórczości do trenowania sztucznej inteligencji działającej na NeMo — platformie należącej do potentata na rynku AI.
Wszystko wskazuje na to, że amerykański wymiar sprawiedliwości czeka kolejny, przyspieszony kurs technologiczny. Trzeba przyznać otwarcie, że jesteśmy świadkami rewolucyjnych zmian, które mają ogromny wpływ na podejście do kwestii praw autorskich i granic przyzwoitości w zakresie „inspiracji” cudzymi utworami.
Na wokandę kalifornijskiego sądu trafi niebawem sprawa (pozew został już złożony) trzech autorów, którzy czują się poszkodowani działaniami firmy NVIDIA i utrzymują, że treść stworzonych przez nich dzieł została bezprawnie wykorzystana do trenowania modelu AI.
Nazemian et al. v Nvidia Corp, czyli autorzy książek kontra NeMo
Nvidia jest firmą kojarzoną głównie z produkcją wysokiej klasy hardware’u stanowiącego obecnie fundament rozwoju generatywnej sztucznej inteligencji, ale warto pamiętać, że kalifornijska korporacja oferuje również chmurową platformę NeMo, służącą do tworzenia, dostosowywania i wdrażania generatywnych modeli sztucznej inteligencji w dowolnym miejscu. Zawiera ona narzędzia szkoleniowe i wnioskujące, zestawy rozwiązań zabezpieczających, mechanizmy zarządzania danymi i wstępnie wytrenowane modele. Oferuje przedsiębiorstwom łatwy, opłacalny i szybki sposób na wdrożenie generatywnej sztucznej inteligencji w swoim biznesie.
Brian Keene, Abdi Nazemian i Stewart O’Nan twierdzą, że ich prace były częścią zbioru danych zawierającego około 196 640 książek, które pomogły wyszkolić NeMo, by ten potrafił generować treści do złudzenia przypominające teksty napisane przez człowieka. Złożony pozew zbiorowy odnosi się do zestawu danych Books3, w ramach którego, według trójki powieściopisarzy bezprawnie skopiowano niemal 200 tysięcy książek. Sprawa nie jest jednak taka prosta, jak mogłoby się wydawać. Zbiór danych Books3 nie jest już obecnie dostępny w internecie i jak twierdzą twórcy, jego zniknięcie z sieci – w październiku ubiegłego roku – pokrywa się ze zgłoszeniami dotyczącymi naruszeń praw autorskich.
Warto w tym momencie zaznaczyć, że Books3 miał być początkowo udostępniony przez społeczność AI Hugging Face, ale zanim ostatecznie zniknął, miała do niego dotrzeć Nvidia i wykonać wiele kopii tego zbioru by – jak pisałem wyżej – użyć pozyskany materiału do nauki modeli AI na platformie NeMo. Autorzy pozywający Nvidię argumentują, że korporacja wciąż korzysta z nielegalnego źródła danych oraz je powiela i ten proces należy natychmiast zatrzymać. Samo usunięcie zbioru akurat we wskazanym czasie ma dodatkowo potwierdzać, że firma była świadoma naruszenia.
Czy Nvidia wypłaci odszkodowania?
Z kolei rzecznik Hugging Face powiedział dziennikarzom Ars Technica, że „Hugging Face nigdy nie usunął tego zestawu danych i nie hostował zestawu danych Books3 na Hubie”. Zamiast tego, Hugging Face miało udostępniać jedynie skrypt, który pobierał dane z The Eye, czyli miejsca, w którym ELeuther (inna organizacja zajmująca się AI) przechowywała dane. Ostatecznie to Eleuther miał usunąć pliki z The Eye z powodu obaw o łamanie praw autorskich. To spowodowało, że skrypt udostępniony przez Hugging Face przestał działać.
W sprawie wypowiedział się także rzecznik Nvidii, który na łamach The Wall Street Journal przekazał:
Szanujemy prawa wszystkich twórców treści i wierzymy, że stworzyliśmy NeMo w pełnej zgodności z prawem autorskim.
rzecznik Nvidia
Brian Keene, Abdi Nazemian i Stewart O’Nan chcą, by Nvidia wypłaciła odszkodowania osobom, których dzieła chronione prawem autorskim pomogły w szkoleniu dużych modeli językowych (LLM), a także by zniszczono wszystkie kopie zbioru danych Books3. Czy uda im się to osiągnąć? Przekonamy się w najbliższych miesiącach.
Źródło: Ars Technica, Reuters