ChatGPT oskarżony o szkolenie na pirackich treściach - Sądowa sprawa przeciwko OpenAI - ChatGPT PL

Oskarżenie o naruszenie praw autorskich przez OpenAI

Amerykański laureat nagrody Pulitzera, znany pisarz Michael Chabon oraz grupa innych autorów, wnoszą pozew zbiorowy przeciwko OpenAI, oskarżając tę organizację o naruszenie praw autorskich w związku z wykorzystaniem ich dzieł do treningu modeli sztucznej inteligencji, takich jak ChatGPT.

Szeroko zakrojona działalność OpenAI w internecie

W złożonym pozwie zarzuca się OpenAI, że prowadziło rozległe operacje w przestrzeni internetowej w celu pozyskania ogromnego zbioru treści, które miały posłużyć do doskonalenia modeli GPT. Organizację oskarża się o rzekome nielegalne przechwytywanie, ściąganie i kopiowanie prac literackich, dzieł sztuki oraz gier, które podlegają prawom autorskim. Jednym z najbardziej kontrowersyjnych aspektów pozwu jest twierdzenie, że działalność związana z sztuczną inteligencją opiera się na dwóch zbiorach książek dostępnych w internecie, przez OpenAI określanych jako „Books 1” i „Books 2”.

Wykorzystanie Projektu Gutenberg i „shadow library”

W pozwie oskarża się OpenAI o wykorzystywanie zasobów Projektu Gutenberg oraz pirackich bibliotek „shadow library”, takich jak Library Genesis („LibGen”), Z-Library, Sci-Hub i Bibliotik do treningu modelu ChatGPT. Twierdzi się, że system ten został zasilony treściami bez zgody ich autorów.

Ujawnienie źródeł danych przez OpenAI

Oskarżenie opiera się na fakcie, że w lipcu 2020 roku OpenAI ogłosiło, że 16 procent zbioru danych użytych do szkolenia GPT-3 pochodzi z źródeł „Books 1” i „Books 2”, obok innych zbiorów danych, takich jak „Common Crawl” i „WebText”. Autorzy pozwu utrzymują, że tylko niewielka liczba miejsc w internecie zawiera tak obszerną kolekcję materiałów, i zarzucają OpenAI, że „OpenAI Books 1” bazuje na zasobach Projektu Gutenberg, a „OpenAI Books 2” czerpie z innych źródeł, takich jak kontrowersyjne strony internetowe typu „shadow library”, w tym Library Genesis („LibGen”), Z-Library, Sci-Hub i Bibliotik, gdzie dostępne są ogromne zbiory pirackich książek, prac naukowych i innych tekstów. Materiały te były również masowo rozpowszechniane za pomocą sieci torrent.

Odpowiedź modelu ChatGPT na żądanie

Adwokaci autorów twierdzą także, że po poproszeniu ChatGPT o napisanie akapitu w stylu książki „Niesamowite przygody Kavaliera i Claya”, za którą Michael Chabon zdobył nagrodę Pulitzera, model wygenerował fragment tekstu naśladujący styl pisania pisarza i zawierający odniesienia do postaci zmagających się z „ciężarem świata w stanie wojny”.

Wielokrotne procesy sądowe dotyczące praw autorskich

OpenAI znajduje się obecnie w obliczu wielu procesów sądowych związanych z zarzutami naruszenia praw autorskich, w tym dwoma w San Francisco wytoczonymi przez autorów Paula Tremblaya i Monę Awad, a także oddzielnie komika Sarę Silverman oraz pisarzy Christophera Goldena i Richarda Kadreya.

ChatGPT oskarżony o szkolenie na pirackich treściach – Sądowa sprawa przeciwko OpenAI