• Skurwiel Aegewsh@101010.pl
    link
    fedilink
    arrow-up
    1
    ·
    1 year ago

    @harcesz
    Nie mam pretensji do Ciebie, tylko informuję o klikbajtowym tytule artykułu. Spiracić coś, to znaczy udostępniać nieautoryowane treści i kopie, a zarzuty są o to, że w czasie uczenia SI boty wykorzystay treść z nielegalnych źródeł. “Gildia Autorów jest jednak przekonana, że zbiory danych używane do treningu modelu językowego ChatGPT mogły być pobierane także z nielegalnych źródeł.”
    Szczerze myślałem, że GPT coś odpalil w związku z książkami, jakieś przeredagowane treści (książka innymi słowami napisana) wypuścił, czy coś, a tu zwykly spór o źródło danych. W USA jest z tym wieki probem, bo na studiach zrobisz kopię książki na własny użytek i jesteś piratem.

    • harc@szmer.infoOPM
      link
      fedilink
      Polski
      arrow-up
      1
      ·
      1 year ago

      Spiracić coś, to znaczy udostępniać nieautoryowane treści i kopie

      Jak dla mnie raczej stworzyć nieautoryzowaną kopię. Niestety SJP PWN milczy w tej kwestii, więc jest to chyba kwestia uznaniowa. Żeby model AI mógł operować na danych z danej książki zapewne ma jej treść, więc przy definicji, która wydaje mi się bardziej naturalna miałoby to sens, zresztą sam się odnosisz do takiej formy “piractwa” odnośnie stanów, których tekst dotyczy.