In 2013, Aaron Swartz took his own life, unable to bear the situation, after he downloaded just 70 GB of academic articles from JSTOR, facing $1 million in fines and 35 years in prison.
In 2025 a company worth $4.5T downloaded over 500 TB of copyrighted books from Anna’s Archive, LibGen, Sci-Hub, and Z-Library, to train their AI models without paying for them, defending it’s actions as fair use, noting that books are nothing more than statistical correlations to its AI models.
devopscats
Daran habe ich auch öfter gedacht, als Anna’s Archive immer wieder als Datenquelle fürs Training von KI-Modellen genannt wurde. Aber wir wissen ja: Was Menschen leisten ist „wertlos“, bestenfalls ein „mineable asset“, wenn es ums Training einer die Welt verändernden Technologie geht.