Rozbieżność między plikiem robots.txt a TOS

Dec 02 2020

To pytanie sprawiło, że pomyślałem o sytuacji:

Alicja prosi Boba o przeszukanie witryny internetowej realestate.example.com i zwrócenie wyników wyrażenia regularnego "Price:([0-9]*).*Size:([0-9]*)"
Bob wskazuje głównego robota indeksującego open source, który implementuje implementację odczytu googles robots.txt (a zatem jest w pełni zgodny ze standardowymi praktykami branżowymi) pod adresem realestate.example.com, grepsuje wynik i wysyła dane do Alicji. Nigdy nie odwiedzał strony ręcznie, spędził około 2 minut czasu ludzkiego nad całą pracą i nie musiał tego robić.
realestate.example.com zawiera plik robots.txt z napisem „Weź wszystko” oraz sitemap.xml opisujące strony, które Cię interesują, ponieważ zależy im na SEO . Ma czytelny dla człowieka TOS, który mówi: „Skrobanie jest niedozwolone”.

Czy Bob zrobił coś złego?

Odpowiedzi

2 DavidSiegel Dec 02 2020 at 23:13

Prawdopodobnie nie

Nie było wielu przypadków w tej dziedzinie prawa, a te dotyczyły głównie „głębokich linków”, w szczególności przypadków, w których osoba świadomie łączyła się ze stroną z pominięciem loginu lub strony wprowadzającej, a witryna została zaprojektowana tak, że zwykle odwiedzający mógł dostać się na inne strony tylko przechodząc przez taką stronę logowania lub stronę wprowadzającą. W przypadkach, w których pozbawia to właściciela witryny dochodów lub szkodzi reputacji witryny, omijając zastrzeżenia, zostało to uznane za podlegające zaskarżeniu. Zobacz stronę Nolo na temat łączenia, ramkowania i wstawiania oraz artykuł Wikipedii na temat głębokiego linkowania

In Intellectual Reserve, Inc. przeciwko Utah Lighthouse Ministry , Inc., 75 F. Supp. 2d 1290 (D. Utah 1999) głębokie linkowanie zostało uznane za współnaruszenie praw autorskich. Zobacz artykuł Wikipedii na temat sprawy W tym przypadku zawartość, do której prowadzi łącze, została opublikowana bez upoważnienia właściciela praw autorskich, a obrona nie zgłosiła kwestii dozwolonego użytku.

Ogólnie rzecz biorąc, sądy orzekły, że publikacja strony internetowej zachęca innych do odwiedzenia jej i umieszczenia na niej linków. W artykule Wikipedii o „Głębokich linkach” (link powyżej) jest powiedziane, że:

W orzeczeniu z lutego 2006 r. Duński Sąd Morski i Handlowy (Kopenhaga) stwierdził, że systematyczne przeszukiwanie, indeksowanie i głębokie linkowanie przez portal ofir.dk witryny nieruchomości Home.dk nie jest sprzeczne z duńskim prawem lub dyrektywą Unii Europejskiej dotyczącą baz danych . Trybunał stwierdził, że wyszukiwarki są pożądane dla funkcjonowania Internetu i że publikując informacje w Internecie należy założyć - i zaakceptować - że wyszukiwarki umieszczają głębokie linki do poszczególnych stron swojej witryny.

W sprawie Perfect 10, Inc. przeciwko Amazon.com, Inc. 508 F.3d 1146 (9 Cir. 2007) sąd USA orzekł, że odsyłacze do obrazów chronionych prawem autorskim w ramach wyszukiwania obrazów nie stanowią naruszenia praw autorskich. Dziewiąty Okręgowy Sąd Apelacyjny uznał, że wyświetlanie i zapisywanie w pamięci podręcznej miniatur przez Google było zgodne z zasadą dozwolonego użytku, głównie ze względu na to, że są one „wysoce przekształcające”.

W Craigslist vs 3Taps (zobacz artykuł w Jaxenter ) Cragslist sprzeciwił się wielokrotnemu skrobaniu przez PadMapper, wysłał nakaz zaprzestania i zaniechania do PadMapper i zablokował jego adresy IP. PadMapper korzystał z usług 3Taps, aby ominąć ten blok za pomocą proxy. Craigslist pozwał i wygrał. Sąd uznał, że zgodnie z amerykańską ustawą o oszustwach komputerowych i nadużyciach (CFAA), nakaz zaprzestania działalności i blokada adresu IP były wystarczającymi powiadomieniami o odmowie dostępu, a dalszy dostęp był nieuprawniony i stanowił naruszenie ustawy. Indywidualne zawiadomienie uznano za niezbędne dla tego gospodarstwa.

Sprawa Ryanair przeciwko PR Aviation została wniesiona do Europejskiego Trybunału Sprawiedliwości. Tam Ryanair argumentował, że dalsze skrobanie stanowiło naruszenie jego TOS i naruszenie praw autorskich. Sąd uznał, że właściciele publicznie dostępnych baz danych byli uprawnieni do nakładania ograniczeń dostępu. Ponadto stwierdził, że zastosowanie TOS należy do rozstrzygnięcia przez sądy krajowe.

Zobacz także ten artykuł „Podstawowe kwestie prawne związane z przeszukiwaniem sieci” . Podkreśla się w nim, że większość skrobania jest legalna, z wyjątkiem przypadków naruszenia praw autorskich lub określonych ograniczeń dostępu na mocy amerykańskiej umowy CFAA (lub podobnych przepisów).

Poszczególne fakty, takie jak ceny i rozmiary mieszkań, nie podlegają ochronie praw autorskich, chociaż wybór i organizacja takich faktów może podlegać ochronie, a baza danych zawierająca takie fakty może podlegać ochronie. Strony publikowane w sieci są publicznie dostępne, chyba że zostaną podjęte szczególne kroki w celu uczynienia ich prywatnymi, takie jak ochrona hasłem, wymóg logowania lub indywidualne powiadomienie o zablokowaniu dostępu. Plik ROBOTS.TXT, chociaż nie jest technicznie egzekwowany, jest powszechnie akceptowanym standardem, a odwiedzający prawdopodobnie ma prawo zakładać, że dostęp zgodnie z lokalnym plikiem robotów jest autoryzowany, w przypadku braku specjalnego powiadomienia od właściciela strony o czymś przeciwnym . Powtarzający się dostęp, który negatywnie wpływa na przepustowość lub wydajność witryny, może być inną sprawą.