Casa blogging Che cos'è lo scraping dei contenuti? - definizione da techopedia

Che cos'è lo scraping dei contenuti? - definizione da techopedia

Sommario:

Anonim

Definizione - Cosa significa Scraping dei contenuti?

Lo scraping dei contenuti è un modo illegale di rubare contenuti originali da un sito Web legittimo e pubblicare i contenuti rubati su un altro sito senza la conoscenza o l'autorizzazione del proprietario del contenuto. Gli scraper di contenuti spesso tentano di trasferire i contenuti rubati come propri e non riescono a fornire l'attribuzione ai proprietari dei contenuti.


Lo scraping del contenuto può essere eseguito tramite copia e incolla manuale o può utilizzare tecniche più sofisticate, come l'utilizzo di software speciali, programmazione HTTP o parser HTML o DOM.


Gran parte del contenuto che cade in preda alla raschiatura è materiale protetto da copyright; ripubblicarlo senza l'autorizzazione del proprietario del copyright è un reato punibile. Tuttavia, i siti di scraper sono ospitati in tutto il mondo e gli scraper ai quali viene chiesto di rimuovere i contenuti protetti da copyright possono semplicemente cambiare dominio o scomparire.

Techopedia spiega lo scraping dei contenuti

Gli scraper di contenuto sono in grado di indirizzare il traffico verso i loro siti Web, scartando contenuti di alta qualità e ricchi di parole chiave da altri siti. I blogger sono particolarmente sensibili a questo, probabilmente perché è improbabile che i singoli blogger lancino un attacco legale contro i raschiatori. Gli scraper sono incoraggiati a continuare questa pratica perché i motori di ricerca non hanno ancora trovato un modo efficace per filtrare contenuti unici dai contenuti scartati, consentendo agli scraper di continuare a trarne vantaggio.


Gli amministratori di siti Web possono proteggersi dallo scrap tramite semplici misure, come l'aggiunta di collegamenti al proprio sito all'interno del contenuto. Ciò consentirà almeno loro di ottenere un po 'di traffico dal contenuto scartato. I metodi più sofisticati per gestire la raschiatura da parte dei robot includono:

  • Applicazioni commerciali anti-bot
  • Catturare i robot con un honeypot e bloccare i loro indirizzi IP
  • Blocco dei bot con codice JavaScript
Che cos'è lo scraping dei contenuti? - definizione da techopedia