Still working to recover. Please don't edit quite yet.

Difference between revisions of "User:A★G/risorse esterne"

From Anarchopedia
Jump to: navigation, search
m
m (breve spiegazione)
Line 1: Line 1:
 
Si é posto il problema della disponibilitá delle risorse esterne ad Anarchopedia.  Alcuni siti possono scomparire, o diventare indisponibili e con essi le risorse collegate da qui.  Quindi ho messo a punto una linea di comando che scarica le pagine da anarchopedia e tutte le risorse esterne collegate (di solito immagini, testi HTML).  I link rotti vengono annotati nel file <code>broken.log</code>
 
Si é posto il problema della disponibilitá delle risorse esterne ad Anarchopedia.  Alcuni siti possono scomparire, o diventare indisponibili e con essi le risorse collegate da qui.  Quindi ho messo a punto una linea di comando che scarica le pagine da anarchopedia e tutte le risorse esterne collegate (di solito immagini, testi HTML).  I link rotti vengono annotati nel file <code>broken.log</code>
  
<code>webxurl --redir 2 --brokenlog broken.log --dig 0 "." "-e wikimedia.org -e youtube.com -e ita.anarchopedia.org/" --dig 5 "ita.anarchopedia.org" "\\?" --redir 1 --links http://ita.anarchopedia.org/</code>
+
<code>webxurl --timeout 60 --redir 2 --brokenlog broken.log --dig 0 "." "-e wikimedia.org -e youtube.com -e ita.anarchopedia.org/" --dig 5 "ita.anarchopedia.org" "\\?" --redir 1 --links http://ita.anarchopedia.org/</code>
  
 
Per far funzionare lo script occorre un sistema [[GNU/Linux]] o Unix ordinario con i seguenti programmi installati:
 
Per far funzionare lo script occorre un sistema [[GNU/Linux]] o Unix ordinario con i seguenti programmi installati:
Line 11: Line 11:
  
 
Ho appena sistemato un problema nello script <code>webxurl</code> (mancava una funzione <code>urltopathname</code>). --[[Utente:A★G|A★G]] 19:16, 12 mag 2010 (UTC)
 
Ho appena sistemato un problema nello script <code>webxurl</code> (mancava una funzione <code>urltopathname</code>). --[[Utente:A★G|A★G]] 19:16, 12 mag 2010 (UTC)
 +
 +
Breve spiegazione di alcune componenti della linea di comando:
 +
 +
* <code>--timeout 60</code>:  imposta un limite massimo di 60 secondi per le connessioni e il trasferimento dati.
 +
* <code>--redir 2</code>: imposta un massimo di 2 redirezioni da seguire per ogni link.
 +
* <code>--dig 0 "." "-e wikimedia.org -e youtube.com -e ita.anarchopedia.org/"</code>: salva i link, escludendo wikimedia.org, youtube.com e ita.anarchopedia.org.
 +
* <code>--dig 5 "ita.anarchopedia.org" "\\?"</code>: salva i link di ita.anarchopedia.org, fino a 5 livelli di profonditá.

Revision as of 19:37, 12 May 2010

Si é posto il problema della disponibilitá delle risorse esterne ad Anarchopedia. Alcuni siti possono scomparire, o diventare indisponibili e con essi le risorse collegate da qui. Quindi ho messo a punto una linea di comando che scarica le pagine da anarchopedia e tutte le risorse esterne collegate (di solito immagini, testi HTML). I link rotti vengono annotati nel file broken.log

webxurl --timeout 60 --redir 2 --brokenlog broken.log --dig 0 "." "-e wikimedia.org -e youtube.com -e ita.anarchopedia.org/" --dig 5 "ita.anarchopedia.org" "\\?" --redir 1 --links http://ita.anarchopedia.org/

Per far funzionare lo script occorre un sistema GNU/Linux o Unix ordinario con i seguenti programmi installati:

Per scaricare i video da youtube occorre invece una versione modificata dello script, probabilmente utilizzando youtube-dl. --A★G 05:53, 12 mag 2010 (UTC)

Ho appena sistemato un problema nello script webxurl (mancava una funzione urltopathname). --A★G 19:16, 12 mag 2010 (UTC)

Breve spiegazione di alcune componenti della linea di comando:

  • --timeout 60: imposta un limite massimo di 60 secondi per le connessioni e il trasferimento dati.
  • --redir 2: imposta un massimo di 2 redirezioni da seguire per ogni link.
  • --dig 0 "." "-e wikimedia.org -e youtube.com -e ita.anarchopedia.org/": salva i link, escludendo wikimedia.org, youtube.com e ita.anarchopedia.org.
  • --dig 5 "ita.anarchopedia.org" "\\?": salva i link di ita.anarchopedia.org, fino a 5 livelli di profonditá.