If-Koubou

Izveidojiet lejupielādējamo plānotāju ar mazu programmēšanas prasmi

Izveidojiet lejupielādējamo plānotāju ar mazu programmēšanas prasmi (Kā)

Mums visiem patīk lejupielādēt materiālus no interneta, un ir liels lejupielādes pārvaldnieku rīku krājums, ko mēs varam izmantot, lai ieplānotu mūsu lejupielādes. Iespējams, ka būs vieglāk izmantot lejupielādes pārvaldnieku, taču nav ļauna izpētīt instrumentus, kas jau nāk ar mūsu Ubuntu, un pilnībā izmantot to.

Šajā rakstā mēs parādīsim Ubuntu iebūvētu programmatūru, ko mēs varam izmantot, lai lejupielādētu saturu no interneta, izmantojot wget. Papildus tam mēs parādīsim, kā plānot lejupielādi, izmantojot Cron.

Lejupielādēt, izmantojot Wget

Wget ir bezmaksas programmatūras pakotne failu ielādei, izmantojot HTTP, HTTPS un FTP, visplašāk izmantotos interneta protokolus. Tas ir neinteraktīvs komandrindas rīks, tāpēc to var viegli izsaukt no skriptiem, cron darbiem, termināļiem bez X-Windows atbalsta utt.

Atveriet savu termināli un ļaujiet mums izpētīt, kā mēs varam izmantot wget, lai no satura ielādētu stuff. Lejupielādēšanas pamata e-pasts ar wget ir šāds:

Wget [opcija] ... [URL] ...

Šī komanda lejupielādēs wget rokasgrāmatu vietējā diskā

wget http://www.gnu.org/software/wget/manual/wget.pdf

Linux Cron

Ubuntu nāk ar cron daemonu, ko izmanto uzdevumu plānošanai noteiktā laikā. Crontab ļauj jums norādīt darbības un laiku, kad tie būtu jāizpilda. Tas, kā jūs parasti uzdevumu plānojat, izmantojot komandrindas rīku.

Atveriet termināla logu un ievadiet crontab -e.

Katra no crontab sadaļām ir atdalīta ar atstarpi, un pēdējā sadaļā ir viena vai vairākas atstarpes tajā. Cron ieraksts sastāv no minūtes (0-59), stundas (0-23, 0 = pusnakts), diena (1-31), mēnesis (1-12), darba dienas (0-6, 0 = svētdiena), komanda. Trešais ieraksts iepriekš crontab lejupielādē wget.pdf plkst. 2:00. Pirmais ieraksts (0) un otrais ieraksts (2) nozīmē 2:00. Trešā līdz piektajā ierakstā (*) apzīmē jebkuru dienu, mēnesi vai nedēļu. Pēdējais ieraksts ir wget komanda, lai lejupielādētu wget.pdf no norādītā URL.

Tas ir pamats wget un kā darbojas Cron. Uzņemsim laupījumu par īstu dzīves piemēru, kā plānot lejupielādi.

Plānošana lejupielāde

Mēs gatavojamies lejupielādēt Firefox 3.6 2:00. Tā kā mūsu ISP tikai sniedz ierobežotu datu apjomu, mums jāpārtrauc lejupielāde plkst. 8:00. Tas ir iestatījums.

Ignorēt pirmos 2 ierakstus iepriekš crontab. Trešā un ceturtā komanda ir tikai 2 nepieciešamās komandas. Trešā komanda iestatīs uzdevumu, kas lejupielādēs Firefox 2:00:

[kods]
0 2 * * * wget-c http://download.mozilla.org/?product=firefox-3.6.6&os=win&lang=en-GB
[/ code]

-C opcijas norāda, ka wget ir jāatjauno esošā lejupielāde, ja tā nav pabeigta.

Ceturtā komanda pārtrauks Wget plkst. 8:00. "Killall" ir unix komanda, kas nogalina procesus pēc nosaukuma.

[kods]
0 8 * * * killall wget
[/ code]

Killall wget pasaka Ubuntu, lai apturētu wget no faila lejupielādes 8:00.

Citas noderīgas wget komandas

1. Noteikt direktoriju, lai lejupielādētu failu

[kods]
wget-iziet-document = / home / zainul / Downloads / wget manual.pdf http://www.gnu.org/software/wget/manual/wget.pdf
[/ code]

opcija -izlaides dokuments ļauj norādīt faila direktoriju un lejupielādējamā faila nosaukumu

2. Vietnes lejupielāde

wget ir arī iespēja lejupielādēt vietni.

[kods]
wget-m http://www.google.com/profiles/zainul.franciscus
[/ code]

Iepriekš minētā komanda lejupielādēs visu manu Google profila tīmekļa lapu. Opcija "-m" norāda, ka wget lejupielādē norādīto URL spoguļattēlu.

Vēl viena svarīga iespēja ir pateikt wget, cik daudz saišu tas jāseko, lejupielādējot vietni.

[kods]
wget -r -l1 http://www.google.com/profiles/zainul.franciscus
[/ code]

Iepriekš minētā wget komanda izmanto divas iespējas. Pirmā opcija '-r' norāda, ka wget lejupielādē norādīto vietni rekursīvi. Otrā opcija "-l1" norāda, ka wget iegūst tikai pirmo saišu līmeni no minētās norādītās vietnes. Mēs varam iestatīt līdz trim līmeņiem "-l2" un "-l3".

3. Ignorējot robotu ierakstu

Web meistars uztur teksta failu ar nosaukumu Robot.txt. 'Robot.txt' saglabā URL sarakstu, kuru nevar pārmeklēt tādai tīmekļa pārmeklēšanai kā wget. Mēs varam pateikt, ka wget ignorē 'Robot.txt' ar opciju '-erobots = off'. Tālāk norādītā komanda saka, ka wget lejupielādē manu Google profila pirmo lapu un ignorē "Robot.txt".

[kods]
wget -erobots = izslēgts http://www.google.com/profiles/zainul.franciscus
[/ code]

Vēl viena noderīga iespēja ir -U. Šī opcija maskē wget kā pārlūku. Ņem vērā, ka, aizklājot pieteikumu kā citu lietojumprogrammu, var tikt pārkāpts tīmekļa pakalpojumu sniedzēja termins un pakalpojums.

[kods]
wget -erobots = off-U Mozilla http://www.google.com/profiles/zainul.franciscus
[/ code]

Secinājums

Wget ir ļoti vecs skola, kas joprojām ir hackable GNU programmatūras pakotne, kuru mēs varam izmantot, lai lejupielādētu failus. Wget ir interaktīvs komandrindas rīks, kas nozīmē, ka mēs varam palaist to savā datorā fonā, neuzstādot nevienu pieteikumu. Apskatiet wget man lapu

[kods]
$ man wget
[/ code]

lai saprastu citas iespējas, kuras mēs varam izmantot ar wget.

Saites

Wget rokasgrāmata
Kā apvienot divus lejupielādētos failus, kad wget fails pusceļā caur
Linux QuickTip: lejupielāde un vienlaicīga atkārtošana