Ja jums ir nepatīkams teksta fails, kuru mēģināt apstrādāt, dažreiz sadaļas var sadalīt laiku, jo īpaši, ja mēs gatavojamies importēt failu izklājlapā. Vai arī jūs vēlaties vienkārši iegūt noteiktu rindu kopu no faila.
Ievadiet split, wc, astes, kaķa un grep. (neaizmirstiet sed un awk). Linux satur bagātīgu komunālo pakalpojumu komplektu, kas paredzēts komandrindas darbam ar teksta failiem. Mūsu uzdevumam šodien mēs izmantosim split un wc.
Vispirms apskatīsim mūsu žurnāla failu ....
> ls -l
-rw-r-r- 1 thegeek ggroup 42046520 2006-09-19 11:42 access.log
Mēs redzam, ka faila lielums ir 42 MB. Tas ir kaut kas liels ... bet cik daudz līniju mēs esam nodarbojušies? Ja mēs vēlētos to importēt programmā Excel, mums vajadzētu saglabāt to mazāk nekā 65 k līnijas.
Pārbaudīsim rindu skaitu failā, izmantojot wc utilītu, kas nozīmē "vārdu skaits".
> wc-l access.log
146330 access.log
Mēs esam pāri mūsu ierobežojumam. Mums būs jāsadala tas 3 segmentos. Lai to paveiktu, mēs izmantosim split utilītu.
> sadalīt-l 60000 access.log
> ls -lkopā 79124
-rw-rw-r-1 thegeek ggroup 40465200 2006-09-19 12:00 access.log
-rw-rw-r-1 thegeek ggroup 16598163 2006-09-19 12:05 xaa
-rw-rw-r-1 thegeek ggroup 16596545 2006-09-19 12:05 xab
-rw-rw-r- 1 thegeek ggroup 7270492 2006-09-19 12:05 xac
Tagad esam sadalījuši savus teksta failus 3 atsevišķos failos, no kuriem katrā ir mazāk nekā 60000 rindiņu, un tas šķita labs skaits, ko izvēlēties. Pēdējā failā ir atlikušā summa. Ja jūs gatavojaties samazināt šo konkrēto failu pusi, jūs to izdarītu:
> sadalīt-l 73165 access.log
Un tas viss ir tā.