1 of 29

Įvairaus tipo duomenų glaudinimas

2 of 29

Šiandien pamokoje:

  • Susipažinsime su glaudinimo sąvoka.
  • Aptarsime glaudinimo programas.
  • Aptarsime duomenų glaudinimą, kai prarandame dalį duomenų detalumo (taikoma grafikos, vaizdo ir garso duomenyse).
  • Diskutuosime apie didelių duomenų kiekių perdavimą.
  • Mokysimės glaudinti skaitinius, tekstinius, grafinius, vaizdinius, garsinius duomenis, naudojat įvairius glaudinimo būdus. 

3 of 29

Įvadas

  • Kompiuterio atminties talpa didėja kasdien – per paskutinius 25-ius metus standartinių kompiuterių ji padidėjo net milijoną kartų, bet matyt tai dar ne pabaiga.
  • Kompiuteriuose gali būti laikomos knygos ar net ištisa biblioteka, muzikos įrašai ir filmai, jei tik yra laisvos vietos.
  • Didelės apimties dokumentai internete yra labai didelė problema, nes ilgai užtrunka juos atsisiųsti.
  • Dabar stengiamasi sumažinti kompiuterius – net telefonai ir rankiniai laikrodžiai gali laikyti labai daug informacijos.
  • Vienas šios problemos sprendimų štai toks: užuot pirkę kompiuterius, turinčius daugiau atminties, ar įsigiję spartesnį interneto ryšį, galime duomenis taip suspausti, kad jie užimtų mažiau vietos.
  • Šis duomenų kodavimo ir iškodavimo procesas dažniausiai atliekamas kompiuteriu automatiškai. Mes to proceso beveik nepastebime.
  • Nors iš tiesų kompiuteris atlieka daugiau veiksmų, mes matome tik tai, kad diske telpa daugiau informacijos ar sparčiau atsiunčiamas tinklalapis.

4 of 29

Duomenų glaudinimas

  • Duomenų glaudinimas yra procesas, kurio metu duomenų apimtis sumažinama, kad jie užimtų mažiau vietos atmintyje arba būtų greičiau perduodami.
  • Glaudinimas – bylos duomenų apimties sumažinimas - kitaip dar vadinamas archyvavimu arba pakavimu.
  • Glaudinimas galimas dėl to, kad duomenų apimtis dažnai yra didesnė nei jų teikiama informacija.

5 of 29

Yra du pagrindiniai duomenų glaudinimo tipai:

Nuostolingas glaudinimas

Nuostolingas glaudinimas sumažina duomenų dydį pašalindamas dalį informacijos, kuri nėra būtina.

Šis metodas dažniausiai naudojamas multimedijos failams, tokiems kaip vaizdai, vaizdo įrašai ir garsas.

Pavyzdžiui:

  • JPEG: Vaizdų glaudinimo formatas, kuris pašalina mažiau pastebimas detales, kad sumažintų failo dydį.
  • MP3: Garso glaudinimo formatas, kuris pašalina garsus, kurių žmogaus ausis negirdi, kad sumažintų failo dyd

Be nuostolių glaudinimas

Be nuostolių glaudinimas sumažina duomenų dydį neprarandant jokios informacijos.

Šis metodas dažniausiai naudojamas tekstiniams ir kitokiems duomenims, kuriems svarbu išlaikyti visą informaciją.

Pavyzdžiui:

  • ZIP: Archyvavimo formatas, kuris suspaudžia failus neprarandant jokios informacijos.
  • PNG: Vaizdų formatas, kuris suspaudžia vaizdus be kokybės praradimo

6 of 29

Glaudinimo programos

Yra daug programų, kurios naudojamos duomenų glaudinimui:

  • WinRAR: Populiari programa, kuri palaiko įvairius glaudinimo formatus, tokius kaip RAR ir ZIP.

  • 7-Zip: Atviro kodo programa, kuri palaiko daugybę glaudinimo formatų ir yra žinoma dėl savo efektyvumo

7 of 29

Duomenų glaudinimas

  •  Glaudinimo programos įvairiapusiškai analizuoja duomenis, atranda pasikartojančių kodų grupes, jų pasikartojimo dėsningumus ir jais pasinaudodamos duomenis suglaudžia.
  • Duomenų pertvarkymas taip, kad jie užimtų mažiau vietos atmintyje ir jiems persiųsti reikėtų siauresnės dažnių juostos arba persiuntimas būtų spartesnis.
  • Kai juos reikia panaudoti, ta pati programa juos išpakuoja – pakeičia ankstesniu pavidalu.
  •  Glaudinami pakuojami, archyvuojami ir elektroniniu paštu persiunčiami duomenys.

8 of 29

Duomenų glaudinimas

  • Parenkant metodus ir juos realizuojančias programas, reikia rasti optimalų laiko ir sutaupytos atminties santykį.
  • Ne visi duomenys vienodai gerai susispaudžia.
    • labai gerai susispaudžia .txt, .doc, .bmp tipo bylos.
    • nepavyks suspausti .mp3, .jpg tipo bylų (šis formatas yra jau glaudintų duomenų formatas).
  • Tačiau jas vis vien tikslinga archyvuoti.

9 of 29

Archyvų tipai

  • Glaudinimo programų darbo rezultatas – byla ar jų rinkinys, vadinamas archyvu.
  • Archyvai paprastai turi plėtinį, atitinkantį programą, kuria jie buvo sukurti – .zip, .rar .arj, .ice ir t. t.
  • Todėl glaudinimo programos dažniausiai vadinamos archyvavimo programomis arba tiesiog archyvatoriais.
  • Archyve saugoma ir papildoma informacija: bylų vardai, modifikavimo datos, kontrolinės sumos (pvz., bendras vienetukų skaičius bylos duomenyse).
  • Tai padeda patikrinti, ar bylos iš archyvo atkurtos teisingai.

10 of 29

Glaudinimo privalumai

  • Vietos taupymas: Sumažina failų dydį, todėl jie užima mažiau vietos atmintyje.
  • Perdavimo greitis: Sumažina duomenų kiekį, todėl jie gali būti greičiau perduodami internetu.
  • Apsauga: Glaudinimo programos dažnai leidžia apsaugoti archyvus slaptažodžiu, taip užtikrinant duomenų saugumą

Glaudinimo trūkumai

  • Kokybės praradimas: Naudojant nuostolingą glaudinimą, gali būti prarasta dalis informacijos, kas gali paveikti failo kokybę.
  • Laikas: Glaudinimo ir išglaudinimo procesai gali užtrukti, ypač jei failai yra dideli

11 of 29

Pavyzdys, kaip gali būti glaudinamas tekstas

Pasikartojantys žodžiai, žodžių dalys arba frazės, pakeičiami kvadratėliais.

12 of 29

Pakartokime Kaip atrodytų nesuglaudintas eilėraštis?

13 of 29

Kaip išspręstumėte šį galvosūkį?

  • Kartais trūkstamos teksto dalys rodo pačios į save.
  • Šiuo atveju žodis gali būti iškoduotas teisingai, jeigu kopijuojame raides iš kairės į dešinę.
  • Tada kiekviena raidė gali būti kopijuojama prieš tai, kai įrašoma.
  • Toks kopijavimo būdas labai naudingas kompiuteriams, kai yra daug pasikartojimų.

Bananas

14 of 29

Kaip kompiuteryje vaizduojamas glaudinimas

15 of 29

Pakartokime: pabandykite suglaudinti šias eilutes

16 of 29

Duomenų glaudinimo metodai

  • Sugalvota daug duomenų suspaudimo metodų. Atliekant šią veiklą, buvo naudojamasi metodu, kai nuorodomis rodoma į prieš tai buvusius pasikartojančius simbolius tekste.
  •  Šis metodas vadinamas tiesiog „zip“, jį 1970 m. sugalvojo Izraelio mokslininkai / Phil Katz /. Metodas tinka bet kuriai kalbai, juo lengvai suspaudžiami ir perpus sumažinami duomenys.
  • Zip yra glaudinimo be praradimų formatas: po išskleidimo duomenys yra tokie patys, kokie buvo prieš glaudinimą. Jis veikia rasdamas perteklinius pradinius duomenis ir efektyviau juos atvaizduodamas. (https://www.hanshq.net/zip.html )

17 of 29

Interaktyvi glaudinimo priemonė

https://studio.code.org/s/text-compression/lessons/1/levels/2 

Teksto pavyzdys:

Apvali, saldi gražuolė… 

Šmurkšt, po suolu jau nupuolė. 

„Kurgi bėgi? Grįžk į puodą…“ 

Bet, pakėlus savo kuodą, 

Bulvė lekia per laukus: 

„Nebegrįšiu pas vaikus.“

18 of 29

Praktinė užduotis

  • Išbandykite interaktyvią glaudinimo priemonę su savo tekstu
  • Paieškokite kokie yra dar duomenų glaudinimo metodai, kai neprarandami pradiniai duomenys?

19 of 29

Vaizdų kodavimas ir glaudinimas

  • Nuotraukos ir kiti vaizdai ekrane yra pateikiami kaip spalvotų taškų (pikselių) rinkinys.
  • Kompiuterių ekranai suskirstyti į tinklelį mažų kvadratėlių (pikselių, taškų). Kiekvienas iš pikselių gali būti skirtingos spalvos, o kadangi pikseliai maži, atskirų taškų ekrane nematome. Jie susilieja ir formuoja rodomą vaizdą. 

20 of 29

Vaizdų kodavimas

Paprasčiausią nespalvotą vaizdą galime užkoduoti dvejetaine sistema

21 of 29

Vaizdų glaudimas

  • Ar galima aukščiau užkoduotus vaizdus suglaudinti?
  • Atkreipkite dėmesį, kad pirmoje eilutėje šalia yra 3 juodi pikseliai, o antroje – 4 balti pikseliai. Taigi užuot užrašę kiekvieną bitą, galime skaičiais apibūdinti raštą.

22 of 29

Duomenų glaudinimas

23 of 29

Duomenų glaudinimas

24 of 29

Praktinė užduotis

Koks paveikslas suglaudintas?

25 of 29

Duomenų glaudinimas

Naudodamiesi interaktyvia piešinių kodavimo priemone https://csfieldguide.org.nz/en/interactives/run-length-encoding/

parenkite daugiau piešinių ir jų kodų rinkinių, iš kurių mokiniai pagal pateiktą kodą galėtų nupiešti piešinį arba pagal pateiktą piešinį parašyti jo kodą.

26 of 29

Glaudinimas prarandant duomenis

  • Glaudinimas su nuostoliais - tai skaitmeninių duomenų saugojimo ir perdavimo srityje naudojamas duomenų glaudinimo metodas, kuriuo sumažinamas failo dydis, pašalinant dalį duomenų. 
  • Skirtingai nuo glaudinimo be nuostolių, kai išskleidus išsaugomi visi pradiniai duomenys, glaudinant su nuostoliais aukojama dalis duomenų, kad būtų pasiektas didesnis glaudinimo koeficientas. 
  • Tai reiškia, kad išskleidžiant failą, kuriam buvo atliktas nuostolingasis glaudinimas, negaunama tiksli originalių duomenų kopija; vietoj to gaunama apytikslė kopija, kurios kokybė gali šiek tiek nukentėti.

27 of 29

JPEG formatas

  • Vaizdo glaudinimas: JPEG (angl. Joint Photographic Experts Group), sumažina vaizdų failų dydį, atsisakydami kai kurių mažiau pastebimų detalių ir spalvų, todėl gaunamas mažesnis failas, tačiau sumažėja vaizdo kokybė.
  • https://sipdtdevelopers.wordpress.com/2014/01/23/digital-image-compression/ 

28 of 29

Praktinė užduotis

  • Suglaudinkite savo darbų aplanką, esantį kompiuterio darbalaukyje.
  • Patikrinkite, kaip pasikeitė aplanko dydis?

29 of 29

Namų darbas: praktinė užduotis

  • Peržiūrėkite filmuotą medžiagą : http://tests.lt/glaudinimas/ - įsidėmėkite archyvų plėtinius.
  • Ar pasiruošę tikrai „kietai“ suglaudinti? Popieriaus lape Jums pateikta istorija buvo apdorota kompiuterio programa, kuri šioje istorijoje aptiko mažiausiai 1000 galimų išbraukti raidžių. Kiek galite rasti jūs? Prisiminkite, gali būti išbraukiamos tik grupės po dvi ar daugiau pasikartojančių raidžių. Sėkmės!