it.phhsnews.com


it.phhsnews.com / Perché Zip in grado di comprimere singoli file migliori di più file con lo stesso contenuto?

Perché Zip in grado di comprimere singoli file migliori di più file con lo stesso contenuto?


Essere in grado di comprimere i nostri file in modo che sia più facile condividerli e / o trasportarli può rendere l'elettronica vive molto più facilmente, ma a volte possiamo vedere risultati di ridimensionamento strani o imprevisti dopo averli compressi. Perché? Il post di Q & A di SuperUser di oggi ha le risposte alle domande di un lettore confuso.

La sessione di domande e risposte di oggi ci viene fornita per gentile concessione di SuperUser, una suddivisione di Stack Exchange, un raggruppamento di siti Web di domande e risposte.

Foto per gentile concessione di Jean-Etienne Minh-Duy Poirrier (Flickr).

La domanda

Il lettore SuperUser sixtyfootersdude vuole sapere perché zip è in grado di comprimere singoli file meglio di più file con lo stesso tipo di contenuto:

Supponiamo che io avere 10.000 file XML e volere inviarli ad un amico. Prima di inviarli, vorrei comprimerli.

Metodo 1: Non comprimerli

Risultati:

Metodo 2: Zip ogni file separatamente e inviarlo 10.000 file XML zippati

Comando:

Risultati:

Metodo 3: creare un file zip singolo contenente tutti i 10.000 file XML

Comando:

Risultati:

Metodo 4: concatenare i file in un singolo file e comprimerlo

Comando:

Risultati:

Domande

  • Perché ottengo risultati così drammaticamente migliori quando sto comprimendo un singolo file?
  • Mi aspettavo di ottenere risultati drasticamente migliori usando il metodo 3 piuttosto che il metodo 2, ma io non. Perché è questo?
  • Questo comportamento è specifico per zip? Se provassi a usare Gzip, otterrei risultati diversi?

Informazioni aggiuntive

Meta dati

Una delle risposte fornite suggerisce che la differenza è il metadati di sistema che è memorizzato nel file zip. Non credo che questo possa essere il caso. Per testarlo, ho fatto quanto segue:

Il file zip risultante è 1,4 MB. Ciò significa che ci sono ancora circa dieci MB di spazio non spiegato.

Perché zip è in grado di comprimere singoli file meglio di più file con lo stesso tipo di contenuto?

La risposta

I contributori SuperUser Alan Shutko e Aganju hanno la risposta per noi. Innanzitutto, Alan Shutko:

La compressione Zip si basa su pattern ripetitivi nei dati da comprimere e la compressione migliora man mano che il file è lungo, poiché è possibile trovare e utilizzare modelli sempre più lunghi.

Semplificato, se comprimi un file, il dizionario che mappa i codici (brevi) in pattern (più lunghi) è necessariamente contenuto in ogni file zip risultante; se si esegue il zip di un file lungo, il dizionario viene "riutilizzato" e diventa ancora più efficace su tutto il contenuto.

Se i file sono anche un po 'simili (il testo è sempre), il riutilizzo del "dizionario" diventa molto efficiente e il risultato è un file zip totale molto più piccolo.

Seguito dalla risposta di Aganju:

In zip, ogni file viene compresso separatamente. L'opposto è compressione solida , ovvero i file vengono compressi insieme. 7-zip e Rar utilizzano una compressione solida per impostazione predefinita. Gzip e Bzip2 non possono comprimere più file, quindi Tar viene usato per primo, con lo stesso effetto della compressione solida.

Poiché i file xml hanno una struttura simile (e probabilmente contenuti simili), se i file vengono compressi insieme, la compressione sarà più alta .

Ad esempio, se un file contiene la stringa " " e il compressore ha già trovato quella stringa in un altro file, la sostituirà con un puntatore piccolo alla corrispondenza precedente. Se il compressore non utilizza la compressione solida, la prima occorrenza della stringa nel file verrà registrata come letterale , che è più grande.


Hai qualcosa da aggiungere alla spiegazione? Audio disattivato nei commenti. Vuoi leggere più risposte dagli altri utenti di Stack Exchange esperti di tecnologia? Controlla il thread completo di discussione qui.


Come gestire il controllo genitori su Linksys Smart Wi-Fi

Come gestire il controllo genitori su Linksys Smart Wi-Fi

Linksys Smart Wi-Fi è un ottimo modo per gestire il router da qualsiasi parte del mondo. Non importa dove ti trovi, puoi assicurarti che i tuoi figli non visitino siti che non dovrebbero e che non possano andare online oltre le loro ore di riposo. Il nuovo sistema Smart Wi-Fi di Linksys è l'ultimo tentativo della compagnia per aggiornare la sua vecchia dashboard di configurazione del router e rendere più semplice all'utente medio di Internet modificare tutte le impostazioni necessarie tramite un'interfaccia semplificata.

(how-to)

Come esportare i dati di utilizzo dell'energia di WeMo in Excel

Come esportare i dati di utilizzo dell'energia di WeMo in Excel

Ieri, ho scritto sul controllo di un interruttore WeMo usando Alexa e oggi volevo scrivere come esportare i dati sull'utilizzo dell'energia da uno switch WeMo Insight in Excel. L'interruttore WeMo Insight genera molte informazioni dettagliate che sono davvero utili se stai cercando di capire la quantità di energia che alcuni dispositivi o apparecchi utilizzano in casa o in ufficio.

(How-to)