it.phhsnews.com


it.phhsnews.com / Come estrarre i collegamenti da qualsiasi pagina Web Utilizzando PowerShell

Come estrarre i collegamenti da qualsiasi pagina Web Utilizzando PowerShell


PowerShell 3 ha molte nuove funzionalità, incluse alcune potenti nuove funzionalità relative al web. Semplificano notevolmente l'automazione del Web e oggi mostreremo come estrarre ogni singolo link da una pagina Web e, se lo desideri, scaricare la risorsa.

Scraping The Web With PowerShell

Ce ne sono due nuovi cmdlet che rendono più semplice l'automazione del Web, Invoke-WebRequest, che semplifica l'analisi dei contenuti leggibili dall'uomo e Invoke-RestMethod che semplifica la lettura dei contenuti leggibili dalla macchina. Poiché i collegamenti fanno parte dell'HTML di una pagina, fanno parte delle cose leggibili dall'uomo. Tutto quello che devi fare per ottenere una pagina web è utilizzare Invoke-WebRequest e dargli un URL.

Invoke-WebRequest -Uri '//phhsnews.com'

Se scorri verso il basso vedrai che la risposta è una proprietà link, possiamo usare la nuova funzione di enumerazione dei membri di PowerShell 3 per filtrarli.

(Invoke-WebRequest -Uri '//phhsnews.com') .Links

Come puoi vedere ottieni molto di collegamenti indietro, questo è dove devi usare la tua immaginazione per trovare qualcosa di unico per filtrare i link che stai cercando. Supponiamo di volere un elenco di tutti gli articoli in prima pagina.

((Invoke-WebRequest -Uri '//phhsnews.com') .Links | Dove-Object {$ _. Href -like "http * "} | Dove classe -eq" titolo "). Titolo

Un'altra grande cosa che puoi fare con i nuovi cmdlet è automatizzare i download di tutti i giorni. Vediamo automaticamente come raschiare l'immagine del giorno dal sito di Nat Geo, per fare questo uniremo i nuovi cmdlet web con Start-BitsTransfer.

$ IOTD = ((Invoke-WebRequest -Uri ' // photography.nationalgeographic.com/photography/photo-of-the-day/').Links | Dove innerHTML -like "* Download Wallpaper *"). href
Start-BitsTransfer -Source $ IOTD -Destinazione C: IOTD

Questo è tutto ciò che c'è da fare. Hai qualche trucco per te? Fateci sapere nei commenti.


Estrai testo da PDF e file immagine

Estrai testo da PDF e file immagine

Hai un documento PDF da cui vorresti estrarre tutto il testo? Che dire dei file di immagine di un documento scansionato che vuoi convertire in testo modificabile? Questi sono alcuni dei problemi più comuni che ho visto sul posto di lavoro quando si lavora con i file.In questo articolo, parlerò di diversi modi in cui puoi provare a estrarre il testo da un PDF o da un'immagine.

(How-to)

Come copiare e incollare il testo con le modifiche tracciate in Word 2013

Come copiare e incollare il testo con le modifiche tracciate in Word 2013

La funzionalità Revisioni in Word è una funzione utile per tenere traccia delle modifiche apportate a un documento, specialmente quando si lavora in modo collaborativo un documento con gli altri. A volte potresti dover copiare il testo in un altro documento conservando le modifiche tracciate. Sembra semplice, ma è molto più che copiare e incollare il testo.

(how-to)