Back to Question Center
0

Chrome Web Scraper Tutorial From Semalt Expert

1 answers:

Jos käytät Google Chromea, mikä voi auttaa kaapata verkkosivuja. Se tunnetaan nimellä "Scrapper", ja sitä voidaan hyödyntää ilman ongelmia. Scrapper auttaa kaappaamaan sivuston sisällön ja lataamalla tulokset Googlen asiakirjoihin - mix mold grain bin with good grain.

Miten romu verkkosivuilla käyttäen Scraper laajennus?

1. Valitse Chrome Web Storesta Google Chromessa.

2. Laajennuksissa suoritetaan haku '' Scrapper '';

3. Ensimmäinen hakutulos on laajennus nimeltä '' Scrapper '';

4. Valitse painike "Lisää Chrome"

5. Palaa Yhdistyneen kuningaskunnan parlamentin jäsenille

6. Napsauta seuraavaa

7. Napsauta hiiren kakkospainikkeella hiiren kakkospainikkeella "Kaappaa "

7. Etsi yksi MP ja varmista, että merkintä on merkitty.

9. Scrapperin konsoli avautuu toiseen ikkunaan,

10. Tarkastele kaavittua sisältöä kaavin

11. Varmistaaksesi, että sisältö tallennetaan Google-laskentataulukoksi, valitse "Tallenna Google-dokumentteihin ..."

Laajennettu kaavinta

linkki

Kuvitellaan, että olemme kiinnostuneita kaikista elokuvista, jotka ovat tähdellä Aasia Argentoa, kuuluisa italialainen näyttelijä.

1. IMDB: n toimijoista on hyvin yksityiskohtainen arkisto Aasia Argento-sivusto on: https://www.imdb.com/name/nm0000782/;

2. Tässä voit tarkastella kaikkia näyttelijän rooleja..Aloitetaan romuttamasta tietoja, joista me olemme kiinnostuneita.

3. Yritä kaapata se edellä kuvatulla tavalla.

4. Näet, että luettelo on vähän vääristynyt. Tämä johtuu siitä, että tässä oleva luettelo voidaan jäsentää eri tavalla;

5. Päätä kaavinterään. Ylhäällä vasemmalla näet pienen laatikon, joka sanoo XPath;

6. Xpath on eräänlainen kyselykieli, joka toimii XML: llä ja HTML: llä;

7. XPath voi auttaa löytämään sivun osat, joihin olet kiinnostunut. Seuraava asia on etsiä asianmukainen elementti ja kirjoittaa sen XPath: lle.

8. Nyt järjestämme taulukon;

9. Näet, että nykyinen XPath, jolla on kaikki tarvittavat tiedot, on "// div [3] / div [3] / div [2] / div";

10. XPath kertoo Järjestelmälle, että HTML-dokumentti näkyy ja valitaan kolmas elementti, sitten toinen elementti ja sitten kaikki ne.

11. Haluamme kuitenkin, että tietomme eroavat toisistaan.

12. Käytä konsolissa olevaa sarakkeen osaa kaavinta varten tämän tekemiseksi.

13. Ensin löydämme nimikkeemme "Tarkastele elementti nähdäksesi otsikon;

14. Tarkista otsikko tunnisteen sisällä. Lisää tunniste XPathiin;

15. Ilmaus vaikuttaa toimivan tarkoituksenmukaisesti, joten tee siitä ensimmäinen sarake.

16. Korvataan ensimmäisen sarakkeen nimeksi "otsikot" osassa "Sarakkeet";

17. Lisää XPath siihen;

18. Sarakkeen osassa XPathit ovat suhteellisia ja se tarkoittaa, että "./b" valitsee elementin

19. XPath lisätään otsikkokolonniin "./b" ja valitse "scrape";

20. Nyt jatkamme vuotta. Vuosia löytyy yhden span;

21. Luo uusi sarake valitsemalla otsikon sarakkeen vieressä oleva pieni plusmerkki.

22. XPath "./span" luo sarake "vuosi";

23. Napsauta hiipiä ja katso, miten vuosi lisättiin;

24. Valmis!

December 6, 2017