Semaltvejledning om skraberudvidelse til Chrome

For enhver virksomhed at overleve og i sidste ende vokse, er det nødvendigt at være foran sine konkurrenter og forskellige risici. At tage beslutninger baseret på analytiske data er en sikker måde at glemme disse problemer. Sådanne data kan indhentes gennem dataskrotning. Det er her nem udvidelse af skraber til Chrome kommer: det vil ikke kun lette processen med datahøsting, men også gøre det muligt at skrabe på farten uden komplicerede opsætninger.

Sådan bruges Skraber

    1. Den første ting, du skal gøre, er at installere udvidelsen, så gå over til Chrome-butikken, søg efter "skraber" og klik på Tilføj til Chrome.

    2. Naviger til det websted, du har til hensigt at skrabe data fra, markér det punkt, du er interesseret i, ved at fremhæve det. Højreklik på det og vælg "skrabe lignende" i den menu, der dukker op.

    3. Hvis du gør det, åbnes et separat skraberkonsolvindue. Her ser du en liste over de skrabede data .

    4. For at gemme indholdet skal du klikke på "gem i Google-dokumenter", dette eksporterer automatisk dataene til et Google-regneark.

Udvidet skrabning

Hvis du planlægger at skrabe flere data, kan du bruge den avancerede tilgang. Bemærk, det vil være meget lettere at arbejde med værktøjet, hvis du har en vis viden om HTML. Antag, at du ville skrabe data fra en kilde, der har et arkiv, der er baseret på tidsseriedata. I sådanne tilfælde, hvis du prøver metoden beskrevet ovenfor, vil du få de forvirrede data.

For at løse dette problem kan du bruge et HTML- og XML-forespørgselssprog kaldet XPath. Hvad gør den? XPath genkender data vedrørende de forskellige elementer, der er indeholdt i hvert valg. Følgende er en guide til, hvordan man gør det:

1. Gå til Skraberkonsollen, øverst til venstre skal du bemærke en "XPath" -knap, klikke på den og fortsæt med at samle den indledende tabel.

2. Du skal skrive XPath for det rigtige element. Den aktuelle XPath, der inkluderer hele informationen, vises i et format som dette "// div [3] / div [3] / div [2] / div". Elementerne <div> genkendes i HTML-dokumentet af computeren.

3. For at adskille de genkendte data skal du bruge skraber-kolonnerne. For at gøre det, skal du kigge efter de forskellige typer information, du har til rådighed. Afhængig af de data, du skraber, kan du have titler. Disse titler findes ved siden af hvert datasæt. De ledsages af et tag, i dette tilfælde et <b> tag.

4. Find og tilføj <b> -tagget til din XPath ved hjælp af inspect-elementet. Nu kan du markere denne første kolonne som "titelsøjle", da den vil vise titlerne. Fortsæt med at oprette forskellige XPaths for hver kolonne, du har brug for.

5. Klik på skrabet, og udvidelsen høster automatisk dataene og organiserer dem i de forskellige kolonner, du har indstillet.