Tuttorial Estensione Web Scraper per scaricamento dati in maniera gratuita

« Older   Newer »
 
  Share  
.
  1. robjno78
     
    .
    Avatar

    Advanced Member

    Group
    Member
    Posts
    1,014

    Status
    CITAZIONE (elosystembetting @ 4/4/2022, 13:21) 
    Buongiorno ragazzi sperando di fare cosa gradita ,inizio questo tutorial ,dove elenco alcuni dei settaggi per poter scaricare quote aggiornate da qualsiasi odd comparison .

    innanzitutto andate su questa pagina https://webscraper.io/

    Troverete questa schermata

    Pagina_Inziale_

    -----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

    Cliccate su install e installate l'estensione (spero sappiate come installare un estensione vero?)

    Andate avanti se tutto è andato bene vi ritroverete su questa schermata

    installazione

    -----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

    Bene ora andate sul sito di comparazione quote che usate abitualmente

    In questo tut,io ho scelto bet esplorer-Quindi il codice preparato potete usarlo solo qui. Ma con il tempo imparerete a usarlo ovunque.

    Quindi andiamo su questo link

    www.betexplorer.com/next/soccer/


    La pagina ci mette circa 40 secondi per caricare il proprio database esterno
    questa_e_la_mia_schermata

    ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

    Ora


    Tasto destro del mouse

    Screenshot__32_

    ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

    Andate su ispeziona e cliccate su Web Scraper (che sarebbe l'estensione che abbiamo installato)

    ispezi_0

    ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

    Bene ora vi troverete questa scherm

    import

    ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

    ORA cliccate su Import Sitemap

    json

    Copiate questo codice Json che ho creato io grazie all'estensione(con il tempo vedrete che è facile) è incollatelo nello spazio bianco adibito (evidenziato con la matit viola)

    -----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

    {"_id":"bet-esplorer-palinsesto-giornaliero","startUrl":["https://www.betexplorer.com/next/soccer/"],"selectors":[{"id":"Link-Match","parentSelectors":["_root"],"type":"SelectorLink","selector":".table-main__tt a","multiple":true,"delay":0},{"id":"Data-Ora","parentSelectors":["Link-Match"],"type":"SelectorText","selector":"p.list-details__item__date","multiple":false,"delay":0,"regex":""},{"id":"Campionato ","parentSelectors":["Link-Match"],"type":"SelectorText","selector":"li:nth-of-type(3) a.list-breadcrumb__item__in","multiple":false,"delay":0,"regex":""},{"id":"Stagione","parentSelectors":["Link-Match"],"type":"SelectorText","selector":"li:nth-of-type(4) a.list-breadcrumb__item__in","multiple":false,"delay":0,"regex":""},{"id":"Match","parentSelectors":["Link-Match"],"type":"SelectorText","selector":"span.list-breadcrumb__item__in","multiple":false,"delay":0,"regex":""},{"id":"Element-Odd","parentSelectors":["Link-Match"],"type":"SelectorElement","selector":".sortable tbody tr","multiple":true,"delay":0},{"id":"Book","parentSelectors":["Element-Odd"],"type":"SelectorText","selector":" td:nth-child(1)","multiple":false,"delay":0,"regex":""},{"id":"Uno ","parentSelectors":["Element-Odd"],"type":"SelectorText","selector":" td:nth-child(5)","multiple":false,"delay":0,"regex":""},{"id":"Pari","parentSelectors":["Element-Odd"],"type":"SelectorText","selector":" td:nth-child(6)","multiple":false,"delay":0,"regex":""},{"id":"Due","parentSelectors":["Element-Odd"],"type":"SelectorText","selector":" td:nth-child(7)","multiple":false,"delay":0,"regex":""},{"id":"Medie","parentSelectors":["Link-Match"],"type":"SelectorGroup","selector":"#match-add-to-selection td.table-main__detail-odds:nth-of-type(n+3)","delay":0,"extractAttribute":""},{"id":"Ris-Finale","parentSelectors":["Link-Match"],"type":"SelectorText","selector":"p.list-details__item__score","multiple":false,"delay":0,"regex":""},{"id":"Parziale-Finale","parentSelectors":["Link-Match"],"type":"SelectorText","selector":"h2.list-details__item__partial","multiple":false,"delay":0,"regex":""}]}

    ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

    Sotto c'è scritto Rename Sitemap ;mettetici qualsiasi nome. Io lo nominato palinsesto giornaliero bet esploorer.

    Ora si è creata la nostra sitemap Dovreste vedere questa shermata



    bet_esplore

    ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

    Cliccateci sopra

    L'estensione vi chiederà cosa fare ora?

    scrape

    ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

    Cliccate su scrape le altre cose per ora non ci interessano

    Una volta cliccato su scrape vi uscirà un ultima shermata riguardante la velocità

    Io metto ritardo 3000

    Se mettete una velocità alta c'è il rischio che vi salti le quote ,delle partite o dei dati sensibili.

    ritardo

    ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

    Siamo pronti Cliccate su Stat Scraping e andatevi a fare un caffe ,na sigaretta.Per 300 partite il sabato ci mette dieci minuti massimo ma non salta una partita ,un risultato, na quota eccc Nulla

    Una volta scaricato tutto, l'estensione vi chiederà come e dove salvare i dati


    -----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

    clicca_xlsx

    Cliccate su XLSXe avrete il vostro file.Ci metterete un minuto a cancellare quello che non vi serve sistemare la data ,le quote ecc

    Nella mia sitemap che vi ho creato ci sono le quote per ogni partita di tutti i book di quel momento e in più le relative quote medie di tutti i book inerenti alla partita esaminata.


    Nella colonna dei risultati finali se la partita non è incominciata non c'è nulla altrimenti se per esempio scaricate il giorno dopo la pagina del giorno precedente(esempio ieri 03-04-2022) troverete risultati finali e parziali primo tempo finale
    ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

    riultato_finale_0
    --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

    A differenza di python(che non è un estensione ma un vero linguaggio di programmazione) che per lo scraping è il migliore in assoluto questa estensione non ti salta mai un partita o una quota se la settate per bene .


    Probabilmente a causa dei siti web poco restii ad vere troppa gente che scarica tanta roba in maniera veloce appesantendo il server ,parecchi linguaggi saltano dei dati mentre scaricano .

    Questa estensione è fantastica. Io scarico direttamente dal sito snai, bet 365 o pinnacle ad esempio ..

    Ma naturalmente se volete qualcosa di più professionale loro hanno anche il servizio api che vi scarica le quote dal sito scelto ogni tot secondi ,minuti ,ora, o giorni in maniera automatica

    Alla fine cmq avere un programmatore di fiducia ,che vi dia la pappa pronta naturalmente dietro compenso ,credo che per i proff sia la scelta migliore e grazie a Dio in Italia (anche in questo forum )c'è ne sono di bravi

    -----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------



    Per ora penso vada bene ,è da studiare cmq

    Se volete scaricare i giorni precedenti ,le aperture(che non servono a nulla secondo me),gli altri sport ecc

    https://webscraper.io/how-to-videos Per imparare a creare da0 la tua sitemap

    https://forum.webscraper.io/ dove chiedere se qualcosa non torna

    Spero di aver fatto cosa gradita. Se ho commesso errori grammaticali chiedo scusa.
    È stato un piccolo lavoraccio fatto nel più breve tempo possibile .Buon betting

    Ciao, ottimo tutorial! Una domanda sul codice json? A che cosa serve? Se volessi fare scraping da un altro sito come creo quel codice? Grazie
     
    Top
    .
42 replies since 4/4/2022, 12:21   3968 views
  Share  
.