Hey HoL,
Jeg har begivet mig ud i Python scripting en smule, og jeg er ved at lave en meget lille webscraper til mig selv. Kort sagt vil jeg forsøge at holde med upcoming movies på div. biograf hjemmesider :) Og jeg starter med NFBio:
www.nfbio.dk[...]
Jeg bruger BeautifulSoup til scraping af siden, da det umiddelbart ligner alt loader ind som HTML helt fint. Det eneste jeg vil bruge er navnet og udgivelsesdatoen.
Hvis jeg inspicere siden ligner det også alle elementer er der. Men hvis jeg scraper siden, så får jeg ikke data med for dem der mangler en plakat, f.eks. "The Neutral Ground" eller "The North Drift". Det gælder alle dem med manglende plakat!
jeg har også prøvet at køre via an selenium driver og hente siden ind for så at parse med BS4, men det hjælper heller ikke.
Min kode for at finde det er umiddelbart:
movielist = soup.find_all("li") (simplificeret)
men ingen steder i respons er der de to film. Jeg har også lavet en lille context manager og gemmer respons til en HTML fil jeg kan søge i. Stadig intet.
Jeg ved godt stack overflow er the way to go når man har sådanne spørgsmål. Og det kan da godt være jeg tyr dertil også. Men så habil en koder er jeg slleeeeet ikke endnu, og vil da gerne se om man måske kunne finde en lidt mere 'lokal' der kan hjælpe lidt først :)
--
Z270-P ; 1000W Coolermaster GOLD ; I5-7600K ; MSI 1080 ; 2x8 GB DDR4 2400MHz ; Evo-840 250GB + 1TB ; X61 Kraken ; Phantom 820