Simple Web Scraping Using Python

web scraping using python

Web scraping adalah teknik yang digunakan untuk mengambil isi sebuah halaman web secara spesifik, misalnya link gambar, isi berita atau sejenisnya.

kali ini kita akan mencoba mengambil source sebuah halaman web dengan library requests. pada web scraping ada 2 hal yang perlu kamu siapkan

pertama, url tujuan yang akan kamu ambil sourcodenya

kedua, user-agent header. kamu bisa menggunakan google chrome ataupun mozila.

perhatikan sample di bawah ini

import requests
 
class Scraper(object):
 
    @classmethod
    def scrapy(cls):
        urls = {
            'home': 'https://www.tiket.com/',
        }
 
        headers = {
            'User-Agent': 'User-Agent:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2683.0 Safari/537.36',
            'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
            'Accept-Encoding': 'gzip, deflate, sdch',
            'Accept-Language': 'en-US,en;q=0.8',
            'Connection': 'keep-alive'
        }
 
        s = requests.Session()
        r_search = s.get(urls['home'], headers=headers, timeout=10000)
        return r_search.text
 
print(Scraper.scrapy())

sample code diatas akan mendowload source home page dari tiket.com, silahkan kembangkan lebih lanjut untuk hal yang lain.

 

good luck!

mm

Alfin F

Technopreneur , Developer, Advisor

More Posts

Follow Me:
TwitterLinkedIn