logo proxyscrape gelap

Bagaimana Cara Menggunakan Proxy Untuk Merotasi Alamat IP Di Python? 5 Langkah Mudah di Tahun 2024

Bagaimana caranya, Proksi, Python, Nov-02-20225 menit baca

Daftar Isi

Ketika Anda menggunakan proxy, Anda tidak secara langsung tersambung ke server target; sebaliknya, Anda mengarahkan permintaan Anda ke server proxy yang mengevaluasinya dan mengembalikan respons. Proksi memiliki banyak manfaat, seperti menyembunyikan alamat IP asli Anda, melewati filter, sensor, dll. 

Kadang-kadang sulit untuk melakukan pengikisan web tingkat lanjut karena mengirimkan banyak permintaan dari alamat IP yang sama. Pengikis web menghadapi masalah umum yaitu diblokir oleh situs web yang mereka kikis. Tetapi mereka dapat menggunakan banyak teknik untuk mencegah pemblokiran, seperti
  • Memutar alamat IP
  • Menggunakan browser tanpa kepala
  • Mengurangi tingkat perayapan,
  • Menggunakan proxy

Rotator proksi dapat membantu Anda mengatasi sebagian besar tindakan anti-pengikisan. Anda juga bisa menggunakannya untuk menghindari batasan kecepatan yang diterapkan pada situs web target dan mengekstrak data dengan sukses. Tetapi apakah yang dimaksud dengan proxy berputar? Ini adalah proksi yang memberikan alamat IP baru untuk setiap koneksi dari kumpulan proksi. Ini berarti Anda bisa mengirimkan 1000 permintaan ke sejumlah situs web dengan meluncurkan skrip dan mendapatkan 1000 alamat IP yang berbeda.

Artikel ini membantu Anda memahami cara menggunakan proxy untuk memutar alamat IP di python.

Cara Menggunakan Proksi untuk Memutar Alamat IP di Python

Anda dapat mengikis daftar proxy gratis dan menyimpannya dalam berkas teks bernama list_proxy.txt. Anda kemudian dapat mengikuti langkah-langkah di bawah ini untuk merotasi alamat IP di Python.

Mengimpor Perpustakaan

Anda harus mengimpor modul permintaan Python menggunakan perintah di bawah ini.

permintaan impor

Jika modul tidak diinstal di lingkungan Anda, Anda dapat menginstalnya menggunakan perintah di bawah ini.

!pip permintaan pemasangan

Buat Fungsi

Anda harus membuat fungsi send_request yang akan mengambil dua parameter, yaitu sesi dan proxy. Akan lebih baik jika menggunakan proxy HTTP karena kebanyakan proxy gratis tidak menggunakan protokol HTTPS. Kita akan menggunakan blok try-except karena sebagian besar proxy gratis tidak berfungsi karena telah masuk dalam daftar blokir.
def send_request(session, proxy):
   try:
       response = session.get('http://httpbin.org/ip', proxies={'http': f"http://{proxy}"})
       print(response.json())
   except:
       pass

Baca File .txt

Ini dia bagian utama dari kode. Anda harus membaca file list_proxy.txt Anda dan menyimpannya ke variabel bernama proxy seperti yang ditunjukkan di bawah ini.

if __nama__ == "__utama__":
  with open('list_proxy.txt', 'r') as file:
       proxy = file.readlines()

Gunakan Perulangan Untuk

Anda harus menggunakan modul permintaan untuk membuat sesi di Python. Kami menggunakan perulangan for untuk mengulang melalui proksi pada kode di bawah ini. Kita kemudian meneruskan sesi dan proxy ke fungsi send_request. 

dengan requests.Session() sebagai session:
  untuk proxy dalam proxy:
       send_request(session, proxy)

Jalankan Skrip

Anda dapat menjalankan skrip dan melihat hasilnya seperti yang ditunjukkan di bawah ini. Anda akan mendapatkan daftar panjang proksi, tetapi ingat, proksi tersebut tidak akan berfungsi. 

python rotateproxy.py

Seluruh kode Anda akan menjadi seperti:

import requests


def send_request(session, proxy):
   try:
       response = session.get('http://httpbin.org/ip', proxies={'http': f"http://{proxy}"})
       print(response.json())
   except:
       pass


if __name__ == "__main__":
   with open('list_proxy.txt', 'r') as file:
       proxies = file.readlines()

   with requests.Session() as session:
       for proxy in proxies:
           send_request(session, proxy)

Kiat Untuk Membangun Rotator Proxy

Di bawah ini adalah beberapa tips untuk memutar proxy di Python ketika menggunakan proxy yang berputar.

Gunakan Layanan Proksi yang Andal dan Gratis

Sebagian besar layanan proxy gratis yang tersedia penuh sesak, yang menyebabkan kerusakan tak terduga dan penundaan yang membuat frustrasi. Oleh karena itu, ketika Anda berencana untuk menggunakan proxy gratis, Anda harus memeriksa apakah proxy tersebut sesuai dengan kebutuhan scraping Anda tanpa menyebabkan penarikan yang signifikan.

Sebagian besar proksi gratis berlaku untuk waktu yang terbatas, sehingga Anda dapat membangun logika Anda sendiri di Python yang dapat memutar pemutar daftar proksi gratis dengan alamat IP yang berfungsi. Dengan cara ini, Anda tidak akan mengalami gangguan apa pun selama melakukan web scraping. 

Jangan Menggunakan Alamat IP Proxy yang Dapat Diprediksi

Anda harus menghindari penggunaan alamat IP yang mengikuti urutan tertentu atau format yang mudah ditebak seperti milik grup yang sama. Ini karena sebagian besar alat anti-scraping dapat dengan mudah mendeteksi permintaan yang dikirim dari alamat IP seperti itu. Sebagai contoh, Anda sebaiknya tidak menggunakan urutan alamat IP yang berotasi berikut ini karena akan dengan cepat menimbulkan tanda bahaya.

103.243.132.11

103.243.132.12

103.243.132.13

103.243.132.14

Pertimbangkan Layanan Proxy Premium

Pemutar IP proxy gratis tidak aman dan lambat. Jadi, menggunakannya tidak akan cocok jika Anda melakukan proyek pengikisan web berskala besar dan canggih. Dengan menggunakan proxy premium yang bagus, Anda bisa mendapatkan layanan berkualitas tinggi dan mengikis ribuan halaman web tanpa mengalami pemblokiran atau gangguan. 

Untuk menggunakan layanan proxy premium, Anda harus membayar beberapa dolar dan mendapatkan penyedia yang akan memenuhi kebutuhan ekstraksi data Anda dan menjamin privasi Anda.

Pilih Proksi Elite

Di bawah ini adalah tiga kategori utama proksi di Internet.

  • Proksi Elite
  • Proksi Anonim
  • Proksi Transparan
Proksi elit adalah pilihan terbaik untuk dipertimbangkan di antara proksi-proksi ini karena dapat mencegah deteksi dan melewati batasan. Anda hanya dapat mengirim header REMOTE_ADDR menggunakan proksi elit dan membiarkan header lainnya kosong. Dengan cara ini, Anda dapat mencapai privasi optimal dengan proksi ini.
Di sisi lain, proxy transparan mengungkapkan detail alamat IP Anda dan mengirimkan IP asli Anda melalui header HTTP_VIA dan header HTTP_X_FORWARDED_FOR. Proksi anonim tidak mengungkapkan alamat IP Anda yang sebenarnya. Proksi ini mengirimkan IP proksi atau membiarkannya kosong.

Gabungkan Rotasi IP Dengan Rotasi Agen Pengguna

Anda bisa menggunakan rotasi IP untuk merotasi beberapa alamat IP dan menghindari deteksi. Namun, beberapa tindakan anti-scraping dapat mengidentifikasi aktivitas tersebut dan memblokir Anda untuk memanen data. Oleh karena itu, Anda juga perlu merotasi agen pengguna selain merotasi alamat IP untuk meningkatkan peluang keberhasilan Anda. 

Pertanyaan yang Sering Diajukan:

1. Bagaimana cara menggunakan proxy untuk memutar alamat IP menggunakan python?
Dengan bantuan permintaan pustaka python, Anda dapat merotasi proxy dengan mudah. Pertama, unduh daftar proxy gratis dari situs web ProxyScrape, kedua buat fungsi yang dapat Anda gunakan untuk melakukan seluruh proses rotasi IP; ketiga, gunakan fungsi read untuk membaca proxy gratis yang telah diunduh; dan terakhir, jalankan skrip menggunakan perulangan for untuk mendapatkan proxy yang tersedia untuk suatu sesi.
2. Apakah ada rotator proxy yang tersedia secara online?
Ya, ada rotator proxy yang tersedia secara online. Daripada memutar proxy pusat data Anda secara manual, Anda bisa menggunakan rotator proxy ini untuk melakukan pekerjaan berat. Tetapi ini adalah layanan berbayar; jika Anda menginginkan rotator proksi gratis, maka membuat rotator dengan bantuan python adalah kesempatan terbaik.
3. Bagaimana proxy membantu dalam penggalian web?
Proksi membantu menyembunyikan alamat IP asli Anda dan menggunakan alamat IP mereka untuk mengirim beberapa permintaan ke server target untuk mendapatkan informasi yang diperlukan. Untuk web scraping, Anda perlu mengirim banyak permintaan dengan cepat, yang dapat dilihat oleh server target sebagai perilaku tidak normal dan memblokir alamat IP Anda. Proksi membantu Anda untuk menghindari skenario seperti itu.

Kesimpulan

Sangat mudah untuk membuat pemutar proxy di Python. Anda bisa membuat proksi acak dan kemudian membuat logika untuk mengikis data dari situs web. Selain proksi pusat data dan perumahan, kategori lainnya adalah proksi elit, anonim, dan transparan. Proksi elit adalah pilihan terbaik karena sulit dideteksi oleh situs web target. Anda bisa menggunakan proxy anonim jika Anda hanya ingin menjaga privasi Anda di Internet. Terakhir, Anda bisa menggunakan proxy transparan, tetapi proxy ini menawarkan peluang keberhasilan yang paling rendah. Artikel ini berharap dapat memberikan informasi mendalam dan memberikan contoh cara menggunakan proxy untuk memutar alamat IP di python dengan langkah-langkah pengkodean yang sederhana