yule
Membre
Hello,
Tout est dans le titre.. Toutefois et pour comprendre ma requête, ça mérite une petite explication.
Sur mon site (un moteur de recherche), je pratique le scraping au rythme moyen de 350 sites max par jour sur une boucle de 7 jours, soit sur un peu près 2'500 sites par semaine et ainsi de suite. Tout ceci dans le but de mettre à jours les sites indexés.
Cette pratique me permet de garder à jour ma base de données et de proposer au visiteurs des résultats un peu près d'actualités . Comme ce rythme n'est vraiment pas élevé, je pensais pas que j'allais être de plus en plus confronté au blocage des sites indexés (peut-être un plugin sur WP ou autres par l'hébergeur.. enfin bref, c'est ennuyeux. mais cela a débuté en ce début d'année) Après oui, certains détestent cette pratique mais il ne faut pas mélanger, de mon côté, ce n'est pas pour puiser dans un site et utiliser leurs infos pour vendre un produit etc..,. et ça fait plus de 10ans que je le pratique, fallait bien que ça arrive même si le rythme des sites bloquants n'est pas élevé.. j'en ai un peu près 5-6 par jour. (mais j'aime bien anticiper aussi..)
J'essaye donc par le biais de Curl sur ma page php me permettant de scraper/ gratter, de cacher mon adresse IP avec un proxy. j'ai donc mis en place ceci et ma foi , c'est efficace ! Un peu plus lent mais efficace. A priori plus de blocage.
Le revers de la médaille parce qu'il y en a toujours une.. c'est le prix !
J'ai essayé la version test (1'000 tentatives) de ce site Web Scraping Proxy API et avec également un version test de celui-ci Scraper API
Je regarde les offres et là
. Pour remettre les choses dans leur contexte, leurs offres varient de 20$ à plusieurs milliers de $ par mois !!! Il y en a pour tous... mais surtout pour des grosses industries qui POMPES à tout va.. Je savais pas qu'il y avait des API pour gratter Linkedin (bon c'est dès 200$ par mois !)
Ok mon site doit rester gratuit et sans pub (aucune discussion là-dessus, c'est un hobby depuis le temps..) donc financer un peu, je veux bien mais tout de même. Donc , connaissez-vous un bon site permettant ceci avec des prix attractifs .
Merci pour votre attention et suggestion
Bonne bonne
Yule
Tout est dans le titre.. Toutefois et pour comprendre ma requête, ça mérite une petite explication.
Sur mon site (un moteur de recherche), je pratique le scraping au rythme moyen de 350 sites max par jour sur une boucle de 7 jours, soit sur un peu près 2'500 sites par semaine et ainsi de suite. Tout ceci dans le but de mettre à jours les sites indexés.
Cette pratique me permet de garder à jour ma base de données et de proposer au visiteurs des résultats un peu près d'actualités . Comme ce rythme n'est vraiment pas élevé, je pensais pas que j'allais être de plus en plus confronté au blocage des sites indexés (peut-être un plugin sur WP ou autres par l'hébergeur.. enfin bref, c'est ennuyeux. mais cela a débuté en ce début d'année) Après oui, certains détestent cette pratique mais il ne faut pas mélanger, de mon côté, ce n'est pas pour puiser dans un site et utiliser leurs infos pour vendre un produit etc..,. et ça fait plus de 10ans que je le pratique, fallait bien que ça arrive même si le rythme des sites bloquants n'est pas élevé.. j'en ai un peu près 5-6 par jour. (mais j'aime bien anticiper aussi..)
J'essaye donc par le biais de Curl sur ma page php me permettant de scraper/ gratter, de cacher mon adresse IP avec un proxy. j'ai donc mis en place ceci et ma foi , c'est efficace ! Un peu plus lent mais efficace. A priori plus de blocage.
Le revers de la médaille parce qu'il y en a toujours une.. c'est le prix !
J'ai essayé la version test (1'000 tentatives) de ce site Web Scraping Proxy API et avec également un version test de celui-ci Scraper API
Je regarde les offres et là
Ok mon site doit rester gratuit et sans pub (aucune discussion là-dessus, c'est un hobby depuis le temps..) donc financer un peu, je veux bien mais tout de même. Donc , connaissez-vous un bon site permettant ceci avec des prix attractifs .
Merci pour votre attention et suggestion
Bonne bonne
Yule