Python - Delete et replace de liens internes (1)
Suppression de liens internes
Pour les SEO
Besoin : 1 fichier excel avec une seule feuille contenant une seule colonne. Dans cette colonne mettre les url à supprimer, ex:
https://www.domain-name.com/a-slug-to-delete |
https://www.domain-name.com/another-slug-to-delete |
https://www.domain-name.com/one-more-slug-to-delete |
Ne pas laisser de lignes ou de colonnes vides ni de doublons
Pour les Dev
- Transformer le fichier excel en CSV par ex url-to-delete.csv
- Pensez à escape les ? dans les urls avec \\
- Si vous avez des URLs qui contiennent des esperluettes (&), il peut être intéressant de temporairement
set define off
sur la db
- Mettre le fichier en ftp à la racine de l’hébergement (un cran au dessus de htdocs normalement)
- Récupérer les infos de la BDD ( ex : nom=bdd-name, identifiant=bdd-user, mot de passe=bdd-password )
- En SSH lancer le script python avec la commande: nohup sql_delete bdd-name wp_posts bdd-user bdd-password url-to-delete.csv > /dev/null (attention au préfixe de la table posts)
Update de liens internes
Pour les SEO
Besoin : 1 fichier excel avec une seule feuille contenant deux colonnes. Dans ces colonnes mettre les anciennes url à remplacer et les nouvelles url à mettre à la place, ex:
https://www.domain-name.com/the-old-slug-to-replace | https://www.domain-name.com/the-new-slug-you-want-instead |
https://www.domain-name.com/another-old-slug-to-replace | https://www.domain-name.com/another-new-slug-you-want-instead |
https://www.domain-name.com/one-more-old-slug-to-replace | https://www.domain-name.com/one-more-new-slug-you-want-instead |
Ne pas laisser de lignes ou de colonnes vides ni de doublons
Pour les Dev
- Transformer le fichier excel en CSV avec un “;” comme séparateur par ex url-to-update.csv
- Mettre le fichier en ftp à la racine de l’hébergement (un cran au dessus de htdocs normalement)
- Récupérer les infos de la BDD ( ex : nom=bdd-name, identifiant=bdd-user, mot de passe=bdd-password )
- En SSH lancer le script python avec la commande: nohup sql_update bdd-name wp_posts bdd-user bdd-password url-to-update.csv > /dev/null (attention au préfixe de la table posts)
Suppression des images 404
Pour les SEO
Besoin : 1 fichier excel avec une seule feuille contenant une seule colonne. Dans cette colonne mettre les url des images à supprimer, ex:
https://www.domain-name.com/wp-content/uploads/2022/09/27/image-missing.jpg |
https://www.domain-name.com/wp-content/uploads/2022/09/25/another-image.png |
https://www.domain-name.com/wp-content/uploads/2022/04/01/poisson-d-avril.jpg |
Ne pas laisser de lignes ou de colonnes vides ni de doublons
Pour les Dev
- Transformer le fichier excel en CSV et le renommer, par ex images-to-delete.csv
- Mettre le fichier en ftp à la racine de l’hébergement (un cran au dessus de htdocs normalement)
- Récupérer les infos de la BDD ( ex : nom=bdd-name, identifiant=bdd-user, mot de passe=bdd-password )
- Copier le script python sql_delete.py en img_delete.py à la racine de l’hébergement, avec le CSV
- Remplacer le REGEX_REPLACE ligne 110 par:
REGEXP_REPLACE(post_content,'<img(.*)src=\"{1}\"(.*)\>', '')
- En SSH lancer le script python avec la commande: ./img_delete.py bdd-name wp_posts bdd-user bdd-password images-to-delete.csv (attention au préfixe de la table posts)