Utilisateur:Salebot/À faire
Apparence
- Traitement majuscules : détecter \[a-z], pas seulement \b
- Rapport sur "cas louches" ?
- Mettre un bandeau méchant et écrire sur WP:RA en cas de récidive nette
- utiliser {{CURRENTDAY}}, etc. pour les journaux
- Gestion de l'heure (MT, UTC, CET)
- Lien vers "false positives", cf. cluebot http://en.wikipedia.org/w/index.php?title=Black_Thursday&curid=2547445&diff=176189526&oldid=176189508
- Nouveaux comptes contribuant sur un sujet/article "chaud" donné
- Détecter les renommages faits par copier-coller par des participants inscrits (suppression de x chars, puis ajout de x chars ailleurs, ou ordre inverse, avec une marge)
- Détecter lorsque le bot se fait révoquer par un utilisateur de confiance, effacer le casier de l'IP révoquée par le bot
- Analyse par chaînes de Markov
- Analyse par réseau de neurones (en:User:Cobi)
- Détecter l'insertion ou la modification d'images, signaler comme les annonces de mort
- IP scolaires
- Détecter les IP scolaires à partir du FQDN (ac-*.fr), ajouter les bandeaux
- Rapporter les modifs d'IP scolaires à partir de la catégorie
- Détecter les pages sensibles (révocations, protections) et abaisser le seuil
- En mode hargneux, ne pas révoquer la pdd de l'utilisateur
- Suivre Wikipédia:Détection des proxy ouverts et marquer les IPs correspondantes
- Détecter les guerres d'édition
- Copyvios: Yahoo BOSS, http://developer.yahoo.com/search/boss/
- Bandeau d'info quand un article est supprimé et qu'il n'y a qu'un seul participant
- Si la modif reprend des mots de l'article, elle est probablement bonne (sauf les noms de personnes ?)
- Articles sensibles : annuler les contributions de nouveaux utilisateurs ou d'IPs n'ayant pas participé auparavant
- Lister certaines classes de vandalismes sur une page dédiée, par exemple pour suivre certains vandales de longue durée
- Bug dans l'affichage des renommages
- Rajouter des NOINDEX en haut de chaque page du journal (fait pour les nouvelles pages)
- Détecter les modifications de nombres sur plusieurs articles
- Formatter les résultats de vandalism.pl, probablement en XML (argl)
- Détecter l'ajout du même texte sur plusieurs pages (exception pour les catégories et bandeaux)
- Publier le détail des alertes sur IRC, au moins pour les cas "temporaires"
- Déplacer certains paramètres (pages "auto-défense") sur le wiki
- Commande !test diff_url qui envoie le résultat sur le wiki
- Stocker un jour entier sur log-rc.txt pour lancer un parser dessus (détection de tous les types d'actions)
- watchlist, les modifs d'utilisateurs suivis sont affichées avec "suivi"
- Table RC: diff, reverted_by_human, reverted_by_bot. Permet de simuler un nouveau jeu de regex. Permet d'ajuster les scores (si une expression est toujours révoquée par un humain, augmenter la v.a. du score ; inversement pour éviter les faux positifs)
- Changer le traitement des majuscules
- sprintf localisé du genre "{loc} : %s" où {loc} est une clé
- Tronquer automatiquement le journal des modifications suspectes
- Class::DBI pour transformer %userdb en objet lié à une base de données
- Mise à jour automatique de {{WikiDefCon}}
- Mesurer les distances de Levenshtein
- Option ignore1RR pour certaines regex
- Ajouter un mode où le bot lit les modifs d'une IP, mais n'affiche rien si le score est > 0
- Bandeau quand qqn rajoute un lien externe en 1ere modif
- Table pages: creation_time, deletion_time, recent_revert_count, last_activity
- Réduire la sensibilité pour les suppressions d'interwikis, cf. http://fr.wikipedia.org/w/index.php?title=Nanami&diff=next&oldid=36931922
- Vérifier que la révocation a réussi, ou que quelqu'un d'autre l'a faite, sinon recommencer
- Purger les données anciennes de la bdd
- Compter les différents types d'action - si 0, risque d'erreur du parser
- Message différent si l'utilisateur a déjà été révoqué sur l'article (--> le bot ignore la R1R)
- Séparer les tests (vandalism.pl est un test, il y en a d'autres) ; changer le calcul du résultat (n-uplet de scores, pas score total)
- Afficher les renommages
- Recréation d'un article supprimé
- Alerte pour page souvent modifiée par IPs/débutants (détection attaque jeuxvideo)
- Le bot affiche parfois "la révocation a échoué" par erreur
- Quand un message est tronqué dans le journal, garder la fin
- Utiliser une nouvelle table SQL pour les stats (grouper par jour ?)
- Utiliser un maximum de paramètres de configuration directement sur le wiki
- Détecter la suppression d'une image se trouvant toujours sur commons
- "Maladresse" et "vandalisme apparent"
- Mesure du lag entre rc et message irc
- Dans vandalism.pl, ne pas utiliser le diff fourni par wp, mais comparer les versions n et n-1, et évaluer les regex sur les blocs qui sont différents, pour voir quelles regex apparaissent ou disparaissent.
- Utiliser deux comptes IRC: un pour les messages importants, un pour les autres, pour éviter le throttling anti-flood
- Traiter les blanchiments comme des rv
- Lorsqu'un autre participant révoque sur la même page que le bot, prévenir l'utilisateur que le bot ignorera la R1R
- Ne prendre en compte les modifs patrouillées que lorsqu'il s'agit de la dernière version
- Marquer comme patrouillées les modifications annulées (y compris quand plusieurs modifs sont annulées d'un coup)
- Quand une page est blanchie après SI, indiquer le motif de la SI avec le bandeau de blanchiment.
- Quand une page est restaurée après SI, ne pas la blanchir
Fait[modifier | modifier le code]
- Tri des annonces par date (pointeur sur journal, détails sur journal/yyyy-mm-dd)
- Changer les tags, du genre [namespace=0], [category=vandalism]
- Gérer les nouvelles pages, pas seulement les modifications
- Sur IRC, au lieu du score, mettre des étoiles
- Vérifier ceci : plein de "je", "moi", "tu", un "je t'aime", et un "nique"... le bot a détecté des changements dans des paragraphes inchangés. --Gribeco ► 14 novembre 2007 à 02:58 (CET)
- Mettre le bandeau en haut de la page de discussion
- Poser le bandeau après {{IP partagée}} ou {{IP scolaire}}
- Ne pas redémarrer en cas d'erreur de syntaxe (perl -c)
- Pondérer le score en fonction de la taille de la modif (grosse modif = plus de chances de tomber sur des regex qui font tiquer le bot)
- Révoquer proprement (jamais vers le même utilisateur)
- Détection des révocations (admins, LiveRC) et ajustement du score
- Ignorer la 1RR quand une révocation humaine a déjà eu lieu
- Corriger l'enregistrement du bot sur IRC
- Nombre de regex par rapport à la taille du delta
- Nombre de regex + / -
- Avertir des blanchiments (même partiels) sans commentaires
- Laisser une IP blanchir son propre article
- Corriger "score final" (contenu, page, utilisateur)
- Détecter quand l'edit token est périmé ou invalide
- Bug bandeaux sur Discussion Utilisateur:195.25.237.113
- Bandeau pour catégorie ou image à corriger, ex. Discussion Utilisateur:88.123.40.32
- Étendre la détection aux newbies
- Séparer la détection dnsbl dans un nouveau package
- Détecter les renommages en masse
- Détecter les nouvelles pages et les importations faites par des débutants ou des IPs
- Quand une expression est enlevée, inverser son score
- vandalism.pl : séparer/regrouper par classe, pour mettre les annonces de mort sur "modifications suspectes"
- Détection de bas de page supprimé, cf. http://fr.wikipedia.org/w/index.php?title=Les_Herbiers_Vend%C3%A9e_Football&diff=32574925&oldid=31646031
- Meilleure explication ; grouper les détections et scores par catégorie (vandalisme, erreur, ...)
- Détecter les contrefaçons du bandeau du bot
- Avertissement sur gros ajout (même si le score est > 0)
- whitelist_exp -> whitelist_exp_time
- supprimer last_edit_time_str
- Message IRC spécifique pour les blanchiments effectués par le bot (au lieu de "révocation")
- Utiliser MediaWiki::API
- Mettre les alertes (en plus des révocations) sur le journal, pour qu'elles soient lues par LiveRC et signalées à ses utilisateurs
- Mieux surveiller Utilisateur:Salebot/Journal -- semi-protection à partir du titre
- Ajouter le score dans le résumé
- bug format: "retour à la version 33897039 deSalebot" (espace)
- Inidiquer la raison et le score dans le résumé de blanchiment
- Envoyer le détail des erreurs de détections (en particulier les erreurs de regex) sur IRC
- Tronquer les entrées de journal trop longues
- placer les avertissements du bot en dessous du bandeau {{Avertissement effacé}}
- .config commun et overrides par langue
- Bandeau utilisateur en cas de révocation systématique
- Actions d'admins et d'utilisateurs expérimentés en vert (révocations, suppressions)
- Annoncer les blocages quand l'utilisateur est dans la bdd
- Signaler en rouge les révocations faites par un débutant ou une IP
- Alerte pour modification de catégorie
- Pour le spam, tenir le compte du nombre pages modifiées
- Erreur en ajoutant le ":" aux catégories et aux images
- Problème avec !wl (pas enregistré dans la bdd ?)
- Gestion des patrolled edits (modifs vérifiées) maintenant qu'elles sont publiées sur IRC
- MediaWiki::API : http://www.mediawiki.org/wiki/API:Query_-_Properties#revisions_.2F_rv pour lire une ancienne version (rvstartid/rvendid)
- Modifs avec/sans bot flag ("&bot=0")
- Commande pour ne plus afficher les suppressions -- mieux, afficher les suppressions pour les pages récemment modifiées seulement
- Test 2020-07-19