Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

scoring des articles avec gnus

0 views
Skip to first unread message

yves

unread,
Dec 9, 2023, 5:00:41 PM12/9/23
to
Bonjour,

Il y a des tonnes de spam actuellement sur certains forums qui
proviennent de google groups.

Comment, avec gnus, donner un score bas aux articles qui ont ceci
dans les en-têtes :
Injection-Info: google-groups.googlegroups.com
?

Je sais faire sur auteur, sujet, mais je ne sais pas faire sur ces
en-têtes plus techniques.

Pourriez-vous me fournir des pistes, ou des exemples ?

@+
--
Yves

llp

unread,
Dec 9, 2023, 5:56:27 PM12/9/23
to
yves <yv...@free.invalid> composa la prose suivante:
Amha, c'est quasiment infaisable via un lecteur de nouvelles.
Il faut passer via un serveur qui filtre correctement les spams.


--
Liste de serveurs offrant un accès gratuit à la hiérarchie FR.*
http://usenet.ovh/?article=faq_serveur_gratuit

Recherche d'article Usenet
http://usenet.ovh/?article=ual

Olivier Miakinen

unread,
Dec 10, 2023, 1:20:23 AM12/10/23
to
Bonjour,

Le 09/12/2023 23:00, yves a écrit :
>
> Il y a des tonnes de spam actuellement sur certains forums qui
> proviennent de google groups.

Je croyais annuler tous les spams demandant de télécharger des virus
(tous apparus après le 21 novembre), mais je m'aperçois qu'il y en a
sur Free qui n'étaient pas sur usenet-fr.net.

Je suis en train d'y remédier (en espérant ne pas le faire trop vite
pour ne pas faire chauffer la machine de yamo').

> Comment, avec gnus, donner un score bas aux articles qui ont ceci
> dans les en-têtes :
> Injection-Info: google-groups.googlegroups.com
> ?
>
> Je sais faire sur auteur, sujet, mais je ne sais pas faire sur ces
> en-têtes plus techniques.

Je suppose donc que tu ne peux pas filtrer sur les dernières lignes du
corps de l'article, ce qui est le plus efficace pour ce type de spam.
Mais est-ce que tu peux scorer sur le champ Message-ID ? Il est assez
facile d'y repérer la chaîne '@googlegroups.com>'.

Sinon tu peux aussi scorer sur '@gmail.com>' dans le champ From (auteur).

Attention, dans un cas comme dans l'autre il y a des auteurs légitimes,
alors ton score doit remonter pour ceux que tu veux lire.

--
Olivier Miakinen

Olivier Miakinen

unread,
Dec 10, 2023, 1:50:21 AM12/10/23
to
Le 10/12/2023 07:20, je répondais à yves :
>>
>> Il y a des tonnes de spam actuellement sur certains forums qui
>> proviennent de google groups.
>
> Je croyais annuler tous les spams demandant de télécharger des virus
> (tous apparus après le 21 novembre), mais je m'aperçois qu'il y en a
> sur Free qui n'étaient pas sur usenet-fr.net.
>
> Je suis en train d'y remédier (en espérant ne pas le faire trop vite
> pour ne pas faire chauffer la machine de yamo').

C'est fait. Il n'en reste que deux, un sur fr.rec.arts.sf et l'autre sur
fr.rec.sport.automobile, pour lesquels l'ordre d'annulation a déjà été émis
mais apparemment pas reçu par Free. Je pourrais les annuler en changeant
le MID du cancel, mais ça ne vaut peut-être pas la peine pour seulement deux
spams.

--
Olivier Miakinen

yamo'

unread,
Dec 10, 2023, 4:17:17 AM12/10/23
to
Salut,

Olivier Miakinen a tapoté le 10/12/2023 07:50:
> C'est fait. Il n'en reste que deux, un sur fr.rec.arts.sf et l'autre sur
> fr.rec.sport.automobile, pour lesquels l'ordre d'annulation a déjà été émis
> mais apparemment pas reçu par Free. Je pourrais les annuler en changeant
> le MID du cancel, mais ça ne vaut peut-être pas la peine pour seulement deux
> spams.

Pour information*, ce message <news:ul3n3b$2ust$1...@cabale.usenet-fr.net>
n'est pas arrivé sur free!

<http://al.howardknight.net/?ID=170219972200>

* Vu la complexité des serveurs free, il est peut-être accessible via un
autre serveur frontal...
--
Stéphane

yamo'

unread,
Dec 10, 2023, 4:18:15 AM12/10/23
to
Salut,

Olivier Miakinen a tapoté le 10/12/2023 07:50:
> C'est fait. Il n'en reste que deux, un sur fr.rec.arts.sf et l'autre sur
> fr.rec.sport.automobile, pour lesquels l'ordre d'annulation a déjà été émis
> mais apparemment pas reçu par Free. Je pourrais les annuler en changeant
> le MID du cancel, mais ça ne vaut peut-être pas la peine pour seulement deux
> spams.

Pour information*, ce message <news:ul3n3b$2ust$1...@cabale.usenet-fr.net>
n'est pas arrivé sur free!

<http://al.howardknight.net/?ID=170219972200>

* Vu la complexité des serveurs free, il est peut-être accessible via un
autre serveur frontal...



--
Stéphane
Posté depuis free qui n'a pas tous les posts.
<http://usenet-fr.yakakwatik.org/#serveurs>

yves

unread,
Dec 10, 2023, 4:39:08 AM12/10/23
to
Le Sun, 10 Dec 2023 07:20:21 +0100, Olivier Miakinen a écrit:

>> Il y a des tonnes de spam actuellement sur certains forums qui
>> proviennent de google groups.

> Je croyais annuler tous les spams demandant de télécharger des virus
> (tous apparus après le 21 novembre), mais je m'aperçois qu'il y en a sur
> Free qui n'étaient pas sur usenet-fr.net.

En fait, je ne lis pas les news sur Free (mais sur nntp.csiph.com). Je
réponds par Free, par contre.


>> Comment, avec gnus, donner un score bas aux articles qui ont ceci dans
>> les en-têtes :
>> Injection-Info: google-groups.googlegroups.com ?
>>
>> Je sais faire sur auteur, sujet, mais je ne sais pas faire sur ces
>> en-têtes plus techniques.
>
> Je suppose donc que tu ne peux pas filtrer sur les dernières lignes du
> corps de l'article, ce qui est le plus efficace pour ce type de spam.
> Mais est-ce que tu peux scorer sur le champ Message-ID ? Il est assez
> facile d'y repérer la chaîne '@googlegroups.com>'.
>
> Sinon tu peux aussi scorer sur '@gmail.com>' dans le champ From
> (auteur).



Merci pour l'idée, du coup je filtre sur Message-ID.


Mon mode opératoire :
- se placer sur un message de spam dans un forum quelconque (ex
fr.misc.droit)
- L i r p
- adaptation de la regexp
- visite du fichier ~/News/fr.misc.droit.SCORE
- copie du contenu de ce fichier fr.misc.droit.SCORE dans all.SCORE:

(("message-id"
("<.*@googlegroups\\.com>" -1000 nil r)))

- à la lecture des News, les spams apparaissent comme lus

- un appui sur la touche "x" les fait disparaitre de la vue (ou,
équivalent, un appel de la commande gnus-summary-limit-to-unread)

Il y a surement bien plus simple, mais je ne sais pas bien manier le
système de scoring.

> Attention, dans un cas comme dans l'autre il y a des auteurs légitimes,
> alors ton score doit remonter pour ceux que tu veux lire.


@+
--
Yves

Gilbert OLIVIER

unread,
Dec 10, 2023, 5:24:16 AM12/10/23
to
C'est le 9 décembre 2023, que llp a essayé de nous amuser en écrivant :

> Amha, c'est quasiment infaisable via un lecteur de nouvelles.

N'importe quoi ;-))))))

--
Gilbert
<https://maccafe.fr>

Eric Masson

unread,
Dec 10, 2023, 6:18:06 AM12/10/23
to
yves <yv...@free.invalid> writes:

'Lut,

> Comment, avec gnus, donner un score bas aux articles qui ont ceci
> dans les en-têtes :
> Injection-Info: google-groups.googlegroups.com
> ?

[Ctrl]-[h][i] Gnus/Scoring/Score File Format
4th element type "Extra" utilisé en lien avec gnus-extra-headers
Ce dernier permet d'ajouter des headers supplémentaires qui seront pris
en compte dans les règles de scoring.
Ne pas oublier ce point
https://lists.nongnu.org/archive/html/emacs-devel/2021-05/msg00718.html

--
B> Le jour où un bidet comprendra un tabouret,
B> l'ethnologie aura fait un grand pas.
Et ils eurent beaucoup de petites chaises percées.
-+-vt in: <http://www.le-gnu.net> - Lachaise Père & fils -+-

DV

unread,
Dec 10, 2023, 6:31:31 AM12/10/23
to
Gilbert OLIVIER a écrit ceci :

> C'est le 9 décembre 2023, que llp a essayé de nous amuser en écrivant :
>
>> Amha, c'est quasiment infaisable via un lecteur de nouvelles.
>
> N'importe quoi ;-))))))

Je ne vais pas expliquer comment, en plus de googlegroups, je filtre
intégralement son propre serveur, il ne s'en remettrait pas.

--
Denis

Serveurs de news et passerelles web : <http://usenet-fr.yakakwatik.org>
Lecteurs de news : <http://usenet-fr.yakakwatik.org/lecteurs-de-news.html>

llp

unread,
Dec 10, 2023, 9:55:04 AM12/10/23
to
Gilbert OLIVIER <gibert....@orange.fr.invalid> composa la prose suivante:

>C'est le 9 décembre 2023, que llp a essayé de nous amuser en écrivant :
>
>> Amha, c'est quasiment infaisable via un lecteur de nouvelles.
>
>N'importe quoi ;-))))))

Filtrer *tout* ce qui vient de google est possible mais pas souhaitable.

Filtrer *uniquement* le spam venant de google est quasiment infaisable
via un lecteur de nouvelles.


llp

unread,
Dec 10, 2023, 10:26:57 AM12/10/23
to
llp <l...@usenet.ovh.invalid> composa la prose suivante:

>Gilbert OLIVIER <gibert....@orange.fr.invalid> composa la prose suivante:
>
>>C'est le 9 décembre 2023, que llp a essayé de nous amuser en écrivant :
>>
>>> Amha, c'est quasiment infaisable via un lecteur de nouvelles.
>>
>>N'importe quoi ;-))))))
>
>Filtrer *tout* ce qui vient de google est possible mais pas souhaitable.
>
>Filtrer *uniquement* le spam venant de google est quasiment infaisable
>via un lecteur de nouvelles.

Petite précision: bien sur le scoring peu aider, mais cela va
générer des faux positifs. D'ou le "quasiment" impossible.
--
http://www.larousse.fr/dictionnaires/francais/coyote/20108?q=coyote#19997

llp

unread,
Dec 10, 2023, 10:28:22 AM12/10/23
to
Gilbert OLIVIER <gibert....@orange.fr.invalid> composa la prose suivante:

>C'est le 9 décembre 2023, que llp a essayé de nous amuser en écrivant :
>
>> Amha, c'est quasiment infaisable via un lecteur de nouvelles.
>
>N'importe quoi ;-))))))

Filtrer *tout* ce qui vient de google est possible mais pas souhaitable.

Filtrer *uniquement* le spam venant de google est quasiment infaisable
via un lecteur de nouvelles.

Bien sur le scoring peu aider, mais cela va générer des faux positifs.

Eric M

unread,
Dec 10, 2023, 10:38:39 AM12/10/23
to
Le 10/12/2023 à 16:28, llp a écrit :

> Filtrer *tout* ce qui vient de google est possible mais pas souhaitable.
>
> Filtrer *uniquement* le spam venant de google est quasiment infaisable
> via un lecteur de nouvelles.
>
> Bien sur le scoring peu aider, mais cela va générer des faux positifs.
> D'ou le "quasiment" impossible.

C'est quand même intéressant de la part de quelqu'un qui recommandait le
killfile pour ne plus voir les abuseurs.

llp

unread,
Dec 10, 2023, 11:41:04 AM12/10/23
to
Eric M <conano...@gmail.com> composa la prose suivante:
Mettre Martial ou Eric M. en killfile est très très facile.
Intercepter des centaines milliers de spam c'est autre chose et cela
doit-être fait au niveau des serveurs de newsgroups.

Erwan David

unread,
Dec 10, 2023, 11:47:34 AM12/10/23
to
yves <yv...@free.invalid> écrivait :
L (pour Lower)
h (pour header
z (pour substring)
Injection-Info: google-groups.googlegroups.com

De mémoire (notamment pour le z)

--
Les simplifications c'est trop compliqué

Eric M

unread,
Dec 10, 2023, 12:45:58 PM12/10/23
to
Le 10/12/2023 à 17:41, llp a écrit :

> Mettre Martial ou Eric M. en killfile est très très facile.

Visiblement vous avez toujours échoué avec moi, pourtant je change pas
souvent de from :)

> Intercepter des centaines milliers de spam c'est autre chose et cela
> doit-être fait au niveau des serveurs de newsgroups.

Merci de valider le miakibot.

Gilbert OLIVIER

unread,
Dec 10, 2023, 1:08:34 PM12/10/23
to
Le 10 décembre 2023 à 12:31, DV a poursuivi…

> Gilbert OLIVIER a écrit ceci :
>
>> C'est le 9 décembre 2023, que llp a essayé de nous amuser en écrivant :
>>
>>> Amha, c'est quasiment infaisable via un lecteur de nouvelles.
>>
>> N'importe quoi ;-))))))
>
> Je ne vais pas expliquer comment, en plus de googlegroups, je filtre
> intégralement son propre serveur, il ne s'en remettrait pas.
>
;-)

Un coup de pousse quand même s'il lit cette branche du fil, Noël
approche, c'est une période de bonté:

<http://yakakwatik.org/mc/documentation/harrar/index.html#f-filtres>

--
Gilbert
<https://maccafe.fr>

llp

unread,
Dec 10, 2023, 1:10:04 PM12/10/23
to
Eric M <conano...@gmail.com> composa la prose suivante:

Il est capable de faire cela ?
Tu me feras toujours rire.

nota: demande toi pourquoi e-s, ip2n2 ou moi rejetons directement
la majorité du spam à son arrivée sur le serveur et pas après.

Copie et suivi fuad

DV

unread,
Dec 10, 2023, 2:05:58 PM12/10/23
to
Gilbert OLIVIER a écrit ceci :

> Un coup de pousse quand même s'il lit cette branche du fil, Noël
> approche, c'est une période de bonté:
>
> <http://yakakwatik.org/mc/documentation/harrar/index.html#f-filtres>

Ajoutons à cela la possibilité, dans MacCafé, de récupérer un article
précédemment supprimé par un filtre, et l'on comprendra que le cas des
« faux positifs » n'est pas vraiment un problème.

yves

unread,
Dec 10, 2023, 2:50:06 PM12/10/23
to
Le Sun, 10 Dec 2023 17:47:32 +0100, Erwan David a écrit:

>> Il y a des tonnes de spam actuellement sur certains forums qui
>> proviennent de google groups.
>>
>> Comment, avec gnus, donner un score bas aux articles qui ont ceci dans
>> les en-têtes :
>> Injection-Info: google-groups.googlegroups.com ?
>>
>> Je sais faire sur auteur, sujet, mais je ne sais pas faire sur ces
>> en-têtes plus techniques.
>>
>> Pourriez-vous me fournir des pistes, ou des exemples ?
>>
>> @+
>
> L (pour Lower)
> h (pour header z (pour substring)
> Injection-Info: google-groups.googlegroups.com
>
> De mémoire (notamment pour le z)

Merci. Finalement, grâce aux informations de ce fil, j'en suis à :

M-i a (Alt-i a) (pour gnus-symbolic-argument a)
L (pour Lower)
i (pour Message-Id) s (pour substring)
@googlegroups.com>

ce qui écrit dans un fichier ~/News/all.SCORE

(("message-id"
("@googlegroups.com>" -1000 nil s)))

@+
--
Yves

yves

unread,
Dec 12, 2023, 6:20:34 AM12/12/23
to
Le 10 Dec 2023 19:50:04 GMT, yves a écrit:

> Merci. Finalement, grâce aux informations de ce fil, j'en suis à :
>
> M-i a (Alt-i a) (pour gnus-symbolic-argument a)
> L (pour Lower)
> i (pour Message-Id) s (pour substring)
> @googlegroups.com>
>
> ce qui écrit dans un fichier ~/News/all.SCORE
>
> (("message-id"
> ("@googlegroups.com>" -1000 nil s)))

Pour laisser passer un usager habituel de google groups, on peut faire
sur un de ces messages (en summary mode), qui a pour adresse habituel
usager....@gmail.com:

M-i a (Alt-i a) (pour gnus-symbolic-argument a)
I (pour Increase)
a (pour auteur, en fait le champ From) s (pour substring)
<usager....@gmail.com>


cette opération écrit dans le fichier ~/News/all.SCORE :

(("from"
("<usager....@gmail.com>" nil nil s))

Ce qui a pour effet de ramener le score des articles de
usager....@gmail.com à la normale.

Ceci dit, la campagne de spam semble s'être calmée (ou les
contre-mesures techniques ont été efficaces).

@+
--
Yves

Olivier Miakinen

unread,
Dec 12, 2023, 6:40:22 AM12/12/23
to
Le 12/12/2023 12:20, yves a écrit :
>
> Ceci dit, la campagne de spam semble s'être calmée (ou les
> contre-mesures techniques ont été efficaces).

Les deux.

Sur Free il n'y a que trois spams de ce type que miakibot n'a pas pu dégommer
(sur sf, genealogie et sport.automobile), plus un MMF sur enfants.bebes. Je
vais peut-être les finir à la main.

Et il n'y a plus aucun de ces spams depuis 24 h (hier à midi trente).


--
Olivier Miakinen

Eric M

unread,
Dec 12, 2023, 6:44:17 AM12/12/23
to
Le 12/12/2023 à 12:40, Olivier Miakinen a écrit :

> Sur Free il n'y a que trois spams de ce type que miakibot n'a pas pu dégommer
> (sur sf, genealogie et sport.automobile), plus un MMF sur enfants.bebes. Je
> vais peut-être les finir à la main.

Ne te fatigue par pour enfants.bebes, le groupe est officiellement
détruit.

<news:rmgroup-fr.misc.enfants....@news.trigofacile.com>

Olivier Miakinen

unread,
Dec 12, 2023, 6:46:51 AM12/12/23
to
Le 12/12/2023 12:40, Olivier Miakinen a écrit :
> Le 12/12/2023 12:20, yves a écrit :
>>
>> Ceci dit, la campagne de spam semble s'être calmée (ou les
>> contre-mesures techniques ont été efficaces).
>
> Les deux.
>
> Sur Free il n'y a que trois spams de ce type que miakibot n'a pas pu dégommer
> (sur sf, genealogie et sport.automobile), plus un MMF sur enfants.bebes.

Puis :

> Je vais peut-être les finir à la main.

C'est fait.

> Et il n'y a plus aucun de ces spams depuis 24 h (hier à midi trente).

Cette phrase étant ambigüe, je précise : on ne *reçoit* plus aucun de ces spams
depuis hier. Le robot n'a donc plus rien à nettoyer de ce côté là.


--
Olivier Miakinen

Olivier Miakinen

unread,
Dec 12, 2023, 7:08:28 AM12/12/23
to
Le 12/12/2023 12:44, Eric M a écrit :
>
>> Sur Free il n'y a que trois spams de ce type que miakibot n'a pas pu dégommer
>> (sur sf, genealogie et sport.automobile), plus un MMF sur enfants.bebes. Je
>> vais peut-être les finir à la main.
>
> Ne te fatigue par pour enfants.bebes, le groupe est officiellement
> détruit.

Haha ! Je comprends mieux pourquoi l'annulation est refusée !

J'étais trompé par le code d'erreur qui me disait « 435 Duplicate » au lieu
d'un « 4xx The group does not exist ».

Soit dit en passant, il y a donc un problème de mise à jour des groupes chez
Free. Même si l'article en question date d'avant la suppression, je n'aurais
pas dû pouvoir lire ce groupe il me semble :

<c4e0f67a-185e-4c6f...@googlegroups.com>
Bitcoin transfer/Top up, Clone cards, cashapp transfer, Payp[…]
Frank Kane <fk25...@gmail.com>
Sun, *08 Jan 2023* 18:53:21 -0800
*fr.misc.enfants.bebes*

> <news:rmgroup-fr.misc.enfants....@news.trigofacile.com>

Merci de ce rappel.

--
Olivier Miakinen

Olivier Miakinen

unread,
Dec 12, 2023, 8:25:06 AM12/12/23
to
Le 12/12/2023 14:02, M.V. a écrit :
>
>> Soit dit en passant, il y a donc un problème de mise à jour des groupes chez
>> Free.
>
> Plus précisément : sur certain(s) serveur(s) utilisé(s) par Free.
> Voir <news:ujo2ta$1u1k1$1...@dont-email.me>

Je vois. Merci.

--
Olivier Miakinen

yves

unread,
Dec 12, 2023, 1:15:54 PM12/12/23
to
Le Tue, 12 Dec 2023 12:40:20 +0100, Olivier Miakinen a écrit:

> Sur Free il n'y a que trois spams de ce type que miakibot n'a pas pu
> dégommer (sur sf, genealogie et sport.automobile), plus un MMF sur
> enfants.bebes. Je vais peut-être les finir à la main.

> Et il n'y a plus aucun de ces spams depuis 24 h (hier à midi trente).

Du coup, j'ai une autre interrogation à propos du "scoring" des
articles.

La hiérarchie fr.* comprend plus de deux cent forums.
Dont la plupart reçoivent très rarement des articles.

Il est désagréable, avec beaucoup de lecteurs de news, d'être abonné à
de nombreux groupes. Par exemple avec Pan, dès que la liste de groupes
dépasse la longueur de l'écran, ça devient désagréable (de mon point
de vue).

Gnus n'a pas cet inconvénient, on pourrait sans doute être abonné en
2023 à toute la hiérarchie fr.* sans que ça soit gênant, vu que les
groupes qui ne contiennent pas d'articles n'apparaissent pas à
l'écran.

Sauf les jours où sont postés les faq et chartes, etc.....

Pour ceux qui utilisent Gnus de cette façon, quelle solution avez-vous
adopté ces jours là pour éviter de voir réapparaître les 252 (sur
csiph) groupes , ou pour éviter d'avoir à aller supprimer chaque
article "à la main" ?

@+
--
Yves

DV

unread,
Dec 12, 2023, 1:36:58 PM12/12/23
to
yves a écrit ceci :

> Sauf les jours où sont postés les faq et chartes, etc.....
>
> Pour ceux qui utilisent Gnus de cette façon, quelle solution avez-vous
> adopté ces jours là pour éviter de voir réapparaître les 252 (sur
> csiph) groupes , ou pour éviter d'avoir à aller supprimer chaque
> article "à la main" ?

Je n'utilise pas Gnus, mais pour la hiérarchie fr.*, je pense que tu
devrais t'en sortir en créant quatre règles de scoring basées sur le
champ Subject, à partir des expressions suivantes :

[DOC]
[Charte]
[Conseils
FAQ]

(Pas de crochet ouvrant pour la dernière, afin de prendre en compte les
termes FAQ et MINI-FAQ).

yves

unread,
Dec 13, 2023, 12:47:53 PM12/13/23
to
Le Tue, 12 Dec 2023 18:36:56 -0000 (UTC), DV a écrit:

> Je n'utilise pas Gnus, mais pour la hiérarchie fr.*, je pense que tu
> devrais t'en sortir en créant quatre règles de scoring basées sur le
> champ Subject, à partir des expressions suivantes :
>
> [DOC]
> [Charte]
> [Conseils FAQ]
>
> (Pas de crochet ouvrant pour la dernière, afin de prendre en compte les
> termes FAQ et MINI-FAQ).

Merci, je vais tester ça (pour l'instant sur les quelques groupes
auxquels je suis abonné).

Ça donne ça au début de mon fichier ~/News/all.SCORE:

--8<---------------coupez ici-------------début------------->8---

(("subject"
("[Conseils" -1000 nil s)
("[Charte]" -1000 nil s)
("FAQ] " -1000 nil s)
("[DOC]" -1000 nil s)))

--8<---------------coupez ici---------------fin------------->8---

Pour m'abonner à tout, il faut que j'étudie l'impact sur le trafic
réseau, les temps de latences, les paramétrages optimum pour limiter
les deux précédents, etc..).


@+
--
Yves
0 new messages