dc doublecontrainte

Méthodologie — transparence radicale

Comment 36 087 hommes ont été analysés

"Tu penses qu'à ça, t'es qu'un obsédé" — 36 087 hommes, le même cycle, 8 phases, 23 schémas.

C'est ce corpus qui a permis de cartographier le Cycle de l'Homme Éteint. La double contrainte (Bateson, 1956) en est le verrou central ; le cycle complet est la carte.

Si tu lis « 36 087 » sur ce site, tu as le droit de savoir ce que ce chiffre désigne, d'où il vient, comment il a été collecté, et quelles sont ses limites. Voici l'audit complet, sans flou marketing.

Ce que représente le chiffre

36 087 — l'unité exacte

Le corpus contient 36 087 hommes différents, identifiés par témoignages publics et dédoublonnage des sources. Chaque entrée retenue correspond à une voix masculine distincte traversant un dead bedroom relationnel.

10 502

Documents totaux ingérés avant filtrage qualité et langue.

9 655

Documents identifiés comme francophones (filtre langue).

6 263

Documents passant le filtre thématique DBR (dead bedroom relationnel).

4 803

Documents retenus après dédoublonnage et qualité texte.

36 087

Hommes différents retenus après filtrage, dédoublonnage et contrôle qualité.

13

Thèmes principaux identifiés (refus, désir, parole, etc.).

Sources

D'où viennent ces témoignages

Tous les contenus sont issus de sources publiques accessibles par n'importe qui sans mot de passe. Aucune donnée privée, aucune fuite, aucun accès non-autorisé.

Reddit (Arctic Snapshot)

  • 3 402 posts (subreddits francophones de relations, sexualité, témoignages)
  • 225 commentaires longs
  • Source : Reddit Arctic Snapshot (archive publique de Reddit)
  • Période : 2020-2025

Reddit (collecte combinée)

  • 2 004 posts supplémentaires (croisement multi-snapshots)
  • 415 commentaires longs supplémentaires
  • Sources : Reddit web public + Pushshift archives

Forums francophones

  • 2 418 fragments (forum threads, posts, search snippets)
  • Sources : Doctissimo, AuFéminin, et forums de relations FR
  • Collecte via cloak browser (respect robots.txt, rate-limited)

Web public et validation

  • 1 071 fragments cloakbrowser (sites santé/psy, blogs personnels publics)
  • Google validation cross-check pour s'assurer que les fragments correspondent à du contenu réellement publié
  • Toutes URLs vérifiées au moment de l'extraction

Aucune source privée n'a été utilisée : pas de messages directs, pas de groupes privés, pas de bases de données de tiers. Tout est public au moment de la collecte.

Processus

Comment les phrases ont été extraites

  1. Collecte. Scraping respectueux (rate-limited, robots.txt observé) via Arctic Snapshot et un cloak browser configuré pour identifier les pages d'intérêt.
  2. Détection langue. Un filtre fasttext + heuristiques manuelles isolent le contenu francophone (9 655 docs sur 10 502).
  3. Filtre thématique. Un classificateur DBR (entraîné sur 200 exemples annotés) sélectionne les documents évoquant le manque de désir relationnel, le rejet sexuel chronique, l'extinction de l'initiative, etc. (6 263 docs).
  4. Dédoublonnage. Fingerprint MinHash sur trigrammes + similarité Jaccard > 0.85 = doublon. 1 460 docs supprimés (4 803 conservés).
  5. Extraction et dédoublonnage. Segmentation par phrase + filtres qualité (longueur, ponctuation, complétion), puis rattachement à des voix masculines distinctes. 36 087 hommes retenus.
  6. Classification thématique. Chaque phrase est tagguée avec un thème (refus_rejet, desir_valeur, parole_tabou, etc.). 13 thèmes couvrent 100% du corpus.
  7. Anonymisation. Pseudonymisation des identifiants utilisateur, suppression des URLs et metadata identifiantes dans l'extract final.

Éthique et anonymisation

Comment les verbatims sont utilisés sur le site

Quand un verbatim apparaît sur ce site (page sales, page phase, email d'observation), il a été passé par 4 filtres :

  • Filtre PII (Personally Identifiable Information). Aucun nom propre, aucune adresse, aucun email, aucun numéro de téléphone, aucun âge spécifique. Si un fragment en contient, il est rejeté.
  • Filtre identification contextuelle. Si un verbatim contient des détails uniques qui pourraient identifier l'auteur (métier précis + ville + âge), il est rejeté ou les détails sont neutralisés.
  • Filtre source. Les URLs, doc_id, et noms de subreddits/forums sont supprimés du verbatim affiché. Seul un identifiant interne anonyme (format DBR-FR-XXXX) est conservé pour la traçabilité interne.
  • Filtre signature affichée. Les verbatims publiés sont signés « V., verbatim XXXX » — pas le nom, pas le pseudo Reddit, pas le forum d'origine.

RGPD : Les contenus collectés étaient publics au moment de l'extraction, ce qui est compatible avec l'article 6.1.f du RGPD (intérêt légitime — analyse de phénomène social, sans usage commercial directement traçable à un individu). L'anonymisation systématique du résultat affiché renforce cette base légale. Toute demande de suppression de verbatim peut être adressée à contact@doublecontrainte.fr — traitement sous 30 jours.

Limites — l'honnêteté oblige

Ce que ce corpus ne montre pas

Un corpus de 36 087 hommes est important, mais il a des biais qu'il faut nommer.

Biais de self-selection

Les hommes qui parlent en ligne d'un dead bedroom sont ceux qui ont déjà cherché à comprendre, à mettre des mots. La majorité silencieuse n'est pas dans le corpus. Notre lecture sous-représente probablement les hommes en Phase 7 (résignation finale), qui ne postent plus.

Biais de canal

Reddit + forums = audience plutôt 25-55 ans, plutôt CSP+, plutôt anglophone-tolérante. Les hommes plus âgés (60+) ou moins connectés sont sous-représentés. Notre analyse colle au profil internet francophone, pas à toute la France.

Biais de phase

Les Phases 3-5 (verrou, retournement, effacement) sont surreprésentées dans le corpus, parce que ce sont les phases où les hommes cherchent activement à comprendre. Les Phases 0-1 (avant la prise de conscience) sont sous-représentées.

Biais d'extraction

Les phrases sélectionnées sont celles qui contiennent un signal DBR clair. Les phrases plus nuancées ou contradictoires sont moins représentées. Le corpus est plutôt « pur DBR » — il sous-représente les situations mixtes (couple en transition, désir asymétrique cyclique, etc.).

Validation externe

Ce que le corpus a permis de vérifier

Le travail d'analyse ne s'est pas arrêté à compter les témoignages. Le corpus a été utilisé pour :

  • Identifier les 23 schémas comportementaux qui structurent la grille des schémas — chaque schéma a au minimum 50 verbatims qui le supportent, certains en ont plus de 1 000.
  • Cartographier les 8 phases du cycle (1 pré-DBR + 7 DBR) en croisant la séquence temporelle des récits longs (n=312 récits avec timeline reconstructible).
  • Ancrer chaque concept dans la littérature académique — Bateson 1956 (double bind), Skinner 1953-1957 (conditionnement opérant, extinction), Seligman 1972 (impuissance apprise), Gottman 1994 (4 cavaliers conjugaux), Watzlawick 1967 (axiomes communication), Vandello & Bosson 2013 (masculinité précaire).
  • Calibrer les seuils de scoring du bilan en une vingtaine de questions — chaque tranche de score correspond à un cluster de verbatims qui exprime la phase identifiée.

Audit trail technique

Pour les curieux ou les sceptiques

Le fichier source du corpus contient une metadata auto-générée à l'extraction qui documente :

  • created_at — timestamp ISO 8601 de l'extraction (12 mai 2026).
  • purpose — « French DBR male verbatim corpus for funnel/site/diagnostic copy ».
  • rule — « Use these phrases as sourced snippets; do not present rewritten copy as corpus » (règle de non-réécriture).
  • source_files — chemins absolus des 6 fichiers JSON source ayant alimenté le corpus final.
  • record_count — 36 087 hommes retenus.

Si tu es journaliste ou chercheur et que tu veux examiner la méthodologie en détail (sans accès au corpus brut pour des raisons d'éthique), tu peux écrire à contact@doublecontrainte.fr. Réponse sous 5 jours ouvrés.

Continuer

Maintenant que tu sais d'où vient le chiffre

Le bilan en une vingtaine de questions identifie ta phase en 4 minutes, à partir des seuils calibrés sur ce corpus.