Carte SNCF à 1,95 euro ? Anatomie d’une arnaque

Carte SNCF à 1,95 euro ? Anatomie d’une arnaque

Des réductions alléchantes pour des cartes de voyage à 1,95 euro fleurissent sur Facebook et Instagram sous forme de publicités sponsorisées. En suivant les traces numériques de ces publications, nous pouvons mettre à jour un vaste réseau d’arnaques à l’international. Une enquête réalisée par des participants à la formation OpenFacto Niveau 1 durant le mois de juin 2023.

Célia Mercier, Stéphanie Ladel et Poline Tchoubar

NB: Certains sites web mentionnés dans cette enquête servent à mettre en œuvre des arnaques en ligne. Pour des raisons de sécurité, il est recommandé de ne pas les visiter.

« La SNСF fait une promotion et propose une cаrtе de vоyаgе illimités pendant un an, pour seulement €1,95 !» : des messages comme celui-ci ont été publiés par dizaines au début de l’été sur Facebook. Ils sont apparus sous forme de publicités sponsorisées dans notre fil d’actualités, accompagnés d’une photo d’un train SNCF prêt à partir, avec une carte de réductions Max Actif+ au premier plan. Dans les commentaires, des utilisateurs se veulent rassurants : « Pour être honnête, je ne m’attendais pas à obtenir une carte d’abonnement, mais cinq jours plus tard, j’en avais une !».

Publication sur Facebook proposant une carte de réduction SNCF à 1,95 euro.

Si la photo attire l’œil, le prix interpelle les internautes. Une carte SNCF coûte en moyenne une cinquantaine d’euros. Mais un simple coup d’œil permet de remarquer que quelque chose cloche : la page qui poste l’annonce, du nom de « Cartes de voyage à prix réduit », ne ressemble en rien à la page officielle de la SNCF. Une rapide recherche sur Google permet de voir qu’une offre frauduleuse similaire avait été mise à jour par la presse en février 2023. La SNCF affirme n’avoir aucun lien avec ces offres, et indique en mai dernier avoir déposé plainte.

Entre-temps, la page Facebook qui a publié l’offre ci-dessus a été supprimée. Néanmoins, ces offres continuent de pulluler sur les réseaux sociaux. En collectant des informations à partir de cette publication Facebook, nous avons pu mettre à jour un vaste réseau d’arnaques, reliées entre elles par une galaxie de faux profils Facebook. Cet article décrit notre méthodologie pour reconnaître des arnaques en ligne, et savoir qui se cache derrière.

Des profils montés de toutes pièces

En regardant de plus près la publication suspecte sur Facebook, on peut repérer facilement plusieurs signes qui suggèrent une arnaque. Tout d’abord, nous nous sommes intéressés à la photo de l’annonce. Une recherche d’image inversée sur Google, Bing, Yandex ou TinEye permet de voir qu’il s’agit d’un photomontage : l’image originale du train en gare avec une foule de voyageurs avait déjà été publiée auparavant dans le journal L’Aisne nouvelle en janvier 2023, tandis que la main tenant la carte de réduction ont été ajoutées a posteriori.

À gauche, une photo publiée dans L’Aisne nouvelle en janvier 2023. À droite, l’image modifiée publiée dans l’annonce frauduleuse sur Facebook.

Les commentaires sous l’annonce frauduleuse semblent crédibles à première vue. Les commentateurs interagissent entre eux : certains demandent s’il s’agit d’une vraie promotion, d’autres expliquent qu’ils ont d’abord cru à une arnaque, mais qu’ils ont finalement bien reçu le lot en question, ou bien qu’ils ont vérifié auprès de la SNCF. Certaines réponses sont même accompagnées de photos de billets de train, que les utilisateurs auraient reçu gratuitement grâce à la carte de réduction. Pourtant, nous remarquons rapidement qu’il y a toujours à peu près le même nombre de likes sous chaque commentaire. Les mêmes profils reviennent sans cesse : Annie Mato, Auriane Besiade, Pierre Morice…

Les commentaires sous la publication d’arnaque sont toujours likés par les mêmes profils.

Ces profils ont tout pour être crédibles : de nombreuses photos, selfies, photos de groupes, des centaines de followers, des publications historiques qui remontent à plusieurs années. Ce n’est pourtant qu’une illusion : lorsque l’on regarde les publications les plus anciennes, on remarque une petite horloge à côté de la date de publication. Cela signifie que le post a été antidaté. Il suffit de passer la souris sur l’horloge pour voir la vraie date de publication apparaître : sur le profil d’Auriane Besiade, par exemple, son premier post qui semble dater du 3 septembre 2022 a en fait été publié le 15 mars 2023.

Ces photos sur le profil d’Auriane Besiade semblent avoir été publiées le 3 septembre 2022. En passant la souris sur l’horloge, on peut voir qu’en réalité, elles ont été publiées le 15 mars 2023 et ont été antidatées.

Non seulement des publications d’Auriane Besiade ont été antidatées pour donner l’impression d’un profil facebook ancien et authentique, mais certaines de ses photos ont même été volées. On peut s’en rendre compte en effectuant une recherche d’image inversée à partir de sa photo de profil. Sur Google Images, on trouve la même photo dans un article du journal italien New Entry Magazine sur la photographe Giada Pernechele.

La photo du profil d’Auriane Besiade (à gauche) vient en fait d’un article sur la photographe italienne Giada Pernechele (à droite).

À y regarder de plus près, la page Facebook « Cartes de voyage à prix réduit », qui a publié l’annonce frauduleuse, présente aussi plusieurs signes suspects. Le post d’arnaque est sa seule publication. En guise de description, un simple lien hypertexte vers un site qui ne ressemble en rien au site de la SNCF. Dans l’onglet « Page transparency », on apprend que la page a été créée très récemment, le 1er juin 2023, et que ses administrateurs ne sont pas localisés en France mais… en Ukraine ! Selon Facebook, le pays de résidence des administrateurs est déterminé par « les informations et l’activité d’une personne sur les produits Facebook, y compris l’emplacement indiqué sur son profil Facebook, et les informations relatives à l’appareil et à la connexion. ». Ces multiples pages semblent donc être alimentées depuis l’Ukraine.

Capture de la page Facebook qui a posté l’offre frauduleuse.
Dans l’onglet « Page transparency » de la page Facebook « Cartes de voyage à prix réduit », on peut voir que la page a été créée le 1er juin 2023 et qu’elle est administrée depuis l’Ukraine.

L’onglet “Page transparency” permet également de voir les anciens noms d’une page Facebook. Grâce à celà, nous avons remarqué que plusieurs pages qui faisaient la promotion du faux pass SNCF ont changé de nom quelques semaines après le début de notre enquête. Ainsi, une page qui portait le nom de “Cartes de voyage en France” est devenue “Tickets for travel” en anglais le 29 juin 2023, et a commencé à faire la publicité d’une carte de réduction pour des trains au Canada.

Sur l’onglet “Page Transparency”, on peut voir que la page “Cartes de voyage en France” a changé de nom pour devenir “Tickets for travel”.

Une multitude de pages qui publient des publicités sponsorisées

La page Facebook « Cartes de voyage à prix réduit » est loin d’être la seule à proposer des cartes de réduction à 1,95 euro. En cherchant le nom de la page dans la barre de recherche de Facebook, on tombe sur des dizaines de pages au nom similaire, dont certaines diffusent la même offre frauduleuse. En-dessous, on retrouve les mêmes commentaires que sous le post d’origine, parfois postés par les mêmes faux profils. Ces pages ont toutes été créées à partir de février 2023, et 16 d’entre elles sont administrées depuis l’Ukraine.

Au total, nous avons recensé 15 pages qui relaient l’offre frauduleuse (voir liste en Annexe 1). Nous avons aussi repéré 12 autres pages qui n’ont encore rien posté pour le moment, mais qui ressemblent en tous points aux pages d’arnaque : un nom générique, une image de train SNCF en photo de couverture, et une unique url en guise de description. Ces pages pourraient être utilisées à l’avenir pour diffuser des arnaques.

Certaines de ces pages diffusent l’offre frauduleuse sous forme de publicité sponsorisée. Cette fonctionnalité permet à un administrateur de payer l’entreprise Meta (maison-mère de Facebook et Instagram) pour promouvoir une de ses publications dans les fils d’actualité d’un maximum d’utilisateurs. Si l’on cherche dans la bibliothèque publicitaire de Meta les mots-clés « SNCF 1.95 euro », on trouve par exemple une page du nom de « Billets de train à prix réduit », qui diffuse la même annonce sous forme de publicité sponsorisée. Nous avons effectué cette recherche le 6 juillet 2023. Si vous reproduisez l’expérience, vous aurez sans doute affaire à une autre page, car ces campagnes sont éphémères : les pages qui les promeuvent varient, et de nouvelles pages viennent instantanément remplacer celles qui auraient été supprimées suite à un signalement.

Descriptif de la campagne de publicité sponsorisée sur Meta Ad Library, consultée le 6 juillet 2023.

L’annuaire liste les plateformes où la publicité est promue : on reconnaît les logos de Facebook, Instagram, et Messenger, ainsi qu’un quatrième insigne moins connu – il s’agit de « Meta Audience Network ». Cette mention indique que la publicité est également promue sur les autres applications et sites où surfent les utilisateurs de Facebook et Instagram, grâce aux cookies qui pistent leur navigation. Autrement dit, après être passé sur Facebook, vous pourrez voir une publicité pour la fausse carte Max Actif+ sur les autres sites que vous consultez.

Sur Instagram, on retrouve ainsi la même publicité, avec la mention « sponsorisé », indiquant que l’administrateur de la page a payé pour que sa publication soit mise en valeur.

L’offre frauduleuse de carte de réduction Max Actif+ est diffusée sous forme de publicité sponsorisée sur Facebook et Instagram, le 5 juillet 2023.

Un vaste réseau d’arnaques reliées par une galaxie de faux comptes

Les faux profils qui interagissent avec différentes offres frauduleuses ne se contentent pas de vanter les mérites de la carte SNCF à 1,95 euro. Parmi les pages qu’ils suivent, on retrouve d’autres possibles pages d’arnaque : parmi les likes d’Auriane Besiade, par exemple, on voit une autre page « Billets de train à prix réduits », ainsi qu’une page en Allemand proposant une réduction pour un pass annuel de la Deutsche Bahn à 1 euro.

Le faux profil « Auriane Besiade » suit d’autres pages possiblement frauduleuses.

Grâce au logiciel Gephi, nous avons cartographié les faux profils qui interagissent avec les offres de cartes SNCF à 1,95 euro, ainsi que les autres pages qu’ils suivent. Nous sommes partis de dix publications proposant de fausses cartes SNCF (en vert sur le graphique). Nous avons listé tous les profils qui ont commenté ces publications (en orange), ainsi que les autres pages que ces profils ont likées (en violet). Nous avons ainsi identifié des dizaines d’autres pages de possibles arnaques, proposant tour à tour des appareils électroménagers, des réductions dans des supermarchés, ou des appareils électroniques. Cette infographie montre les publications Facebook de fausses promotions SNCF (en vert), les profils qui ont commenté ces publications (en orange) et les autres pages d’arnaques auxquelles ils sont abonnés (en violet).

En continuant les recherches, nous avons identifié des dizaines de pages Facebook usurpant l’identité et les logos de marques connues : SNCF, Amazon, TotalEnergies, Samsonite, Monsieur Cuisine Connect, Dyson, iPhone, La Poste… et disant proposer toutes sortes de produits à 1,95 euro : pass Navigo, objets high tech, électroménager, cartes de carburant, places pour des parcs d’attraction… 

Ce réseau déploie ses pages en plusieurs langues (anglais, français, espagnol, hongrois, tchèque, finlandais, hébreu, portugais…), ciblant divers pays européens, Israël, les Etats-Unis et le Canada. L’arnaque SNCF a été par exemple déclinée au Canada avec Via Rail, en Espagne avec Renfe, en Allemagne avec Deutsche Bahn.

Par exemple, en plus de l’arnaque SNCF, le faux profil d’Auriane Besiade a aussi commenté une page en hébreu sur une promotion pour un aspirateur de la marque Dyson :

Le faux profil « Auriane Besiade » a aussi commenté en hébreu une offre pour un aspirateur Dyson.

Une société portugaise au sein d’une nébuleuse de sites signalés pour fraude

Qui sont les bénéficiaires de ce vaste réseau d’arnaques sur les réseaux sociaux ? Pour répondre à cette question, notre point de départ a été une information cruciale donnée par le journal Le Monde dans un article du 16 mai 2023 intitulé « Arnaque de la carte de train à 1,95 euro : la SNCF dépose plainte »

Pour en savoir plus sur cette arnaque, une journaliste du Monde a choisi de commander une carte Max Actif+. Elle a été invitée à participer à un jeu concours en cliquant sur des icônes de cadeaux. Une fausse loterie, où la fausse carte SNCF surgit de la troisième icône. Elle décrit ce qu’il s’est passé ensuite : «Nous avons donné nos coordonnées et payé en ligne. La somme de 1,95 euro a été débitée de notre compte, au profit de “SWETIDES.COM +3513 à Lisbonne”. Quelques jours plus tard, c’est la somme de 49,80 euros qui a été débitée au profit de cette société. » Mais la carte ne sera bien sûr jamais reçue. 

Nous avons voulu en savoir plus sur « swetides.com », destinataire du prélèvement bancaire. Il s’agit d’un site web proposant des “services de gestion simplifiée d’abonnements”. Sur la page d’accueil, on peut voir un numéro de téléphone, commençant par +351 3 (+351 étant l’indicatif téléphonique du Portugal), ce qui correspond aux chiffres indiqués par le destinataire du prélèvement bancaire. La page “FAQ” liste des questions comme “Comment annuler mon abonnement ?”, “Pourquoi un prélèvement “swetides.com” figure dans mon relevé bancaire ?”. En bas de page est noté le nom d’une entreprise portugaise : Paginas Louvaveis, et son numéro d’enregistrement : 516676423.

Captures d’écran du site swetides.com.

Nous retrouvons la société Paginas Louvaveis dans le registre du commerce du Portugal. Son activité est la vente par correspondance. À sa création, elle était entièrement détenue par un certain Alexandru Borsci. Sur Linkedin, un utilisateur du nom d’Alexandru Borsci indique diriger Paginas Louvaveis depuis décembre 2021 : “J’ai participé dans tous les aspects du développement des affaires depuis l’analyse de marché et les finances jusqu’aux opérations et au marketing,” écrit-il sur sa page. Nous retrouvons son profil Facebook, où il dit vivre à Lisbonne et venir de Chisinau en Moldavie. A-t-il joué un rôle dans l’arnaque à la fausse carte SNCF ? L’enquête en sources ouvertes ne nous permet pas de le savoir.

Capture de la page Linkedin d’Alexandru Borsci, consultée le 5 juillet 2023.

Swetides.com n’est pas le seul site lié à l’entreprise portugaise. Une nébuleuse de sites mentionnent Paginas Louvaveis en bas de leur page d’accueil. En tapant le numéro d’enregistrement de Paginas Louvaveis entre guillemets dans Google, le moteur de recherche fait apparaître de nombreux sites ayant la même structure, la même mise en page avec les mêmes couleurs, et le même bas de page comportant le numéro d’enregistrement de Paginas Louvaveis. Certains utilisent même le même favicon, petite image personnalisable qui apparaît à gauche du nom du site dans les résultats de recherche.

Sur cette capture des résultats de recherche Google, on voit que plusieurs sites mentionnent le numéro d’enregistrement de Paginas Louvaveis. De plus, certains utilisent la même image en guise de favicon.

Le numéro d’enregistrement de Paginas Louvaveis revient dans les mentions légales de dizaines de sites internet : des sites de rencontre, d’abonnement à des livres numériques… Sur 41 sites repérés, 13 font l’objet de signalements d’arnaques : des utilisateurs se plaignent de prélèvements bancaires mensuels dont ils ne connaissent pas l’origine et qu’ils ne parviennent pas à arrêter. Croyant payer 1,95 euro pour une promotion, les victimes sont en réalité abonnées à leur insu à des livres numériques, du coaching, des sites de rencontre.Les signalements d’arnaques nous indiquent la réelle fonction des sites liés à Paginas Louvaveis : il s’agit de fausses loteries pour gagner un téléphone, un bon d’achat pour des vêtements, ou encore … un pass SNCF à 1,95 euro. Cette fois-ci, il est proposé par un autre site : beinstop.com, avec exactement la même mise en page que swetides.com.

Capture d’écran d’un signalement d’arnaque sur le signal-arnaques.com concernant le site beinstop.com. Un utilisateur affirme que ce site propose de fausses promotions SNCF.
A gauche, le site swetides.com, indiqué dans le libellé du prélèvement bancaire pour la fausse carte SNCF commandée par Le Monde. A droite, le site beinstop.com, qui ne diffère que par ses informations de contact.

En continuant nos recherches, nous remarquons un curieux schéma de facturation croisée. En cherchant le nom du site “beinstop.com” sur Google, nous trouvons qu’il a été mentionné sur un autre site du nom de  beinstatop. Il se présente en tant que site d’abonnement à une plateforme et à des livres numériques de conseils pour améliorer sa popularité et son marketing sur Instagram, pour 85,80 euros par mois, avec une période d’essai de 5 jours à 1,95 euro. Le mot-clé “beinstop.com” apparaît dans les conditions de vente de l’abonnement : il est indiqué que les frais pourront apparaître sur la facture comme “lengfee.com +35924930126 beinstatop.com pxbeinstatop.com beinstop.com geekfez.com beistop.com+33974591492”. Une ribambelle de sites, tous semblables, peuvent donc apparaître sur la facture du prétendu abonnement.

Capture du site beinstatop.com, qui liste tous les autres sites Internet dont le nom peut figurer dans la facture de l’abonnement.

Le système d’abonnement avec renouvellement par accord tacite dont sont victimes les internautes apparaît sur cette page de conditions générales de vente (CGV). Après une “période d’essai de 5 jours à 1,95 euros”, une clause de reconduction tacite prévoit des prélèvements de 49,80 euros par mois si l’utilisateur ne s’est pas désabonné. Ces conditions de vente sont souvent dissimulées aux victimes au moment du paiement. Ce type de fraudes aux abonnements cachés a explosé au cours des derniers mois, comme alertait le site Signal-Arnaques en janvier 2023.

La page indique également que ces sites sont exploités par une nouvelle entreprise : “Bookstorm Limited , un marchand de e-commerce situé en Bulgarie“. En cliquant sur les conditions générales de vente, on trouve son numéro d’enregistrement, son adresse, et le nom de son directeur : Sergey Telpis.

Un réseau de facturation croisée apparaît, qui révèle les interconnexions entre Paginas Louvaveis et de nombreuses autres sociétés. Nous reproduisons les mêmes recherches concernant d’autres sites liés à Paginas Louvaveis, et identifions ainsi deux autres entreprises : Ideas Market International KFT, basée en Hongrie, et Enigma Frenetico, basée au Portugal. Comme Paginas Louvaveis, ces trois nouvelles sociétés en Bulgarie, Hongrie et Portugal sont aussi mentionnées en bas de page de nombreux sites web identiques. Et elles aussi sont l’objet de signalements d’arnaques.

Un réseau tentaculaire lié à de multiples escroqueries

Une adresse mail est régulièrement signalée dans les plaintes liées aux sites de Paginas Louvaveis et des trois sociétés qui lui sont liées : « ». C’était le cas dans le signalement du site beinstop que nous avions observé plus haut :

Capture d’écran d’un signalement d’arnaque sur signal-arnaques.com concernant le site beinstop.com, avec l’adresse mail « ».

Selon le site Domaintools, ce nom de domaine a été créé le 20 juin 2018. Les informations sur la personne qui a enregistré le nom de domaine (le registrant) ont été anonymisées par l’utilisation d’intermédiaires : WhoisGuard INC, basé au Panama, entre 2018 et 2020, et Privacy service provided by Withheld for Privacy ehf, basé en Islande, depuis 2021. L’historique des enregistrements, obtenu par WhoisXMLAPI, montre que les informations sur le propriétaire du nom de domaine ont été modifiées 11 fois depuis 2018, dont déjà trois fois en 2023 : le 21 mai, le 21 juin et le 12 juillet. 

Selon une information du site d’intelligence financière Fintelegram, que nous n’avons pas été en mesure de corroborer, un réseau letton serait à l’origine des escroqueries liées à greatoffers.email. 

En recherchant des escroqueries signalées avec le mot clé « », notamment sur le site « Signal Arnaques », il est possible de réaliser un mapping plus vaste d’autres sociétés connectées au réseau initialement identifié autour de Paginas Louvaveis. Des sociétés qui se trouvent à Chypre, en Pologne, en Angleterre, en Espagne, au Portugal, en Slovénie… La recherche effectuée pour l’enquête n’est cependant pas exhaustive et au-delà de la vingtaine de sociétés identifiées, d’autres sont certainement liées à ce réseau.

Malgré les signalements, les offres frauduleuses de cartes SNCF à 1,95 euro continuent à être diffusées par le biais de publicités sponsorisées sur Facebook et Instagram. En mars 2023, l’entreprise Meta, maison-mère de ces deux réseaux sociaux, a publié une nouvelle méthode de lutte transversale contre les principales menaces en ligne, des campagnes de manipulation à l’espionnage en passant par les arnaques et la pédopornographie. Basée sur la collaboration avec différentes plateformes, cette stratégie vise à identifier des points communs dans les modes opératoires des arnaqueurs en ligne. L’étude de cas sur l’arnaque aux fausses offres de pass SNCF en constitue un exemple.

L’article a fait l’objet d’une modification le 17/09/2023 : la cartographie des entreprises (annexe 2) a été mise à jour.

Annexe 1 : Liste des pages d’arnaque repérées

Annexe 2 : Cartographie des entreprises identifiées

Des journalistes syriens en exil formés à l’OSINT par OpenFacto – Workshop SIRAJ, 2ème édition

Des journalistes syriens en exil formés à l’OSINT par OpenFacto – Workshop SIRAJ, 2ème édition

Les journalistes ont pu échanger avec les formateurs et prendre en main la méthodologie OSINT conçue par OpenFacto.

Ce week-end s’est tenu à Paris la seconde édition de l’atelier d’OSINT entre OpenFacto et SIRAJ mené par Liselotte Mas, présidente d’OpenFacto, et secondée de Sébastien Bourdon, vice-président. Une dizaine de journalistes syriens et libanais en exil en Europe ont répondu présent pour se former aux techniques d’investigation en ligne et à la méthodologie conçue par OpenFaco.

En plus de modules sur la mise en place du poste de travail, la vérification des images, les recherches en ligne, la géolocalisation, ou le tracking des avions et bateaux, les journalistes ont pu échanger autour de leurs travaux respectifs.

Mohammed Bassiki a présenté l’enquête de SIRAJ sur les filières d’exportation de phosphate syrien vers l’Europe, publié sur le site de SIRAJ et contenant notamment toute une partie sur le tracking des bateaux ayant transporté ce matériau.

Les journalistes Mohammed Bassiki, fondateur de SIRAJ, et Loujein Haj Youssef rédactrice-en-chef de Radio Rozana, ont ainsi complété un programme dense pour présenter une enquête collaborative récompensée et les fondamentaux du podcast dans le contexte politique moyen-oriental.


Lujain Hal Yusef (radio Rozana) a présenté plusieurs podcasts d'investigation et différentes techniques de narration pour les améliorer.
Loujein Haj Youssef a présenté plusieurs podcasts d’investigation et différentes techniques de narration pour les améliorer.

Open Facto espère avoir contribué à affuter méthodologiquement et outiller efficacement les journalistes syriens et libanais qui lui ont fait l’honneur et le plaisir de répondre à cette invitation, nous avons pour notre part beaucoup appris à leur contact durant ces deux journées.


Issus de formations diverses et résidant un peu partout en Europe, les journalistes ont pu apprendre mais aussi échanger autour de leurs pratiques respectives.


Cette collaboration débutée en 2019 continue de grandir, elle promet des fructueuses investigations. Malgré le drame que vit la Syrie, la détermination de ces journalistes pour documenter les exactions du régime de Bachar el-Assad et les complaisances d’acteurs étrangers est intacte.

Ce type de projet, financé et organisé à 100% par l’association, n’est possible que grâce à vos dons, adhésions et participations à nos formations. Si vous en avez l’envie et la possibilité, vous pouvez contribuer à nos activités en cliquant ici. Un grand merci à Fugazi, membre de l’association, pour avoir assuré la logistique et l’organisation de cet événement, ainsi que pour les photos.

Pivoter avec des éléments techniques – les MOOCs du Hamas

Pivoter avec des éléments techniques – les MOOCs du Hamas

Cet article a été réalisé sur la base du travail de recherches en sources ouvertes des participants à la dernière formation généraliste OpenFacto fin juin 2019. Elle est le fruit des deux jours de formation et d’un travail collaboratif de groupe de fin de stage sur un sujet non résolu.

Le Hamas lance une campagne de levée de fonds bitcoin

Le 31 janvier 2019, les Brigades d’Al Qassam, la branche armée du Hamas considérée comme un groupe terroriste par les Etats-Unis, l’UE et d’autres pays, lancent une campagne de soutien de ses forces en bitcoin avec la promotion sur ses supports de communication de l’adresse suivante : 3PajPWymUexhewHPczmLQ8CMYatKAGNj3y.

Quelques visuels de la campagne de levée de fonds du Hamas
Le site donne à présent une adresse BTC unique aux sympathisants pour effectuer leurs transferts

Cette campagne est notamment étudiée en détail par plusieurs analystes OSINT comme Ghost Security Group qui analyse le circuit crypto en février 2019.

Analyse graphique par @RaijinRising de Ghost Security Group

Bellingcat en fera un tutorial sur la recherche sur les crypto-monnaies en utilisant le cas spécifique des Brigades Al Qassam en mars 2019.

Rebondir du Hamas à un MOOC: l’adresse bitcoin

En réalisant une simple recherche de l’adresse bitcoin des Brigades Al Qassam sur le moteur de recherche Google, on découvre parmi les résultats le site internet d’une école islamique en ligne : la Islamic Digital School/ Ahmed Yassine Institute. L’adresse BTC retrouvée sur le site pour faire des dons à l’école, semble être la même que celle utilisée par les Brigades Al Qassam, affiliée au Hamas.

Visuel que l’on retrouve à cette adresse  et archive

Pivoter à partir des éléments techniques

Avec comme point de départ un site internet, on peut observer et rechercher plusieurs éléments afin de trouver de nouveaux indices pour rebondir et pivoter sur la suite.

On commence donc par observer la conception du site en se demandant si la qualité est au rendez-vous, si on comprend à quoi il sert, dans quelle langue il est écrit. On repère aussi les emails, les numéros de téléphone, les adresses physiques, les liens vers les réseaux sociaux et les images. Parfois en basculant sur une autre langue, le site peut s’avérer plus complet.

Dans notre cas, le site internet ressemble à une page de blog déroulante écrite en anglais et en arabe. La mission de l’Institut Ahmed Yassine – le chef spirituel du Hamas – est d’être la première école en ligne sur l’islam. L’école dispense un cursus de formation sur l’Islam avec la remise d’un diplôme.

site de l’Institut Ahmed Yassine

On peut ensuite prendre le nom de domaine/url « ahmedyassineinstitute.com » et faire une recherche whois et un traceroute en utilisant le site ping. Le WHOIS permet d’obtenir des informations sur le propriétaire du site et sur la société qui héberge le site. Les informations sont devenues de plus en plus rare depuis la loi sur le Règlement Général sur la Protection des Données personnelles (RGPD). Un traceroute permet de voir le chemin que prend un paquet de données pour aller de sa machine au serveur qui héberge le site en question.

WHOIS du site internet
Traceroute qui nous amène au Royaume Uni

Le domaine est enregistré par une société américaine depuis le 18 Septembre 2018 avec deux adresses IP localisées en Angleterre (188.241.39.12 et 188.241.39.10). En utilisant Exonerator, on constate que ces adresses ne sont a priori pas utilisées comme relai par TOR.

Ensuite il est crucial de rechercher des mentions du site ailleurs sur internet pour voir où il apparaît et si cela peut nous aider à rebondir sur d’autres éléments d’intérêt. Une recherche de l’URL avec le dork suivant intext: »ahmedyassineinstitute.com » sur les moteurs de recherche mène à une discussion sur Reddit et une page Facebook sous le nom de Islamic Digital School.

La conversation sur Reddit débat de la véracité du site internet et de la page Facebook indiquant qu’il pourrait s’agir d’une tentative de déstabilisation de la République Tchèque et de la Slovaquie par l’extrême droite ou les russes.

La page Facebook fait bien référence au site initial et se présente également comme une école sur l’islam en ligne. La page Facebook est postérieure au site et a été créée en octobre 2018.

Elle cible la population tchèque et slovaque car elle propose les cours dans la langue. La page est gérée par deux comptes facebook localisés en Angleterre. Il n’y a pas plus d’éléments exploitables à ce stade. Il est intéressant de noter que les statistiques du site internet sont très basses (le site n’est pas classé) tandis que le nombre de followers sur la page Facebook atteint + 5600.

Le code source de la page permet de regarder comment le site est construit. Sans être expert, il peut être utile de rechercher par exemple un tracker UA (Google-Analytics) qui est utilisé dans l’analyse de trafic du site par un webmaster pouvant déboucher sur d’autres sites administrés par la même personne. Dans notre cas, il n’y a rien.

L’étude des photos est aussi intéressante pour savoir s’il s’agit de photos de banques d’images ou des photos originales. Avec un reverse image ou en regardant le code, on peut vite se rendre compte de quoi il s’agit.

ici on peut voir que de photo (.jpg) proviennent d’un site ethnews.com et d’une banque d’images 123rf.com
En faisant un reverse image d’une autre photo, on voit qu’elle est très répandue en ligne

Enfin, il s’agit de regarder tous liens qui peuvent être tirés d’une adresse physique, d’un numéro de téléphone, d’un email pour continuer à pivoter vers de nouveaux éléments. Dans notre cas, on retrouve un email sur le nom de domaine  – et un email personnel associé à un certain Zaki Qishawi. En basculant le site en langue arabe on peut aussi obtenir l’écriture exacte: زكي قيشاوي.

La même technique peut être utilisée pour pivoter par la suite sur ces emails :

  • 1) recherche de la mention de l’email en ligne,
  • 2) utilisation de cet email sur les réseaux sociaux
  • 3) décomposer l’email en user name – ici zaky007 pour voir s’il apparaît quelque part
  • 4) chercher en anglais et dans la langue d’origine les mentions du nom complet de la personne pour rebondir sur les réseaux sociaux, les réseaux professionnels et voir si des liens peuvent être tirés.

Ici et sans rentrer dans une recherche approfondie sur cette personne, le même email est utilisé en 2012 sur un forum par un individu avec un pseudo concordant cherchant à vendre des panneaux solaires.

Premières conclusions basées sur les éléments techniques d’un site internet

A partir d’un lien entre une adresse bitcoin attribué au Hamas et un nouveau site internet, on voit bien qu’en se concentrant uniquement sur ce site internet de façon méthodologique, nous pouvons tirer des informations qui permettent de rebondir:

  • site dont le thème principal est la formation en ligne sur l’islam et qui fait référence au guide spirituel du Hamas
  • site en langue arabe et anglaise de facture moyenne
  • site hébergé sur des serveurs au Royaume-Uni
  • site dont on discute dans le contexte de la Slovaquie et la République Tchèque dans lesquels les communautés musulmanes locales sont chahutées avec un fort sentiment anti-musulman en République Tchèque et des lois controversées en Slovaquie.
  • Page Facebook du site qui est administré par deux comptes localisés au Royaume Uni
  • Un email lié à une personne et un nom qui sont mentionnés sur internet et les réseaux sociaux.

On pourrait donc imaginer que l’étape suivante serait de se concentrer sur l’email et l’identité de l’individu mentionné sur le site, ainsi que sur la mention de cette initiative dans les géographies qui apparaissent dans la conversation Reddit.

OSINT : le cas du traitement de la presse vietnamienne (1ère partie)

OSINT : le cas du traitement de la presse vietnamienne (1ère partie)

De la nécessaire maîtrise de la langue, de la culture et des codes dans les opérations…

Mon premier contact avec la presse vietnamienne remonte à plus de 25 ans alors que j’étais étudiant en langue à l’Ecole Supérieure de Langues Etrangères de Hanoi. Outil d’apprentissage de la langue pour l’acquisition du vocabulaire, économique d’abord, cette presse devint progressivement un vecteur d’appréhension et de compréhension progressif de l’environnement informationnel ambiant qui m’entourait et dans lequel je baignais. Cette ouverture sur cet écosystème informationnel se structura ensuite de par les activités que j’occupai à la Chancellerie Politique de l’Ambassade de France au Vietnam (1995 – 1998) où il m’était demandé, entre autres, de « brosser » de façon quotidienne un tableau informationnel des éléments publiés dans la presse vietnamienne de langue vietnamienne. Expérience qui dura 3 ans et qui fut prolongée par la mise en place à la fin des années 90 d’une petite structure (en partenariat avec l’Association des Journalistes du Vietnam et le Press Club de Hanoi) de vente d’informations aux acteurs économiques étrangers opérant au Vietnam.

Cette approche « opérationnelle » de la presse vietnamienne fit l’objet de la première partie de ma thèse soutenue en 2005 à l’Institut National des Langues et Civilisations Orientales. Thèse de Doctorat ayant pour titre : « Genèse, situation actuelle et perspectives d’avenir des Compagnies Générales (Tổng Công ty) en République Socialiste du Viêtnam à travers les sources viêtnamiennes1

1 Voir Eglinger, Jean-Philippe, Genèse, situation actuelle et perspectives d’avenir des Compagnies Générales (Tổng Công ty) en République Socialiste du Viêtnam à travers les sources vietnamiennes, thèse de doctorat,Paris, INALCO, avril 2005.

Pourquoi alors revenir sur ce sujet quelque 25 années plus tard? Car il est plus que d’actualité pour une personne ou une organisation qui souhaite appréhender l’environnement d’un pays où le système politique se sert de cet outil comme porte voix direct auprès de sa population. Traiter à la source l’information permet de détecter les signaux faibles ; pouvoir comprendre l’angle d’approche et surtout la manière dont les autorités souhaitent voir sa population réagir face à un problème évoqué, ce sans être obligé de poser trop de questions est un réel avantage. Tout cela effectué dans la langue et la culture vietnamiennes pour optimiser l’efficacité du discours et donc l’impact de l’influence. L’important ici étant moins l’information en elle-même que la source qui la traite et la manière dont elle est traitée. Et c’est bien là tout l’avantage de pouvoir directement approcher et analyser cette presse dont certains pensent qu’elle ne présente pas d’intérêt car elle est dirigée… Cette direction indiquée, précédemment évoquée, nous donne les clefs de décryptage car cet outil est éminemment politique.

La presse au Vietnam : un écosystème au service des autorités du pays

  • Statut actuel :

Dans un article publié par la revue Công Lý (Justice) du 28 décembre 20181, présentant le rapport des activités de la presse institutionnelle vietnamienne 2 en décembre 2018, M. Lê Mạnh Hùng, vice président de la Commission Centrale de la Propagande et de l’Education a indiqué qu’en novembre 2018, il y avait environ 19 000 journalistes détenteurs d’une carte de presse; que le nombre d’adhérents à l’Association des Journalistes du Vietnam s’élevait à 23 893 personnes. Le Vietnam compte quelque 844 organes de presse avec 184 journaux, 660 revues et 24 organes de presse électroniques indépendants.

Quelque 189 licences autorisant la mise en place de sites d’information internet ont été attribuées aux organes de presse, de diffusion ou de télévision. Le Vietnam compte 67 radios ou chaînes de télévision et 35 entreprises évoluant dans le domaine de services de diffusion ou télédiffusion.

Ce secteur de la presse représentait en 2018 un marché de 15 840 milliards de VND (environ 610 millions d’euros). Le chiffre d’affaires des journaux imprimés et électroniques se montait à 4 900 milliards de VND (soit 188 millions d’euros). Et le chiffre d’affaires des Radio et télévision représentait 10 940 milliards de VND (420,6 millions d’euros) avec une part de recettes de 9 631 milliards de VND (370 millions).

A noter que depuis la fin des années 80, le modèle économique des média vietnamiens s’est libéralisé et que le secteur privé est désormais autorisé à investir dans certaines publications à vocation de « loisir« .

Enfin, à noter qu’à côté de cette presse nationale vietnamienne, il existe de nombreuses publications ou blogs tenus par des Việt Kiều (Vietnamiens résidant à l’étranger) et souvent hostiles à la politique des dirigeants du Vietnam.

1 http://congly.vn/thoi-su/hoi-nghi-bao-chi-toan-quoc-tong-ket-cong-tac-nam-2018-trien-khai-nhiem-vu-nam-2019-281918.html

2 Il est intéressant de voir qu’en vietnamien le terme « báo chí » (journal) englobe l’ensemble des activités de la presse

  • Bref Historique

Dans son ouvrage, Thư tịch Báo Chí Việt Nam1, M. Tô Huy Rứa2 indique que « le journalisme est apparu au Vietnam juste après l’invasion des ‘Colonialistes’ français ». La première publication vietnamienne, aux yeux des autorités de Hà Nội, semble rester le journal Gia Định báo. Ce journal écrit en quốc ngữ 1 fut fondé à Sài Gòn le 15 avril 1865 sur décision du gouvernement français de Cochinchine. Le développement de la presse au Vietnam connu un essor dans les années 1910 – 1920, date à laquelle des parutions créées par des intellectuels vietnamiens qui décidèrent de favoriser la diffusion du savoir par voie de presse virent le jour. Des publications comme Nam Phong écrites en quốc ngữ2, français et chinois étaient soutenues par les autorités coloniales françaises afin de défendre les intérêts et la culture française et influencer les populations.

1 Nhà xuất Bản Chính trị Quốc gia, 1998

2 Alors président de l’Institut Politique Hồ Chí Minh

1 Langue nationale fondée sur les caractères latins
2 Journal fondé par Phạm Quỳnh et Louis Marty en janvier 1917.

Tout comme le Nam Phong, l’hebdomadaire Đông Dương Tạp chí1 fondé par le Français Schneider et dont le rédacteur en chef était Nguyễn Văn Vĩnh axait sa ligne éditoriale sur la vulgarisation de la culture tant vietnamienne qu’occidentale… D’autres journaux plus littéraires firent leur apparition comme le Phong Hoá Tuần báo2 fondé par Nguyễn Tường Tam (Nhật Linh) à son retour de France en 1932. Une des caractéristiques de ce journal était qu’il était animé par une équipe de jeunes écrivains et poètes qui fondèrent un groupe littéraire, le Tự lực Văn đoàn3 résolument « moderne ».

Parallèlement à cette presse « autorisée », s’est développé dans les années 30 – 40 une presse vietnamienne d’Outre-mer4, créée par Nguyễn Ái Quốc5 et qui comprenait les principaux titres suivants : Thanh Niên, Công nông, Lính khách mệnh. D’autres sensibilités étaient également représentées comme celle du nationaliste Nguyễn An Ninh avec son titre « La Cloche fêlée », Ce sont là les prémisses de la presse révolutionnaire vietnamienne de différentes obédiences (Communiste, nationaliste, trotskyste) qui a permis l’essor du journalisme connu sous le terme de Làng Báo Chí (Village de la Presse)… Qui aussi bien les journaux autorisés que les premières revues communistes ont eu pour effet immédiat de contribuer à enseigner et de propager à grande échelle le quốc ngữ dont l’usage était jusqu’alors resté limité… Dès son apparition, il est frappant de constater que la presse vietnamienne a toujours été un enjeu de pouvoir dont le but était de convaincre ses lecteurs du bien fondé des causes qu’elles incarnaient et défendaient quelles fussent littéraires, politiques, linguistiques ou culturelles. Le président Hồ Chí Minh aimait effectivement à rappeler que « le journaliste est le soldat, le papier et la plume sont des armes ». Cette arme qui fut nécessaire à la lutte pour l’indépendance continue maintenant à être utilisée pour canaliser les énergies à « l’édification du Socialisme, à la poursuite de l’industrialisation et de la modernisation du Vietnam » tout en renforçant « la solidarité idéologique, politique et spirituelle parmi la population6 »

1 15 mai 1913 – 15 juin 1919

2 16 juin 1932 – 5 juin 1936.

3 Regroupant, entre autres, les auteurs suivants : Nhật Linh, Tô Ngọc Vân, Khai Hưng, etc.

4 Base d’Edition à Canton. D’autres journaux communistes vietnamiens furent implantés en Chine (Shanghai) « Đỏ » du Đảng Cộng sản An Nam, en France, …

5 Hồ Chí Minh

6 Directive 22/CT-TW du 17 octobre 1997

  • Les liens avec le monde politique

Historiquement et par nature, la presse au Vietnam est fortement liée au pouvoir politique en place et les contrôles s’organisent de façon institutionnelle selon le schéma (simplifié) suivant :

Source : Travaux personnels

La nécessaire prise en compte de la « grille de lecture » politique, économique, culturelle pour optimiser son utilisation opérationnelle.

Cette imbrication qui existe entre la presse vietnamienne et les autorités politiques est double : d’une part, la presse institutionnelle est placée directement sous le contrôle des autorités qui s’en servent de porte voix. D’autre part, la presse contestataire Việt Kiều, donne en creux des éléments d’information supplémentaires à ceux indiqués par la presse institutionnelle. Si à cela, on ajoute que la presse institutionnelle est multiple en raison des différents organes de rattachement des publications, on commence à voir que cet écosystème d’informations n’est pas si monolithique qu’annoncé. Contredisant la phrase « solennelle » si souvent entendue : « de toute façon la presse vietnamienne est dirigée, il n’y a donc rien à en tirer »… Certes, la presse vietnamienne est dirigée, et c’est justement pour cela qu’elle est intéressante et qu’elle « dit ». La question est de savoir si nous savons/pouvons « entendre ». Sachant « qu’entendre » ne signifie aucunement « partager le point de vue »… Et pour entendre il faut vouloir (essayer) de comprendre et être en mesure de décrypter cette presse dans son environnement politique, linguistique et culturel. Et c’est seulement dans cet état d’esprit que l’on pourra être en mesure d’appréhender les éléments qu’elle révèle, ce selon un cheminement souvent très cadré.

  1. En premier lieu, la presse une fois qu’elle y est autorisée, identifie un sujet via une publication dans certains journaux phares (au plus proche des autorités politiques (Cf. Partie 3), ou bien, en creux ignore, un problème par non révélation ou retrait de publication. C’est là le premier signal faible à détecter. Voir si le fait qui existait est révélé, ignoré, ou abandonné.
  2. Le deuxième point est de bien comprendre comment ce point révélé est abordé. Quel est son éclairage. Et sa contextualisation dans l’environnement vietnamien est capital. Les pondérations « d’importance » de l’information ne sont pas forcément les mêmes dans cet environnement que dans le nôtre.
  3. Le troisième point à prendre en compte est la solution que l’article propose pour gérer le problème exposé. Quel est le chemin à prendre, à suivre pour entrer dans la gestion « autorisée » de la situation ?
  4. Enfin, le dernier point, en guise de conclusion, est l’enseignement à retirer de la situation décrite. Ce qu’il faut en retenir afin de ne pas se retrouver confronté aux mêmes difficultés dans l’avenir.

Cette approche très pédagogique permet à celui qui maîtrise les éléments du « puzzle » donnés par la presse de dégager les éléments principaux pour tenter de reconstituer le tableau à partir des pièces éparses collectée…

Et ceci demande une connaissance fine de l’écosystème des organes de publication de la presse au Vietnam. En effet, « Qui dit quoi ? » Quelle est la hiérarchie à établir entre les publications ? Par exemple lorsque le journal Nhân Dân (Le Peuple) dont l’organe de Tutelle est le Parti Communiste, publie une information, on peut de facto en déduire que cette information est de première importance pour les autorités. La source avant l’information… On sait également que ce journal étant près des autorités de censure, il sait ce qu’il ne peut pas écrire donc ce sera lui qui en « dira » le plus. C’est une lecture en creux en quelque sorte…

Un autre exemple, lorsque le journal Đầu Tư (organe de tutelle : le Ministère du Plan et de l’Investissement) traite, par exemple, d’un cas de corruption (par exemple) et que le journal Công Thương (organe de tutelle le Ministère de l’Industrie et du Commerce) y répond si un agent de son ministère est mis en cause, on peut compter glaner un certains nombre d’informations autour de ces échanges par presse interposée. Ceci est valable pour d’autres acteurs politiques qui souvent font l’objet d’attaques dans les campagnes de lutte contre la corruption qui sont un moyen pour un clan d’attaquer un autre clan. Le récent exemple de l’attaque du Maire de Hanoi, M. Nguyễn Đức Chung par les partisans du Premier Ministre M. Nguyễn Xuân Phúc est un bon exemple.

A noter que ces articles sont de plus en plus relayés par les éditions électroniques des journaux plus réactives que la presse papier. Cette dernière gardant un avantage lorsqu’il s’agit de traiter des articles de fond sur une durée plus longue.

Cette presse soumise à la tutelle de ses organes est également dépendante de son lectorat. La baisse du nombre des publications papiers depuis les années 80 en atteste. La presse doit donc non seulement se « conformer » aux directives des ses organismes de tutelle mais également satisfaire les besoins d’information de la population, notamment urbaine, bien plus informée que nous pouvons le croire en Occident. Cette presse ne peut donc pas trop se déjuger. Il existe également un « garde fou », limité certes mais bien présent, qui cadre également la manière dont l’information est présentée.

Ces éléments mis en place permettent, via la mise en perspective de l’information, d’élaborer des scenarii « plausibles » en confrontant cet « environnement informationnel » aux contraintes de l’environnement vietnamien. Ce scenario peut-il entrer dans le cadre d’un écosystème contraint ou non ? Quelles sont les implications dans l’environnement vietnamien ? Etc. Sachant qu’il existe toujours des « fils invisibles » qui nous échappent.

Une fois cette étape franchie, se met en place alors la nécessaire étape de « translittération informationnelle » qui permet une fois les scenarii établi et validé dans l’écosystème vietnamien de le « transformer » en éléments recevables pour le lecteur étranger à l’écosystème. Et ce, n’est pas forcément la partie la plus simple à réaliser. Rendre intelligible une situation « cross culturelle » demande une véritable pédagogie afin d’éviter la situation de rejet souvent exprimée par : « ce n’est pas possible »…

Mais c’est un autre sujet qui ne relève pas du présent article…

Firefox (I) – Les outils de développement de Firefox

Firefox (I) – Les outils de développement de Firefox

Ce billet est le premier billet d’une série sur le navigateur Firefox.

Si je dois bien vous avouer quelque chose, c’est que je n’ai jamais compris la hype, l’engouement autour du navigateur Chrome de Google. En 2012 ou 2013, considérer ce navigateur internet comme le must en la matière pouvait encore se comprendre, à l’heure où ses performances surpassaient celle de Firefox.
Mais depuis l’arrivée de la version 6x, ce dernier est désormais une bête de course et sa gestion de la mémoire le rend diaboliquement efficace.

Bien plus que ses performances pures, c’est surtout sur le plan du respect de la vie privée que Firefox est remarquable. Or, lorsque l’on effectue des recherches en sources ouvertes, il est indispensable de garder la main sur nos données privées et leur éventuelle fuite lors de la navigation. C’est donc bien évidemment ce navigateur qu’OpenFacto recommande à ses lecteurs et membres! Et si vous voulez utiliser Chrome, nous vous encourageons à utiliser Chromium, sa version libre, expurgée des mouchards Google.

Au delà de ces aspects, comprendre la manière dont votre navigateur interagit avec le site internet que vous visitez est essentiel. Un des outils disponibles dans Firefox, particulièrement utile à l’OSINT, est l’outil de Développement Web (il est aussi disponible sous Chromium, rassurez-vous).
Il est activable par la combinaison de touches CTRL+MAJ+I, ce qui devrait faire apparaître la barre ci-dessous.

Avec cet outil, il est possible d’examiner plusieurs éléments et notamment :

  • Le code source de la page avec l’Inspecteur
  • Ce que le site stocke en local sur votre navigateur avec le Stockage
  • Les échanges entre le navigateur et le site distant avec le Réseau

Nous ne nous étendrons pas sur les autres paramètres pour l’instant et c’est sur l’aspect Réseau que nous nous attardons aujourd’hui.

L’outil Réseau – Usage simple

Prenons un exemple pour illustrer à quoi peut bien servir l’outil Réseau.
Imaginons que nous recherchions des informations sur la société OVH (dont le numéro RCS est 424761419), sur le site societe.com.

Si on entre ce numéro dans la barre de recherche, le site donne immédiatement le résultat, mais on ne comprend pas bien comment s’opère cette recherche, comment on obtient ce résultat. La barre d’URL ne donne aucune indication sur la nature de la requête.

Essayons donc d’effectuer cette même requête avec l’outil d’analyse Réseau de Firefox.

On observe que dès que nous appuyons sur l’outil de recherche, le site internet lance une requête de type GET, avec une URL formatée ainsi :

https://www.societe.com/cgi-bin/search?champs=424761419

On comprend dès lors que le site internet utilise une requête spécifique pour afficher cette page, composée d’une chaîne de texte (une URL) se terminant par le signe « égal », auquel il a concaténé le numéro RCS que l’on avait donné.

Pour vérifier notre hypothèse, essayons donc d’effectuer une recherche sur le numéro RCS de GANDI sans passer par la page principale du site, mais en tapant directement l’URL :

https://www.societe.com/cgi-bin/search?champs=423093459

Bingo! Cette URL est fonctionnelle.
On peut également tenter de rechercher par nom et prénom :

https://www.societe.com/cgi-bin/search?champs=martin+bouygues

Mais vous me direz, quel usage pour l’OSINT?

Simple… Supposons que vous ayez une feuille de calcul de type tableur, avec une liste de 20 ou 800+ numéros RCS. Il est alors très simple de composer une colonne supplémentaire à votre tableau en concaténant l’URL que vous avez découverte, et ces numéros… et d’envisager ainsi des possibilités d’automatiser la consultation de ces pages!…

L’outil Réseau – Usage avancé

L’outil réseau permet de récupérer rapidement dans certains cas de l’information très utile, notamment lorsque le site internet est dynamique, ou s’interface avec une base de données.


Prenons l’exemple de cette page issue du site du Tribunal Spécial pour le Liban :
https://www.stl-tsl.org/en/the-cases/contempt-cases/stl-14-05/filings?&case=6&dtype=1

Cette page présente une liste de 20 documents dont on aimerait récupérer les métadonnées (date, titre, etc…), le plus efficacement possible.
Ouvrons cette page à l’aide des outils de développement de Firefox.

Nous allons filtrer la vue en cliquant sur XHR (XMLHTTP Request), un système permettant à un site internet de rafraîchir ses données de manière dynamique en Javascript. Pour récupérer et afficher ses données, le site va se baser sur un fichier de type JSON (un simple fichier texte balisé) contenant les metadonnées que nous cherchons, et les mettre en page à la volée. C’est ce fichier qui nous intéresse.
Si nous sélectionnons la ligne URL contenant le fichier Json, et observons la « réponse » à droite de la fenêtre, on constate que ces metadonnées sont bien présentes.

Comment récupérer ces données?
Il suffit par exemple de cliquer bouton-droit sur la ligne ainsi sélectionnées et de cliquer sur « Copier comme cURL ». Si vous ouvrez un terminal et collez le contenu du presse-papier, vous devriez observer ceci :

curl 'https://www.stl-tsl.org/crs/index.php/home/filings/??&case=6&dtype=1&case=6&dtype=1&p=0&pp=20&lang=1' -H 'User-Agent: Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:68.0) Gecko/20100101 Firefox/68.0' -H 'Accept: /' -H 'Accept-Language: fr,fr-FR;q=0.8,en-US;q=0.5,en;q=0.3' --compressed -H 'X-Requested-With: XMLHttpRequest' -H 'Connection: keep-alive' -H 'Referer: https://www.stl-tsl.org/en/the-cases/contempt-cases/stl-14-05/filings?&case=6&dtype=1' -H 'Cookie: visid_incap_114829=kUHENy7IT4u+MpclqtAvkJOkKF0AAAAAQkIPAAAAAACARMONAVOOktY/aYDphOnUIQ9OWSIRGc7M; language=en; incap_ses_475_114829=3podc9DOQDBo2Y1TI4qXBgfoR10AAAAAtolh2LpK1l+icEJ+YnmlUg==' -H 'TE: Trailers'

Ajoutons une redirection vers un nom de fichier en complétant cette commande par > metadata.json :

curl 'https://www.stl-tsl.org/crs/index.php/home/filings/??&case=6&dtype=1&case=6&dtype=1&p=0&pp=20&lang=1' -H 'User-Agent: Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:68.0) Gecko/20100101 Firefox/68.0' -H 'Accept: /' -H 'Accept-Language: fr,fr-FR;q=0.8,en-US;q=0.5,en;q=0.3' --compressed -H 'X-Requested-With: XMLHttpRequest' -H 'Connection: keep-alive' -H 'Referer: https://www.stl-tsl.org/en/the-cases/contempt-cases/stl-14-05/filings?&case=6&dtype=1' -H 'Cookie: visid_incap_114829=kUHENy7IT4u+MpclqtAvkJOkKF0AAAAAQkIPAAAAAACARMONAVOOktY/aYDphOnUIQ9OWSIRGc7M; language=en; incap_ses_475_114829=3podc9DOQDBo2Y1TI4qXBgfoR10AAAAAtolh2LpK1l+icEJ+YnmlUg==' -H 'TE: Trailers' > metadata.json

On obtient alors un fichier ressemblant à ceci (extrait) :

{"count":3352,"data":[{"id":4166,"title":"Order to Redact the Public Transcript and or the Public Broadcast of a Hearing Held on 25 and 26 June 2018","date":"19-02-2019","case":"Ayyash et al. (STL-11-01)","case_before":"Trial chamber","case_stage":"Trial","filing_party":"Trial Chamber","filing_number":"F3760","record_type":"Order","direction":"ltr","files":{"9694":"English"}},{"id":4164,"title":"Order to Redact the Public Transcript of Hearings Held on 21, 22, 25, 27, 28, and 29 January 2016","date":"19-02-2019","case":"Ayyash et al. (STL-11-01)","case_before":"Trial chamber","case_stage":"Trial","filing_party":"Trial Chamber","filing_number":"F3758","record_type":"Order","direction":"ltr","files":{"9692":"English"}},{"id":4165,"title":"Trial Chamber's Internal Memorandum to the Head of Defence Office - Monitoring the Effective Legal Representation of Mr Hassan Habib Merhi's Defence","date":"14-02-2019","case":"Ayyash et al. (STL-11-01)","case_before":"Trial chamber","case_stage":"Trial","filing_party":"Trial Chamber","filing_number":"F3759","record_type":"Internal Memorandum","direction":"ltr","files":{"9693":"English"}},{"id":4163,"title":"Public Redacted Version of 'Decision on Prosecution Application for a Summons to Appear for Witness PRH588 and Order Issuing a Summons' of 16 February 2017","date":"12-02-2019","case":"Ayyash et al. (STL-11-01)","case_before":"Trial chamber","case_stage":"Trial","filing_party":"Trial Chamber","filing_number":"F2995","record_type":"Decision","direction":"ltr","files":{"9687":"English","9688":"Annex A","9766":"\u0639\u0631\u0628\u064a","9767":"Annex A Arabic"}},

Ce fichier structuré peut être aisément converti avec OpenRefine par exemple au format csv ou xls.

En résumé…

Récupérer des données en deux clicks, vous avouerez que c’est rapide et pratique!

Comprendre le fonctionnement d’un site internet, la manière dont il affiche ses données, comment il interagit avec une base de données, est primordial lorsque l’on cherche à optimiser sa collecte d’information.

Nous reviendrons dans un prochain billet, à l’aide d’un exemple, sur d’autres aspects de l’outil Développement Web de Firefox…